Tehnologie

Meta Platforms a lansat marţi un model AI capabil să traducă şi să transcrie vorbirea în zeci de limbi

Meta Platforms, compania-mamă a Facebook, a lansat marţi un model AI capabil să traducă şi să transcrie vorbirea în zeci de limbi, un potenţial element de bază pentru instrumente care permit comunicarea în timp real între limbi, transmite Reuters, potrivit Agerpres.

Compania a declarat într-o postare pe blog că modelul său SeamlessM4T ar putea suporta traduceri între text şi vorbire în aproape 100 de limbi, precum şi traducere completă din vorbire în vorbire pentru 35 de limbi, combinând tehnologia care era disponibilă anterior doar în modele separate.

CEO-ul Mark Zuckerberg a spus că are în vedere astfel de instrumente care să faciliteze interacţiunile între utilizatorii de pe tot globul în metaverse, setul de lumi virtuale interconectate pe care pariază viitorul companiei.

Meta pune modelul la dispoziţia publicului pentru uz necomercial, se arată în postarea de pe blog.

Cea mai mare companie de socializare din lume a lansat în acest an o serie de modele AI, în cea mai mare parte gratuite, inclusiv un model de limbaj larg numit Llama, care reprezintă o provocare serioasă pentru modelele proprietare vândute de OpenAI, susţinut de Microsoft, şi Google, parte a grupului Alphabet.

Zuckerberg spune că un ecosistem AI deschis funcţionează în avantajul Meta, deoarece compania are mai mult de câştigat prin aprovizionarea efectivă a creării de instrumente destinate consumatorilor pentru platformele sale sociale, decât prin taxarea pentru accesul la modele.

Cu toate acestea, Meta se confruntă cu întrebări legale similare cu restul industriei în jurul datelor de formare ingerate pentru a-şi crea modelele.

În iulie, comedianta Sarah Silverman şi alţi doi autori au intentat procese pentru încălcarea drepturilor de autor, atât împotriva Meta, cât şi împotriva OpenAI, acuzând companiile că le folosesc cărţile ca date de antrenament fără permisiune.

Pentru modelul SeamlessM4T, cercetătorii Meta au spus într-o lucrare de cercetare că au adunat date de antrenament audio din 4 milioane de ore de ”audio brut provenit dintr-un depozit disponibil public de date web accesate cu crawlere”, fără a specifica care depozit.

Un purtător de cuvânt al Meta nu a răspuns la întrebările privind provenienţa datelor audio.

Datele text provin din seturi de date create anul trecut, care au extras conţinut de pe Wikipedia şi site-uri web asociate, se arată în lucrarea de cercetare.

Articole recente

SUA: Rezerva Federală menţine nemodificată dobânda,sfidând solicitările preşedintelui Donald Trump de relaxare a politicii monetare

Rezerva Federală a SUA (Fed) a menţinut dobânda de referinţă la un interval cuprins între…

5 ore ago

Ionuţ Aurică – numit vicepreşedinte al Agenţiei Naţionale de Administrare Fiscală

Ionuţ Aurică a fost numit în funcţia de vicepreşedinte al Agenţiei Naţionale de Administrare Fiscală,…

5 ore ago

Poate exista prosperitate fără educație financiară? Cum eliminăm inegalitățile economice printr-o abordare sistemică  (analiză ISF)

Valentin Ionescu (foto stânga), Președintele Institutului de Studii Financiare (ISF) și Ieronim Ștefan (dreapta), coordonatorul…

7 ore ago

Foto și video de la erupția vulcanului Klyuchevskoy

 Serviciul Geofizic al Academiei Ruse de Științe a publicat pe canalul său de Telegram foto…

7 ore ago

Robert Cosmin Pană, numit Director General Adjunct al SAI Muntenia Invest, pentru un mandat de patru ani

Robert Cosmin Până a fost  numit Director General Adjunct al SAI Muntenia Invest, pentru un…

7 ore ago

Emiratele Arabe Unite construiesc o conductă care va transporta apă desalinizată către sudul Fâşiei Gaza

Emiratele Arabe Unite (EAU) vor începe, cu acordul Israelului, construcţia unei conducte importante ce va…

9 ore ago

This website uses cookies.

Read More