Szerző: Dömös Zsuzsanna

2023. augusztus 23. 13:00

100 nyelven tud fordítani a Meta új MI-modellje

Az első többnyelvű fordítási és átírási MI-modell kiadásával dicsekszik a Meta, ami a cég szerint a metaverzumban is fontos szerepet játszik majd a jövőben.

Több tucat nyelv fordítására és átírására képes a Meta kedden bejelentett új mesterségesintelligencia-modellje, ami a valós idejű kommunikáció minőségét javíthatja a különféle nyelvi szolgáltatásokban. A cég bejegyzése szerint a SeamlessM4T modell közel 100 nyelven támogat szöveg és beszéd közti fordítást, beszédről beszédre fordítás esetén pedig 35 nyelvvel használható.

A Meta a SeamlessM4T modellt nyilvánosan, ingyen tette elérhetővé nem kereskedelmi használat céljából.  A világ legnagyobb közösségimédia-cége idén rengeteg, többnyire ingyenes mesterségesintelligencia-modellt adott ki, köztük a Llama nevű nagy nyelvi modellt, ami komoly kihívás elé állítja a Microsoft által támogatott OpenAI és az Alphabet szabadalmaztatott modelljeit.

meta-ai-chat-bots_(1)

Hány adag sültkrumplit bír el 25 Kubernetes klaszter? (x)

Globálisan napi akár 2,5 millió rendeléssel is megbirkóznak az RDI Hungary által fejlesztett háttérrendszerek és mobilalkalmazások.

Hány adag sültkrumplit bír el 25 Kubernetes klaszter? (x) Globálisan napi akár 2,5 millió rendeléssel is megbirkóznak az RDI Hungary által fejlesztett háttérrendszerek és mobilalkalmazások.

Mark Zuckerberg vezérigazgató szerint a nyitott mesterségesintelligencia-ökoszisztéma a Meta javára válik, a fejlesztés apropóján pedig nem volt rest megemlíteni a metaverzumot, mivel szerinte az ilyen eszközök fogják megkönnyíteni a világ különböző tájain élő felhasználók közti interakciókat.  

Mindazonáltal a Meta hasonló jogi kérdésekkel néz szembe, mint az iparág többi tagja, ha a modellek képzéséhez felhasznált adatokról van szó. Júliusban Sarah Silverman humorista és két másik szerző szerzői jogok megsértése miatt pert indított a Meta és az OpenAI ellen, azzal vádolva a cégeket, hogy engedély nélkül használják fel a könyveiket képzési adatként.

A SeamlessM4T modell esetében a Meta kutatói tanulmányban szögezték le, hogy a több mint 4 millió órányi hangképzési adatokat nyilvánosan elérhető hangtárakból gyűjtötték be,  a szöveges adatok pedig olyan tavaly létrehozott adatkészletekből származnak, amelyek a Wikipédiáról és a kapcsolódó webhelyekről gyűjtöttek tartalmakat.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról