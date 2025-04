A Meta bejelentette a nyílt forráskódú Llama AI-modellcsalád negyedik generációját, amihez később egy még erősebb, egyelőre fejlesztés alatt álló Llama 4 Behemoth nevű modell is csatlakozik. A multimodális, tehát szövegből, képből és videóból egyszerre tanuló modellek képzési adatcsomagja több mint 30 billió tokenből állt, ami több mint kétszerese a Llama 3 esetében használt mennyiségnek. A Llama 4 Scout egy kisebb modell, ami a cég állítása szerint egyetlen Nvidia H100 GPU-n futtatható, míg a Maverick egy erősebb variáns. A Scout kontextusablaka 10 millió token, 17 milliárd aktív paraméterrel rendelkezik, az összehasonlítás szerint ez több mint a Gemma 3 és Gemini 2.0 Flash Lite modelleké. A közösségi óriás az erősebb Llama 4 Mavericket a GPT-4o és a Gemini 2.0 Flash képességeivel állította szembe, miközben a DeepSeek-V3 modellhez hasonlította kódolási és érvelési feladatokban való teljesítményét.

A Mixture of Experts (MoE) architektúra a gépi tanulásban azt jelenti, hogy az AI-modell több specializált almodellt (szakértőket) kombinál egy átfogó rendszerbe, amivel növelhető a teljesítmény és a hatékonyság. Ezzel a feladatok több kisebb részfeladatra oszthatók, és mindegyiket a különböző feladatokra specializált szakértő hálózatok dolgoznak fel. Az úgynevezett „gating”, azaz váltó mechanizmus dönti el, hogy melyik szakértőt aktiválja adott bementre. Ez jellemzi a DeepSeek-V3 modellt is, illetve a Mixtral 8x7B-t, és a most bemutatott Llama 4 modelleket.

A Llama 4 Behemoth 288 milliárd aktív paraméterrel, és összesen 2 billió paraméterrel rendelkezik majd, és bár a Meta elmondása szerint ugyan egyelőre a fejlesztési szakaszban jár, de később a legtöbb STEM benchmarkon felülmúlhatja a versenytársait – ami alatt jelen esetben a GPT-4.5-öt és a Claude Sonnet 3.7-et érti.

Az előző modellekhez hasonlóan a Meta a Llama 4 modelleket is „nyílt hozzáférésűnek” nevezi a korábban kritizált licenckorlátozások ellenére. A legújabb család esetében is követelmény, hogy a több mint 700 millió havi aktív felhasználóval rendelkező kereskedelmi szervezetek engedélyt kérjenek a Metától felhasználás előtt, mely gyakorlat az Open Source Initiative szerint viszont nem illik az open source kategóriába.

A Llama 4 modellek a későbbiekben többek közt a fejlett érvelési képességekkel ellátott AI-ügynökök alatt fognak dolgozni, melyek a felhasználók, ügyfelek és vállalkozások ügyintézési műveleteit könnyítik meg és automatizálják. A hétköznapi felhasználók a Meta AI eszközön keresztül próbálhatják ki az Llama 4 Scout és Maverick képességeit a WhatsApp, Messenger, Instagram Direct szolgáltatásokba integrálva, valamint a Meta AI weboldalon keresztül. A vállalat később az április 29-i LlamaCon konferencián bővebben is megosztja az AI-modellekkel és termékeivel kapcsolatos terveit.