:

Szerző: Dömös Zsuzsanna

2024. február 22. 12:30

Bemutatta a Google a Gemini kistestvéreit

Újabb nagy nyelvi modelleket tett elérhetővé a Google, amelyek elég kompaktak ahhoz, hogy személyi számítógépen is futhassanak.

Nem sokkal az új Gemini modellek bemutatása után a Google bejelentette a Gemma (latinul drágakő) nevű, gyengébb teljesítményű eszközökön futtatható nyelvi modelljek családját. A kétmilliárd paraméteres Gemma 2B és a hétmilliárd paraméteres Gemma 7B méretei sok felhasználási esethez jól illeszkednek, így kereskedelmi és kutatási célokra is használhatók. Mindkettő előre betanított és utasításokra hangolt változatokkal rendelkezik, amelyek futtathatók fejlesztői laptopon vagy asztali számítógépen CPU-val vagy GPU-val, vagy akár Google Cloudon GPU és TPU gyorsítással. Mivel a Gemma csak szöveg-szöveg támogatással rendelkezik, így nem nevezhető multimodálisnak.

Az érvelési, matematikai és kódolási készségeket értékelő benchmark tesztekben a nagyobb Gemma modell felülmúlta a Meta Llama 2-jét – annak ellenére, hogy riválisnál kevesebb paraméterrel dolgozik. A Gemma-modelleknek is megvannak a maguk korlátai, elsősorban az internetről gyűjtött angol nyelvű szövegekre képezték ki őket, miközben a fejlesztők próbálták minimálisra szűrni a bekerülő érzékeny, vagy nem megfelelő nyelvezetű szövegeket.

gemma

A senior horizonton túl: a staff meg a többiek

Senior tapasztalati szint fölött van még pár egzotikus lépcsőfok, illetve a mögöttük rejtőző elvárások.

A senior horizonton túl: a staff meg a többiek Senior tapasztalati szint fölött van még pár egzotikus lépcsőfok, illetve a mögöttük rejtőző elvárások.

A modellek elég kicsik ahhoz, hogy helyi eszközökön fussanak, nem szükséges hozzá komolyabb erőforrás a felhőben. Bár a Google kiemeli a modellek nyitott jellegét, ez nem jelenti azt, hogy nyílt forráskódúak: a cég nem adta ki a forráskódot és az adatokat, amelyek lehetővé tennék a fejlesztők számára, hogy maguk képezzék ki a modellt, csak az előre betanított modellek és azok súlyozása érhető el. A kifejezés arra utal, hogy a fejlesztők és a kutatók széles körű hozzáférést biztosítanak a modellek testreszabásához és finomhangolásához, de el kell fogadniuk a terjesztésre, tulajdonjogra, fejlesztésre vonatkozó használati feltételeket, amik idővel változhatnak.

A keresőcég két hete jelentette be, hogy Bard néven ismert chatbot-szolgáltatása a jövőben a „Gemini” márka alatt folytatja tovább, ugyanazon a néven, amit a bot alatt működő nagy nyelvi modell is visel. A cég szerint a Gemini legfrissebb változata, az Ultra az első modell, amely felülmúlja a humán szakértőket az MMLU (massive multitask language megértése) terén, amely 57 tantárgy – például matematika, fizika, történelem, jog, orvostudomány és etika – kombinációját használja a problémamegoldó képességek tesztelésére. A szervezetek és vállalatok többek közt fejlettebb ügyfélszolgálati chatbotokhoz és termékajánlásokhoz használhatják az új modellt, ami segít a tartalomkészítésben is, illetve javíthatja a produktivitási szolgáltatások által kínált élményt.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. május 3. 13:13

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.