Nem sokkal az új Gemini modellek bemutatása után a Google bejelentette a Gemma (latinul drágakő) nevű, gyengébb teljesítményű eszközökön futtatható nyelvi modelljek családját. A kétmilliárd paraméteres Gemma 2B és a hétmilliárd paraméteres Gemma 7B méretei sok felhasználási esethez jól illeszkednek, így kereskedelmi és kutatási célokra is használhatók. Mindkettő előre betanított és utasításokra hangolt változatokkal rendelkezik, amelyek futtathatók fejlesztői laptopon vagy asztali számítógépen CPU-val vagy GPU-val, vagy akár Google Cloudon GPU és TPU gyorsítással. Mivel a Gemma csak szöveg-szöveg támogatással rendelkezik, így nem nevezhető multimodálisnak.

Az érvelési, matematikai és kódolási készségeket értékelő benchmark tesztekben a nagyobb Gemma modell felülmúlta a Meta Llama 2-jét – annak ellenére, hogy riválisnál kevesebb paraméterrel dolgozik. A Gemma-modelleknek is megvannak a maguk korlátai, elsősorban az internetről gyűjtött angol nyelvű szövegekre képezték ki őket, miközben a fejlesztők próbálták minimálisra szűrni a bekerülő érzékeny, vagy nem megfelelő nyelvezetű szövegeket.

A modellek elég kicsik ahhoz, hogy helyi eszközökön fussanak, nem szükséges hozzá komolyabb erőforrás a felhőben. Bár a Google kiemeli a modellek nyitott jellegét, ez nem jelenti azt, hogy nyílt forráskódúak: a cég nem adta ki a forráskódot és az adatokat, amelyek lehetővé tennék a fejlesztők számára, hogy maguk képezzék ki a modellt, csak az előre betanított modellek és azok súlyozása érhető el. A kifejezés arra utal, hogy a fejlesztők és a kutatók széles körű hozzáférést biztosítanak a modellek testreszabásához és finomhangolásához, de el kell fogadniuk a terjesztésre, tulajdonjogra, fejlesztésre vonatkozó használati feltételeket, amik idővel változhatnak.

A keresőcég két hete jelentette be, hogy Bard néven ismert chatbot-szolgáltatása a jövőben a „Gemini” márka alatt folytatja tovább, ugyanazon a néven, amit a bot alatt működő nagy nyelvi modell is visel. A cég szerint a Gemini legfrissebb változata, az Ultra az első modell, amely felülmúlja a humán szakértőket az MMLU (massive multitask language megértése) terén, amely 57 tantárgy – például matematika, fizika, történelem, jog, orvostudomány és etika – kombinációját használja a problémamegoldó képességek tesztelésére. A szervezetek és vállalatok többek közt fejlettebb ügyfélszolgálati chatbotokhoz és termékajánlásokhoz használhatják az új modellt, ami segít a tartalomkészítésben is, illetve javíthatja a produktivitási szolgáltatások által kínált élményt.