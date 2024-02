A Google eddig Bard néven ismert chatbot-szolgáltatása a jövőben a „Gemini” márka alatt folytatja tovább – tette hivatalossá a cég vezetője a múlt héten felreppent pletykát. A bejelentés többnyire a márkaépítésről szól, és a lépés része az is, hogy a Google Workspace valamennyi Duet AI funkciója is a Gemini brand alatt folytatja (tehát a Gmail, Docs és más produktivitási programokban elérhető MI-alapú funkciók).

A Google Assistant szintén megújul a „Gemini-korszakban”, a Gemini alapértelmezett assisztensként állítható be a mobilokon az app letöltése után, és a bekapcsológombbal, vagy a Hey Google paranccsal hívható elő. Bár egyelőre úgy tűnik, hogy a Google nem szabadul meg teljesen az Asszisztenstől, de a cég már egy ideje nem kezeli prioritásként, és láthatóan a Geminit próbálja majd egy következő generációs virtuális asszisztenssé fejleszteni.

A keresőóriás ennek megfelelően elérhetővé tett Androidon egy új Gemini alkalmazást, aminek iOS-en még nincs megfelelője, az Apple rendszerében egyébként sem lehet beállítani alapértelmezetten másik assisztenst a Sirin kívül.

Elérhetővé válik a nagyközönség számára a tavaly bejelentett Gemini nagy nyelvi modell (LLM) Ultra nevű változata, amit a cég előfizetéses formában kínál majd a felhasználóknak: a Gemini Advanced néven említett szolgáltatás havi 19,99 dollárba kerül a Google One AI Premium csomagjának részeként, de továbbra is lesz lehetőség a Gemini Pro modellre épülő ingyenes változat használatára. Árazás terén a Google a ChatGPT Plus csomag árát követi, ami szintén havi 20 dollárért vehető igénybe. A Google esetében azonban az előfizetés része 2 TB felhős tárhely is pluszban.

A cég szerint a Gemini Ultra az első modell, amely felülmúlja a humán szakértőket az MMLU (massive multitask language megértése) terén, amely 57 tantárgy – például matematika, fizika, történelem, jog, orvostudomány és etika – kombinációját használja a problémamegoldó képességek tesztelésére. A multimodális modell képes egyszerre kezelni, megérteni és kombinálni a különböző típusú információkat, beleértve a szöveget, kódot, hangot, képet és videót, ráadásul 32 ezres kontextusablakot használ, tehát ennyi karakterig képes "visszaemlékezni" a beszélgetés előzményeire, így az előfizetők számára a „legkorszerűbb szintet” kínálja.