Bevetésre készen a Google új AI-modelljei
Fejlettebb kép- és videógenerátor eszközei és modelljei mellett egy drágább előfizetési csomagot is bejelentett a keresőóriás az idei I/O alkalmából.
A Google I/O fejlesztői konferenciáján jobbára minden az AI körül forgott, a keresőóriás seregszemlét tartott legújabb generatív eszközeiből. Ezek közé tartozik a Veo 3 videógenerátor is, melynek fő előnye, hogy az előállított vizuális tartalomhoz hangot is rendel. Lényegében az OpenAI által fejlesztett Sora versenytársa, de a hang videóba való beágyazásának képessége jelentős előrelépés, mivel nem egyszerű háttérzenéről van szó, hanem akár karakterek közti párbeszédekről, vagy állatokat utánzó hangokról, a valós életbeli szájmozgásokat mímelve.
A Veo 3 kedd óta érhető el a Google új, havi 249 dollárba kerülő Ultra előfizetési csomagjának részeként - egyelőre csak az amerikai felhasználók számára, de a későbbiekben a Vertex AI vállalati platform felhasználói is megkapják. A Veo 2 generátor szintén kapott kisebb frissítéseket, például lehetséges már szöveges promptokkal objektumokat hozzáadni vagy eltávolítani videókból.
A keresőóriás emellett bejelentette a többek közt képminőség terén fejlődést hozó Imagen 4 képgenerátort, valamint a Flow filmkészítő eszközt, mellyel a felhasználók könnyedén készíthetnek promptok megadásával moziszerű videókat a helyszín, a stílusjegyek és preferenciák leírásával. Ezeket a felhasználók a Gemini, Whisk, Vertex AI és Workspace szolgáltatásokon keresztül érhetik el.
A generatív AI területén az utóbbi időben különösen nagyot ugrott a különféle kép- és videógenerátorok népszerűsége, a ChatGPT 4o modellen alapuló képgenerátorának használatát le is kellett korlátozni az ingyenes felhasználók számára, miután a vártnál nagyobb érdeklődés miatt túlterheltté váltak a szerverek. A Google eddig vegyes eredményeket ért el a területen: a tavaly kiadott Imagen 3 még nagy port kavart, miután a történelmileg pontatlan emberábrázolás miatt fel kellett függeszteni a személyeket ábrázoló képek generálásának lehetőségét a Gemini szolgáltatásban.
Veo 3 demo | Sailor and the sea
Még több videóTavaszi mix a 2025-ös IT pangástól az interjúk evolúciójáig Ezúttal öt IT karrierrel kapcsolatos, érdekes és aktuális témát érintettünk.
Ugyan pár hónapja a cég bejelentette a jelentős előrelépést hozó Gemini 2.5-ös modelleket, melyek már natív támogatást kínálnak kép- és audiókimenet létrehozásához, eddig még a 2.0 Flash variáns volt az alapértelmezetten használt modell a szolgáltatásban, ezt fogja váltani a bejelentés alapján a 2.5-ös Flash, ami a szimulált érvelésnek köszönhetően megbízhatóbb kimeneteket produkál elődjénél. A Google szerint a Flash 2.5-ös verziója jobban teljesít érvelésben, kódolásban és a multimodalitásban egyaránt, mégis 20-30 százalékkal kevesebb tokent használ, mint előző verziója. Ez a modell válik alapértelmezetté júniustól a Vertex AI-ban, az AI Studio-ban és a Gemini alkalmazásban.
A fejlesztésekkel együtt a Google is felbátorodott, és egy borsosabb opciót vezet be. A Gemini rajtja óta a Google lényegében csak egyetlen prémium AI-csomagot értékesített havi 20 dollárért a Pro modellekhez való hozzáféréssel. Az OpenAI példáját követve azonban árnyalódik a helyzet, és egy új AI Ultra csomagot vezet be a portfólióba, havi 250 dolláros árcímkével, ami még a ChatGPT Pro 200 dolláros havidíját is túlszárnyalja.
Ezért cserébe a felhasználó sokkal kevesebb, egyes esetekben nulla korlátozással használhatja az alapcsomagban is elérhető fejlesztéseket, például kép- és videógeneráláshoz, amit a legfejlettebb eszközök, jelen esetben a Veo 3 videógenerátor és a Flow videószerkesztő biztosítanak. Az első három hónapban az Ultra csomag előfizetői 50 százalékos kedvezményt kapnak csalogatóként. Az ajánlat az amerikai felhasználók számára már elérhető, a későbbiekben pedig más piacokon is bevezeti a cég, még nem tudni, milyen ütemezéssel.