2025. május 21. 11:06

Bevetésre készen a Google új AI-modelljei

Fejlettebb kép- és videógenerátor eszközei és modelljei mellett egy drágább előfizetési csomagot is bejelentett a keresőóriás az idei I/O alkalmából.

A Google I/O fejlesztői konferenciáján jobbára minden az AI körül forgott, a keresőóriás seregszemlét tartott legújabb generatív eszközeiből. Ezek közé tartozik a Veo 3 videógenerátor is, melynek fő előnye, hogy az előállított vizuális tartalomhoz hangot is rendel. Lényegében az OpenAI által fejlesztett Sora versenytársa, de a hang videóba való beágyazásának képessége jelentős előrelépés, mivel nem egyszerű háttérzenéről van szó, hanem akár karakterek közti párbeszédekről, vagy állatokat utánzó hangokról, a valós életbeli szájmozgásokat mímelve.

A Veo 3 kedd óta érhető el a Google új, havi 249 dollárba kerülő Ultra előfizetési csomagjának részeként - egyelőre csak az amerikai felhasználók számára, de a későbbiekben a Vertex AI vállalati platform felhasználói is megkapják. A Veo 2 generátor szintén kapott kisebb frissítéseket, például lehetséges már szöveges promptokkal objektumokat hozzáadni vagy eltávolítani videókból.

A keresőóriás emellett bejelentette a többek közt képminőség terén fejlődést hozó Imagen 4 képgenerátort, valamint a Flow filmkészítő eszközt, mellyel a felhasználók könnyedén készíthetnek promptok megadásával moziszerű videókat a helyszín, a stílusjegyek és preferenciák leírásával. Ezeket a felhasználók a Gemini, Whisk, Vertex AI és Workspace szolgáltatásokon keresztül érhetik el.

A generatív AI területén az utóbbi időben különösen nagyot ugrott a különféle kép- és videógenerátorok népszerűsége, a ChatGPT 4o modellen alapuló képgenerátorának használatát le is kellett korlátozni az ingyenes felhasználók számára, miután a vártnál nagyobb érdeklődés miatt túlterheltté váltak a szerverek. A Google eddig vegyes eredményeket ért el a területen: a tavaly kiadott Imagen 3 még nagy port kavart, miután a történelmileg pontatlan emberábrázolás miatt fel kellett függeszteni a személyeket ábrázoló képek generálásának lehetőségét a Gemini szolgáltatásban.

Veo 3 demo | Sailor and the sea

Még több videó

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

Kafka és CI/CD alapozó online képzéseket indít a HWSW! Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

Ugyan pár hónapja a cég bejelentette a jelentős előrelépést hozó Gemini 2.5-ös modelleket, melyek már natív támogatást kínálnak kép- és audiókimenet létrehozásához, eddig még a 2.0 Flash variáns volt az alapértelmezetten használt modell a szolgáltatásban, ezt fogja váltani a bejelentés alapján a 2.5-ös Flash, ami a szimulált érvelésnek köszönhetően megbízhatóbb kimeneteket produkál elődjénél. A Google szerint a Flash 2.5-ös verziója jobban teljesít érvelésben, kódolásban és a multimodalitásban egyaránt, mégis 20-30 százalékkal kevesebb tokent használ, mint előző verziója. Ez a modell válik alapértelmezetté júniustól a Vertex AI-ban, az AI Studio-ban és a Gemini alkalmazásban.

A fejlesztésekkel együtt a Google is felbátorodott, és egy borsosabb opciót vezet be. A Gemini rajtja óta a Google lényegében csak egyetlen prémium AI-csomagot értékesített havi 20 dollárért a Pro modellekhez való hozzáféréssel. Az OpenAI példáját követve azonban árnyalódik a helyzet, és egy új AI Ultra csomagot vezet be a portfólióba, havi 250 dolláros árcímkével, ami még a ChatGPT Pro 200 dolláros havidíját is túlszárnyalja.

Ezért cserébe a felhasználó sokkal kevesebb, egyes esetekben nulla korlátozással használhatja az alapcsomagban is elérhető fejlesztéseket, például kép- és videógeneráláshoz, amit a legfejlettebb eszközök, jelen esetben a Veo 3 videógenerátor és a Flow videószerkesztő biztosítanak. Az első három hónapban az Ultra csomag előfizetői 50 százalékos kedvezményt kapnak csalogatóként. Az ajánlat az amerikai felhasználók számára már elérhető, a későbbiekben pedig más piacokon is bevezeti a cég, még nem tudni, milyen ütemezéssel.

Bevetésre készen a Google új AI-modelljei

Fejlettebb kép- és videógenerátor eszközei és modelljei mellett egy drágább előfizetési csomagot is bejelentett a keresőóriás az idei I/O alkalmából.

Veo 3 demo | Sailor and the sea

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Mi hajtja a számítástechnika forradalmait? - 3.

Újabb skalpot gyűjtött a Google felhős üzletága

Pixel 10: a Google-t sem igazán érdekli már a hardver

Bevetésre készen a Google új AI-modelljei

Fejlettebb kép- és videógenerátor eszközei és modelljei mellett egy drágább előfizetési csomagot is bejelentett a keresőóriás az idei I/O alkalmából.

Veo 3 demo | Sailor and the sea

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Mi hajtja a számítástechnika forradalmait? - 3.

Újabb skalpot gyűjtött a Google felhős üzletága

Pixel 10: a Google-t sem igazán érdekli már a hardver

H20: amikor az USA enged, Kína bekeményít

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Költekezés után toborzási stop a Meta-nál

H20: amikor az USA enged, Kína bekeményít

Költekezés után toborzási stop a Meta-nál

Ha kell, ha nem megkapják az állami üzenetküldőt az oroszok