:

Szerző: Dömös Zsuzsanna

2024. december 10. 10:32

Elérhetővé vált az OpenAI videógenerátora

A februárban bemutatott Sora-t a ChatGPT előfizetői használhatják, egyelőre még nem mindenhol.

Az OpenAI február elején jelentette be mozgóképek előállítására képes MI-modelljét, a Sorát (japánul: égbolt). A ChatGPT-hez hasonlóan transformer architektúrát használó diffúziós MI-modell működése meglehetősen többrétű: nem csak egyszerű szöveges promptokból tud előállítani nagyfelbontású videoklipet, de dolgozni tud állóképekből, illetve már meglévő videók képkockáit töltheti ki.

A modellhez eddig csak tesztelők kisebb csoportja férhetett hozzá, a cég a bejelentéskor még nem tett közzé elérhető, vagy kipróbálható szolgáltatást a honlapján közzétett 10 mintán túl, arra egészen mostanáig kellett várni. Végül a demó után tíz hónappal az új Sora Turbo modell bevezetése a napokban megkezdődött, de csak a ChatGPT előfizetői, tehát a ChatGPT Plus vagy Pro csomagokat használók számára első körben az Egyesült Államokban, és fokozatosan válik elérhetővé más régiókban is. Európában egyelőre még nem indult el.

Az elmúlt hónapok során a versenytársak is bemutatták saját videószintézis megoldásaikat, bemutatkozott többek közt a Google Veo és a Runway Gen-3 Alpha is, így a Sora fénye kissé tompult. Mostanra viszont már az eredetileg bejelentett képességekhez képest több előrelépés is történt, lehetséges többféle képarányban készíteni videókat, és a modell összességében gyorsabban dolgozza fel a kéréseket, mint februárban. A fejlesztők bevallása szerint azonban még hosszabb ideig tart az összetett kérések és  a fizikai szimulációk létrehozása, és korántsem várható tökéletes eredmény.

sora

Miért kritikus a Patch & Asset Management a kibervédelemben? (x)

Az adatszivárgások jelentős része megakadályozható lenne, ha a szervezetek időben telepítenék a szoftverfrissítéseket.

Miért kritikus a Patch & Asset Management a kibervédelemben? (x) Az adatszivárgások jelentős része megakadályozható lenne, ha a szervezetek időben telepítenék a szoftverfrissítéseket.

A Sora jelenleg legfeljebb 20 másodperces videókat generál 1080p felbontásban szöveges vagy képes promptból, és az OpenAI egyelőre korlátozza azt, hogy embereket ábrázoló videókat állíthasson elő. A szolgáltatás indításakor személyeket ábrázoló képeket nem lehet megadni beviteli adatként a modellnek, továbbá a rendszer blokkolja a szexuális jellegű deepfake képek előállítását.

Az OpenAI egyben bővebb dokumentációt is megosztott a modell működésével kapcsolatban, illetve hogy milyen biztonsági tesztek alá vetette a technológiát, mielőtt a szélesebb közönség elé tárja. A videók alapértelmezés szerint vízjeleket kapnak, a fejlesztők pedig egy belső keresőeszközt is készítettek a Sora által generált tartalom ellenőrzésére. A platform továbbá C2PA metaadatokat ágyaz be az összes generált videóba a származás ellenőrzése céljából.

A ChatGPT Plus előfizetői havonta 50 videót készíthetnek 480p felbontásban, de a 720p-s videók generálására szánt keret szűkösebb. A nemrég bejelentett méregdrága (200 dollár havonta) Pro csomag előfizetőinek értelemszerűen jobbak a lehetőségei a felbontást és a videók hosszát tekintve. A jövő évben az OpenAI terve szerint további, rugalmasabb csomagok is elérhetővé válnak a szolgáltatáson belül.

Felkértünk 3 különböző területen dolgozó csapatot, mutassák meg élőben, hogyan is használják ők az AI-t. Ezután mindenki eldöntheti, mit gondol az egészről, hol is tart az adaptációban. November 17-én érkezik a kraftie demo day, 19-én pedig az első képzés!

a címlapról

LIKE

1

Megszűnik a facebookos Like gomb, de nem úgy

2025. november 11. 13:53

Jövőre megszűnnek a Facebook Social Pluginok, azaz a Like és Comment gombok, ezzel pedig újabb legacy feature-től szabadul meg a közösségi oldal.