:

Szerző: Dömös Zsuzsanna

2025. június 19. 10:28

Kiadta első videógeneráló AI-eszközét a Midjourney

Állóképekből készít 5-20 másodperces mozgóképeket a Midjourney V1 nevű modellje, mely a Discordon keresztül használható, természetesen korlátozásokkal.

A képgenerátoráról ismertté vált Midjourney szerdán bejelentette régóta várt videógeneráló modelljét, a képből mozgóképet konvertáló V1-et. A felhasználók egy kép feltöltése (ami lehet egy akár Midjourney-vel előállított tartalom) után 4-5 másodperces videókat kapnak vissza eredményül az eszköztől, ami a korábbi megoldásokhoz hasonlóan csak a Discordon érhető el webes böngészőből, alkalmazás formájában nem.

A V1 kipróbálásának legolcsóbb módja a havi 10 dolláros Basic csomagra való előfizetés. Mivel a szolgáltatás nyolcszor annyi kreditet számol fel a videó készítéséért, mint a képek esetében, így az előfizetők jóval gyorsabban elhasználhatják a havi keretüket. A havi 60 dolláros Pro és 120 dolláros Mega csomagok előfizetői már korlátlan számú videót készíthetnek, de a cég közleménye szerint a következő hónapokban még módosíthatja az árakat és konstrukciókat.

A V1 kiadásával a Midjourney versenyhelyzetbe kerül az OpenAI Sora, a Runway Gen 4, az Adobe Firefly és a Google Veo 3 szolgáltatásokkal. Ugyan a fejlesztők zöme arra összpontosít, hogy kereskedelmi környezetben használható modelleket készítsen, addig a Midjourney hozzáállása mindig is különbözött, és inkább a kreativitást kiszolgáló, sajátos képi modelleket adott kézre.

midjourneyv1

Szoftvertesztelés: ütött az óra

A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

Szoftvertesztelés: ütött az óra A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

A V1 kínál néhány egyéni beállítást a kimenetek finomításához, választható például az automatikus animáció, amely véletlenszerűen mozgatja a képet, vagy a manuális vezérlési mód, amely lehetővé teszi a felhasználók számára, hogy szöveges prompttal adja meg a videóban látni kívánt animációt. A készítő a beállítások közt a kamera és a téma mozgásának tempóját és mértékét is finomíthatja. Bár a V1-gyel generált videók mindössze öt másodperc hosszúak, amit a felhasználók legfeljebb 20 másodpercre hosszabbíthatnak. Ez viszonylag rövid formátum, de a vállalat elmondása szerint az időtartamot növelni, az eszköztárat pedig bővíteni tervezik a jövőben várható frissítésekkel.

A Midjourney a V1 bejelentésekor hozzátette, hogy AI-alapú videómodelljeivel komolyabb céljai vannak, mint mondjuk a reklámkészítésben való részvétel. Következő lépésként olyan modellek készítését látja, melyek képesek „valós idejű nyílt világú szimulációk előállítására”. A későbbi tervek közt szerepel egy 3D-s renderek készítéséhez szükséges MI-modell, valamint valós idejű MI-modellek is.

A V1 nyilvánossá tétele fokozhatja a feszültséget a kreatívok és a Midjourney között, mivel pont egy héttel azután kezdődik, hogy a Disney és az NBCUniversal közösen pert kezdeményezett a fejlesztő ellen. A Los Angeles-i szövetségi kerületi bíróságon benyújtott keresetben felhozott vád szerint a két felperes különféle szerzői joggal védett tulajdonait is felhasználhatta a Midjourney AI-modellje képzéséhez, így olyan ismert karakterek jellegzetes vonásai kerültek bele az adatmasszába, mint Shrek, Gru, a Simpson család figurái, vagy a Star Wars franchise elemei.

Az AI által generált képeken keresztül pedig bizonyítható, hogy a másolatok tartalmazzák ezeket a karaktereket a kimenetben is, sokszor új helyszíneken, környezetben és kontextusban megjelenítve őket. Az OpenAI, a Meta és a Perplexity ellen már zajlanak hasonló szerzői joggal kapcsolatos perek, főleg írásos online tartalmak és cikkek kapcsán, de a Disney és az NBCUniversal az első nagy hollywoodi szereplők, akik kifejezetten a filmipar felől közelítenek.

a címlapról