Szerző: Habók Lilla

2022. július 21. 00:35

Milliós felhasználószámra pályázik a művészkedő AI

Lassan ellephetik az internetet a mesterséges intelligencia segítségével generált "műalkotások". Az OpenAI bétába léptette a DALL-E képgeneráló rendszert, és egyúttal közölte, hogy innentől kezdve a képek kereskedelmi célból is felhasználhatók.

Gyors terjeszkedésbe szeretne kezdeni az OpenAI a képgeneráló DALL-E 2 mesterséges intelligenciára épített rendszerével. Az idén áprilistól elérhető megoldás lényege, hogy természetes nyelven megfogalmazott kulcsszavak alapján készít valósághű képeket, vagy pedig a felhasználók által feltöltött képekhez készít variációkat. Eddig nagyjából 100 ezer felhasználó próbálhatta ki a meghívásos alapú rendszert. A következő hetekben pedig a szolgáltatás 1 millió felhasználót hív meg a várólistáról, hogy részt vegyenek a képgenerálásban, és ezáltal támogassák a programot a továbbfejlesztésben, tesztelésben, skálázásban.

A kezdő felhasználócsapat segített kitapasztalni az eszköz gyengeségeit és erősségeit. Így többek közt néhány megkötés is született, például hogy a megoldással nem szabad jól ismert személyeket megmintázni, sem valós emberekről készült képeket feltölteni - a deepfake elkerülése érdekében. Az MI nem enged létrehozni többek közt erőszakos (pl. önkárosítás, gyűlöletkeltés), politikai és más szabálysértő tartalmakat, amit automatizmusok és moderátorok is ellenőriznek.

Továbbá a kezdeti teszt világított rá az MI elfogultságaira is, mivel például a vezérigazgató kulcsszóra a képeken fehér férfi, a tanár kifejezésre pedig fehér nő jelent meg minden alkalommal. Mostanra az OpenAI kiküszöbölte a problémát, így állítása szerint a megjelenő képek már reprezentatívan ábrázolják a világ sokszínűségét.

dalle_muvek_kulcsszavakkal
Kulcsszavak és a létrejött képek

Popcorn + IT

Több 100 előadás felvétele a HWSW Youtube csatornáján - csatlakozz!

Popcorn + IT Több 100 előadás felvétele a HWSW Youtube csatornáján - csatlakozz!

A bétába lépő képgeneráló MI kreditrendszerre tér át, amelyen belül minden felhasználó kezdeti 50 kreditet kap, továbbá havi 15 kredit töltődik újra ingyenesen. Ha ez sem elég, akkor 15 dollárért cserébe 115 újabb kredit jár. Miközben 1 kreditért lehet egy szöveges parancsot megfogalmazni, ami 4 különböző képet generál egyszerre a kulcsszavak alapján. A feltöltött képek átalakítása és a meglévő DALL-E képek szerkesztése pedig 3 képet hoz létre.

Mostantól pedig ezek az MI által generált képek saját kereskedelmi projektjeiben is alkalmazhatók az OpenAI bejegyzése szerint. Azaz a felhasználók eladhatják, nyomatokat vagy merchandise termékeket is készíthetnek belőle. Az engedély visszamenőleg is vonatkozik a már legenerált képekre. Ezek lehetnek a szervezet példái szerint akár gyermekkönyv-illusztrációk, játékkarakterek vagy marketinganyagok képei. Mindez pedig tovább növeli a kérdést a DALL-E 2 és hasonló programok - Craiyon, Meta féle Make-A-Scene, Google-féle Imagen -, vagyis az MI-művészet körül, hogy mennyire lehet ezeket a képeket valódi művészeti alkotásoknak tekinteni, és a hagyományos képekkel együtt például kiállításokon bemutatni, vagy aukcióra bocsátani.

a címlapról