Szerző: Bőle György

2023. január 18. 14:20

Stable Diffusion: szövegből kép generálás a gyakorlatban

Az emberiség összes vizuális információja néhány gigabájtba tömöríthető, ennyiből előállítható az összes lehetséges kép - állítja a Stable Diffusion fejlesztője.

Szeptemberben nagy port kavart az a hír, hogy egy mesterséges intelligencia által generált képpel nyertek meg egy művészeti versenyt. Emiatt a text-to-picture, azaz a szövegből kép generálás AI segítségével nagy média figyelmet kapott az elmúlt időszakban. Mindez a gépi tanulás területén megjelent új megközelítésnek, a deep learning tömeges megjelenésének köszönhető, amelynek a képgenerálás mindössze csak egy szemléletes felhasználási módja, mert a lehetőségek korlátlanok.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Litkei Péter (Deepnetworks) a HWSW free! meetup-sorozat machine learning állomásán elhangzott és alább megtekinthető előadásában a deep learning megközelítést mutatja be a szövegből kép generálással. Ehhez a Stability.ai által publikált betanított hálózatot használja, ami szemben az olyan megoldásokkal, mint a DALL-E 2, teljesen open source projekt, így képes akár saját eszközeinken vagy éppen saját szolgáltatásainkkal képek generálására.

17:32
 

Szövegből kép generálás a gyakorlatban (Stable Diffusion)

Még több videó
a címlapról