Szerző: Bőle György

2023. január 18. 14:20

Stable Diffusion: szövegből kép generálás a gyakorlatban

Az emberiség összes vizuális információja néhány gigabájtba tömöríthető, ennyiből előállítható az összes lehetséges kép - állítja a Stable Diffusion fejlesztője.

Szeptemberben nagy port kavart az a hír, hogy egy mesterséges intelligencia által generált képpel nyertek meg egy művészeti versenyt. Emiatt a text-to-picture, azaz a szövegből kép generálás AI segítségével nagy média figyelmet kapott az elmúlt időszakban. Mindez a gépi tanulás területén megjelent új megközelítésnek, a deep learning tömeges megjelenésének köszönhető, amelynek a képgenerálás mindössze csak egy szemléletes felhasználási módja, mert a lehetőségek korlátlanok.

Színfalak mögött: így épül egy szoftverfejlesztő iroda

Betekintést nyújtunk olyan folyamatokba, melyek sokszor teljesen láthatatlanok a munkavállalók számára.

Színfalak mögött: így épül egy szoftverfejlesztő iroda Betekintést nyújtunk olyan folyamatokba, melyek sokszor teljesen láthatatlanok a munkavállalók számára.

Litkei Péter (Deepnetworks) a HWSW free! meetup-sorozat machine learning állomásán elhangzott és alább megtekinthető előadásában a deep learning megközelítést mutatja be a szövegből kép generálással. Ehhez a Stability.ai által publikált betanított hálózatot használja, ami szemben az olyan megoldásokkal, mint a DALL-E 2, teljesen open source projekt, így képes akár saját eszközeinken vagy éppen saját szolgáltatásainkkal képek generálására.

17:32
 

Szövegből kép generálás a gyakorlatban (Stable Diffusion)

Még több videó

Európa egyik legnagyobb Atlassiannal kapcsolatos rendezvénye, immár kilencedik alkalommal, új lendületet ad a vállalati produktivitásnak és a hatékony ügyfélkezelésnek. A március 20-21-i rendezvényen is lesznek top nemzetközi vendorok, a fókuszban pedig a projekt menedzsment, az IT szolgáltatásmenedzsment, és a HR lesznek.

a címlapról