:

Szerző: Dömös Zsuzsanna

2023. augusztus 3. 13:12

Audiógenerátor eszközcsomagot tett elérhetővé a Meta

Hangeffektusok és zenék generálására képes a közösségi óriás több modellből álló csomagja, aminek kódját meg is nyitotta a fejlesztők előtt.

A Meta elérhetővé tette új nyílt forráskódú, AudioCraft nevű szolgáltatását, amivel a felhasználók különféle hangokat, akár komplett zeneszámokat generálhatnak a mesterséges intelligenciának köszönhetően. A szolgáltatás több, a hanggenerálás különböző területeivel foglalkozó modellt használ: a 20 ezer órányi zenén betanított MusicGen szöveges promptok alapján készít zenét, míg az AudioGen ugyanilyen módon hangeffekteket, hanghatásokat tud létrehozni, például kutyaugatást, lépéshangokat, zörgéseket.

Az eddigi tesztek alapján a létrehozott környezeti zajok, például szirénák, zúgások meglehetősen természetesnek tűnnek, a zeneszámok esetében már nyomon érhető egyfajta mesterséges íz a hangszerek, például a gitárok megszólalásában. Az EnCodec nevű dekóder komponens pedig egy neurálishálózat-alapú audió tömörítési kódek.

featured_ai_music

Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét!

A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét! A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

A Meta megjegyzi, hogy míg a szöveg és kép formátuma köré épülő generatív mesterségesintelligencia-modellek nagy figyelmet kapnak, a generatív audioeszközök fejlesztése elmaradottnak tekinthető. A kutatóknak és a fejlesztőknek a nyílt forráskódú csomaggal lehetőségük adódik rá, hogy saját modelleket képezhessenek ki saját adatkészleteikkel.

Hanggenerátor technológiávaé szintén kísérletezik a Google, aminek MusicLM nagy nyelvi modellje egy ideje már elérhető. A keresőcég megoldása szintén szöveges utasítások alapján állít elő pár percnyi hanganyagot, de egyelőre korlátozott hozzáférésű, csak kutatók használhatják. Említhető még a decemberben létrehozott Riffusion nevű szöveg-zene generátor platform, ami a Stable Diffusion technológiájára épül.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. május 3. 08:57

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.