Szerző: Bőle György

2022. február 22. 09:55

Deep Learning alkalmazása a beszédszintézisben

Az elmúlt években a Deep Learning alapú megoldások számos területen az emberihez hasonló, vagy azt meghaladó eredményeket értek el, például kép- és beszédfelismerésben.

A DL egyik legújabb ága a generatív modellezéssel foglalkozik, melynek során a tanítóadatokhoz hasonló, új adatokat hozunk létre. A versengő hálózatok (Generative Adversarial Network, GAN) gondolata 2014-ben született meg, és azóta az alapötlet több ezer különböző megvalósítása látott napvilágot.

Dr. Csapó Gábor a HWSW digitális termékfejlesztési konferencián tartott és alább megtekinthető előadásában a beszédszintézis példáján keresztül mutatta be, hogyan alkalmazhatóak a GAN-ok gyakorlati problémák megoldására a hagyományos deep learning modellek mellett.

15:23
 

Deep Learning alkalmazása a beszédszintézisben

Még több videó

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról