Szerző: Hlács Ferenc

2017. szeptember 21. 12:32

Szebb hangot kap a Siri az iOS 11-gyel

Apróbb hangmintákkal és gépi tanulással tanítja természetesebb beszédre termékét az Apple.

Szebb hangot hoz a Sirinek az iOS 11: az Apple fejlesztői komoly ráncfelvarrást eszközöltek a virtuális asszisztens hangképzésén, amelyet gépi tanulással tettek kellemesebbé. A Siri a mobil operációs rendszer legújabb verziójában már nem egyszerű fonémákat toldoz egymáshoz az előre felvett készletből a beszéd során, helyette jóval apróbb építőelemekkel dolgozik. Egész pontosan feleakkorákkal mint eddig, az asszisztens ugyanis már félfonémákból építi fel mondanivalóját.

Az Apple a művelethez több mint húsz órányi hangmintát rögzített - azt egyelőre nem tudni, pontosan kinek a hangja szól majd az iOS-es eszközökből, a TechCrunch szerint ugyanakkor egy új hangszínészt vettek fel a projekthez, aki rengeteg, előre megadott anyagot olvasott fel, a viccektől a különböző könyvekig. Az így kapott nagy mennyiségű hangfelvételt darabolták fel az elemi nyelvi egységek felének megfelelő félfonémákra.

Alapozó Go fejlesztői képzést indítunk (x)

November 9-én 10 alkalmas, 30 órás, online formátumú Go képzést indít a HWSW.

Alapozó Go fejlesztői képzést indítunk (x) November 9-én 10 alkalmas, 30 órás, online formátumú Go képzést indít a HWSW.

A rendszer ezután az apró hangdarabok megfelelő elhelyezését gépi tanulással sajátítja el, figyelembe véve, hogy adott kontextusokban milyen hangsúly megfelelőbb, illetve többek között olyan szempontokat is, hogy egy-egy hasonló hangból melyik állja meg jobban a helyét a mondatok elején és végén. A hatáshoz persze nem csak az újonnan felvett félfonémák tesznek hozzá: az asszisztens ahol kell elnyújtja a szótagokat, illetve a beszéd közbeni szünetekre is sokkal jobban odafigyel. Az eredmény az eddig megismertnél jóval természetesebb hatású Siri-hangzás, kevésbé gépies, élethűbb mondatokkal. A Siri új orgánuma tehát a legújabb, 11-es iOS-szel vált elérhetővé, amelyet az Apple készülékek tulajdonosai már le is tölthetnek.

Nem meglepő, hogy a cupertinói óriás minél több oldalon igyekszik faragni virtuális segédjén, hiszen a területen folytatott versenyben a riválisok egyre inkább kezdik maguk mögött hagyni a Sirit. A mezőnyt jelenleg egyértelműen az Alexa vezeti, noha a trónon hamarosan osztozhat majd a Microsofttól megismert Cortanával. A két vállalat ugyanis megállapodott, hogy még idén összeköltözteti a két asszisztenst, így lényegében megosztva egymással a piacrészüket. Közben a Google Assistant is jön fel, az már nem csak a keresőóriás saját hardverén található meg, más cégek is készülnek a segédet futtató okoshangszóróikkal és más termékeikkel - eközben a Sirinek továbbra is az Apple termékeivel kell beérni, igaz a vállalat saját okoshangszórója is hamarosan piacra kerül.

A HackerRank 2020-as, 116.000 fejlesztő válaszaiból készült kutatása szerint a legtöbbjük a Go-t szeretné megtanulni következőleg, amely eredménynek az okait most ebben a cikkben szedtük össze.

a címlapról