Szerző: Dojcsák Dániel

2012. augusztus 17. 11:37

Google Android beszélni magyar!

A Google Voice Search létezése nyilván minden Android-felhasználónak feltűnt, hiszen minden szövegbeviteli mező jobbján ott a kis mikrofon, amit megnyomva diktálhatunk a mobilnak. A magyarok eddig legfeljebb idegennyelv-tudásukat tesztelhették és irigykedhettek azokra, akik fontosabb nyelvterületre születtek. Ennek vége.

A mai frissítéssel azonban a meglévő 29 támogatott nyelv, illetve nyelvjárás mellé 13 új került be a Google Voice Search, illetve Voice typing funkcióhoz. Ez azt jelenti, hogy 100 millió új okostelefon-használót fog megérteni a mobilja világszerte. A magyar mellett a baszk, bolgár, katalán, európai portugál, galíciai (spanyolországi portugál), finn, izlandi, norvég, román, szerb, szlovák és svéd nyelveket kezdett el megérteni a felhőalapú beszédfelismerő.

Dobrý deň, užívateľ!

Az új nyelvek érkezését bejelentő hivatalos blogbejegyzés is említi, hogy minden egyes nyelv integrálásához több százezer beszédmintát gyűjt össze a Google önkéntesektől, illetve éveken keresztül finomítja az algoritmust és nyelvészekkel kutja az egyes nyelvek szabályszerűségeit. A román nyelvben például a kiejtési szabályok könnyen követhetőek, de a svéd esetében toborozni kellett anyanyelvi beszélőket, akik több ezer szó kiejtését vitték fel a rendszerbe. A lényeg persze a kutatók által létrehozott öntanuló rendszerben van, ami a felvitt néhány ezer szó és hangalakja alapján meg tudja jósolni, hogy a többi szót hogy kell kiejteni.

A magyarral szintén nem lehetett könnyű dolga a gépezetnek, ami kissé érződik is a jelenlegi teljesítményen. Az algoritmus meglepően jól és gyorsan képes felismerni szavainkat, lehet hosszabb szövegeket is diktálni, sőt, akár káromkodni is. Vannak viszont bizonyos hangzócsoportok, amik nehézséget okoznak még. Ilyen például a “zt” együttállása, illetve több olyan sajátosság, amikor néma hangzókat használunk és az élő megértésben a jelentéskülönbséget maga a kontextus és nem a kiejtés adja.

És tudja, és tudja, és tudja!

A hangfelismerés első napi teljesítménye azonban még így is hihetetlen. A ma reggeli tesztjeink alapján azt tudjuk mondani, hogy akár tulajdonneveket mondunk, például nevek keresésénél vagy térképen a navigációhoz településeket, akár szlenges kifejezéseket használunk, akkor is jól működik a Google algoritmusa. Sikeresen felismerte a Bajcsy-Zsilinszky utat, kedvenc káromkodásainkat, bonyolult településneveket és a leghosszabb szavunkat, a “megszentségteleníthetetlenségeskedéseitekért” műszót is.

Mivel a Voice Search nem egy magyarul alig beszélő külföldi turista, ezért ne fárasszuk magunkat azzal, hogy lassan, nagyon tagoltan beszélünk hozzá. Az algoritmus akkor ismeri fel a legnagyobb valószínűséggel szavainkat, ha azt tisztán, de normális ritmusban és hangsúllyal mondjuk ki - néhány perc alatt kitapasztalható, hogy mire érdemes odafigyelni és melyik beszédhibánk zavarja a rendszert leginkább.

A jövőben a magyar nyelv felismerése is biztosan sokat fejlődik, ez már csak azon múlik, hogy mennyire sokan és mennyire aktívan használják a funkciót. Az öntanuló algoritmus merít a bevitt hangmintákból, próbálkozásokból. Ha elfogadunk egy felajánlott írott alakot, akkor a szerveren valószínűleg kap egy megerősítést, és a későbbiekben már valószínűbb, hogy felismer egy hangalakot. Aki használta az angol nyelvű felismerést, azt tudhatja, hogy a bemutatókor még nagyon döcögős algoritmus mostanra bármilyen tört angolsággal beszélő ember szavait képes felismerni, a javulás bámulatos alig egy év alatt.

Nem ééérted?

Azt azért érdemes fejben tartani, hogy ez még egy korai fázisában lévő képesség, a hangfelismerés piac ha már nem is gyerekcipőben, de még tinédzser korban jár. Lehet kritizálni és biztosan szembesülünk majd olyan esetekkel, amikor csak nem akarja megérteni, mit mondunk neki, de egy kis türelmet megér az évtized legérdekesebb technológiai fejlődése. Néhány évvel ezelőtt az asztali rendszereken futó hangfelismerőket még tréningezni kellett és a pontosságuk nem érte el azt a szintet, hogy érdemes legyen használni azokat. Ma pedig már bájcseveghetünk a mobilunkkal, az Android alatt ráadásul magyarul is.

A beszédfelismerés nem a készüléken történik, hanem a Google szerverein, tehát teljesen mindegy, hogy milyen teljesítményű mobilunk van, a leggyengébbtől a csúcsmodellekig ez a képesség azonos lesz. A lényeg mindössze annyi, hogy Android 2.2 vagy újabb operációs rendszer, illetve stabil és gyors internetkapcsolat legyen, anélkül ugyanis nem működik. A diktálás így egy szerény adatforgalmat generál, illetve a felismerés processzoridővel nem, de a hálózathasználattal beleszól az üzemidőbe is.

Megjósolja, hogy kell leírni

A prediktív automata felismerő előnye, hogy elméletileg a szótárában nem szereplő, kitalált szavakat, szlengeket vagy akár értelmetlen zagyvaságokat is képes a hangalakból írott formába vinni. Jelen szinten azonban nem elég stabil a felismerés pontossága, így a furcsa szavakat rendszerint egy hasonló formájú gyakoribb szóra cseréli az algoritmus - kiejtési vagy felismerési hibának tekinti az adott hangalakot és próbál korrigálni. Az egyetlen komoly hiányosság, hogy az írásjeleket, speciális karaktereket, sem a smiley-kat nem kezeli egyáltalán. Ha viszont arra gondolunk, hogy mennyit sikerült ugrani mondjuk a kezelőfelületek, hardverek vagy a multimédia terén az elmúlt 5 évben, akkor a progresszív sci-fi fantazmagóriák is óvatos tapogatózásnak tűnnek ahhoz képest, ami a következő évtizedekben vár a társadalomra.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A Jelly Bean felhasználók viszont már élvezhetik a direkt válaszokat adó keresőt, amibe ha belemondjuk, hogy "milyen idő van Budapesten?" akkor az időjárás widgetet dobja fel és nem egy webes találati oldalt az előbbi szövegre. A magyar felhasználók szempontjából az Android fényévekkel került az Apple elé, hiszen a Siri nagyjából hasonló funkcionalitással rendelkezik ugyan, de nem tud magyarul. A Google lokalizációs hullámában hazánk mindig, ahogy most is körülbelül a 40. ország, így belefértünk a 46-os listába.

Szoftvert frissíteni az Android 2.2 utáni felhasználóknak nem kell, a nyelvek listájában megjelent a magyar, aki viszont még mindig régebbi Androidot futtat, az megtalálja a Play Store-ban a friss Voice Search funkciót. Mire a többséghez eljut a Jelly Bean verzió, ami már tartalmazza a Google Now szolgáltatást is, addigra bizonyára még jobban tud majd magyarul is az Android, beszélgethetünk vele bátran.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról