Szerző: Hlács Ferenc

2017. August 28. 12:45:00

Hobbi AI-oknak segít beszédfelismerést tanulni a Google

A cég tekintélyes datasetet nyitott meg a hobbisták előtt az AI rendszerek betanítására. Mostantól a Speech Commands Dataset névre hallgató adathalom, és a létrehozásához használt infrastruktúra is szabadon felhasználható.

Ismét az otthoni AI-barkácsolók kedvében jár a Google: a vállalat ezúttal a hangparancsok feldolgozását teszi könnyebbé egy újonnan megnyitott dataset segítségével. A cég TensorFlow és AIY részlegei által készített Speech Comands Datasettel a különböző AI rendszerek kiképezhetők a rövid hangparancsok felismerésére. A megoldással akár a hobbisták is készíthetnek egyszerű, hangalapú interfészeket eszközeikhez, amelyek képesek megérteni bizonyos kulcsszavakat.

A Speech Commands Dataset mintegy 65 ezer, egy másodperces hangfelvételt tartalmaz, amelyeken összesen 30 rövid szót ismétel meg több ezer ember. A hangminták egyébként az AIY weboldalán jelentkező önkéntesektől származnak -  dataset mérete a Google ígérete szerint a jövőben tovább növekszik majd, miután folyamatosan érkeznek az újabb és újabb minták a jelentkezőktől. Az adathalmazhoz bárki hozzájárulhat az AIY oldalán. A vállalat Creative Commons BY 4.0 licenc alatt teszi elérhetővé az adathalmot, így az érdeklődők szabadon másolhatják és meg is oszthatják azt tetszőleges felületen, illetve építhetnek rá és át is alakíthatják akár kereskedelmi céllal is.

HWSW képzés // AI és Scrum early A HWSW októberben induló gyakorlatorientált, 10 alkalmas, 30 órás online képzéseire most early bird kedvezménnyel lehet regisztrálni!

A TensorFlow csapata valószínűleg nem szorul hosszas bemutatásra, a Google 2015-ben megnyitott gépi tanulásos platformja számos projektben segíti a cégeket és hobbistákat egyaránt, nemrég jelent meg a TensorFlow Serving nyílt forrású könyvtár stabil verziója, amelyet a keresőóriás gépi tanulásos rendszerek éles alkalmazási környezetéhez készített (és harmadik felektől származó modelleket is támogat), illetve egyebek mellett az algoritmusok betanításához fejlesztett Tensor2Tensor is idén nyáron nyitotta meg a kapuit. A mostani projektben ugyancsak közreműködő AIY Projects esetében már frissebb kezdeményezésről van szó, az májusban rajtolt, kifejezetten a mesterséges intelligenciával bütykölő hobbisták támogatására. A projekt egyik első gyermeke egy a Google jó szokásához híven kartondobozban összerakható, Raspberry Pi-re építő okoshangszóró.

A friss bejelentések egyébként nem állnak meg a Speech Commands Datasetnél, a Google a hangparancsokat tartalmazó adathalmazzal párhuzamosan az annak létrehozásához használt infrastrukúrát is közkinccsé teszi. Ennek eredményeképp lehetőség van saját hatáskörben bővíteni a datasetet, így a vele készített rendszereket (legalábbis megfelelő mennyiségű "hangdonor" mellett) lehetőség nyílik a kevésbé elterjedt nyelveken, például magyarul is megtanítani.

A HWSW októberben induló gyakorlatorientált, 10 alkalmas, 30 órás online képzéseire most early bird kedvezménnyel lehet regisztrálni!

a címlapról