Ismét az otthoni AI-barkácsolók kedvében jár a Google: a vállalat ezúttal a hangparancsok feldolgozását teszi könnyebbé egy újonnan megnyitott dataset segítségével. A cég TensorFlow és AIY részlegei által készített Speech Comands Datasettel a különböző AI rendszerek kiképezhetők a rövid hangparancsok felismerésére. A megoldással akár a hobbisták is készíthetnek egyszerű, hangalapú interfészeket eszközeikhez, amelyek képesek megérteni bizonyos kulcsszavakat.

A Speech Commands Dataset mintegy 65 ezer, egy másodperces hangfelvételt tartalmaz, amelyeken összesen 30 rövid szót ismétel meg több ezer ember. A hangminták egyébként az AIY weboldalán jelentkező önkéntesektől származnak - dataset mérete a Google ígérete szerint a jövőben tovább növekszik majd, miután folyamatosan érkeznek az újabb és újabb minták a jelentkezőktől. Az adathalmazhoz bárki hozzájárulhat az AIY oldalán. A vállalat Creative Commons BY 4.0 licenc alatt teszi elérhetővé az adathalmot, így az érdeklődők szabadon másolhatják és meg is oszthatják azt tetszőleges felületen, illetve építhetnek rá és át is alakíthatják akár kereskedelmi céllal is.

A TensorFlow csapata valószínűleg nem szorul hosszas bemutatásra, a Google 2015-ben megnyitott gépi tanulásos platformja számos projektben segíti a cégeket és hobbistákat egyaránt, nemrég jelent meg a TensorFlow Serving nyílt forrású könyvtár stabil verziója, amelyet a keresőóriás gépi tanulásos rendszerek éles alkalmazási környezetéhez készített (és harmadik felektől származó modelleket is támogat), illetve egyebek mellett az algoritmusok betanításához fejlesztett Tensor2Tensor is idén nyáron nyitotta meg a kapuit. A mostani projektben ugyancsak közreműködő AIY Projects esetében már frissebb kezdeményezésről van szó, az májusban rajtolt, kifejezetten a mesterséges intelligenciával bütykölő hobbisták támogatására. A projekt egyik első gyermeke egy a Google jó szokásához híven kartondobozban összerakható, Raspberry Pi-re építő okoshangszóró.

A friss bejelentések egyébként nem állnak meg a Speech Commands Datasetnél, a Google a hangparancsokat tartalmazó adathalmazzal párhuzamosan az annak létrehozásához használt infrastrukúrát is közkinccsé teszi. Ennek eredményeképp lehetőség van saját hatáskörben bővíteni a datasetet, így a vele készített rendszereket (legalábbis megfelelő mennyiségű "hangdonor" mellett) lehetőség nyílik a kevésbé elterjedt nyelveken, például magyarul is megtanítani.