Mellékleteink: HUP | Gamekapocs
Keres

Szövegértésre gyúr az új Facebook-AI

Hlács Ferenc, 2016. június 02. 14:34
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Egyre közelebbről ismerkedik felhasználóival a Facebook, a cég DeepText rendszerével már értelmezni is képes a felhasználói tartalmakat, beleértve a posztokat és privát üzeneteket is.

Nem csak elolvassa, már meg is érti a felhasználók posztjait és beszélgetéseit a Facebook: a közösségi oldal frissen bejelentett DeepText rendszere segítségével képes értelmezni a szöveges tartalmakat, a szerzett információk alapján pedig relevánsabb tartalmakat jeleníthet meg vagy egyéb, kapcsolódó szolgáltatásokat ajánlhat fel - de a megoldás a spam, illetve offenzív tartalmak szűrését is nagyban megkönnyítheti.

Egy hasonló AI felépítése, illetve betanítás ugyanakkor nem egyszerű, a szövegértelmezés ugyanis rendkívül összetett feladat: a rendszer képes kell legyen meghatározni, hogy egy adott poszt általánosságban mire vonatkozik, valamint az azt felépítő különböző elemeket egyenként is fel kell ismernie. Valamilyen sporteseménnyel kapcsolatos kiírás esetében például amellett, hogy a szoftver rájön, hogy az adott sportról van szó, az abban szereplő sportolók nevét vagy épp a meccs eredményét is értelmeznie kell. Az AI dolgát tovább nehezíti, ha egy szó egy bizonyos kontextusban többféleképpen is értelmezhető, mint például a szleng esetében. A hab a tortán a különböző nyelvek kezelése, hiszen a közösségi oldalt a világ minden táján használják.

A fenti problémákra a deep learning jelent megoldást, amellyel a vállalat szerint a hagyományos, természetes nyelvfeldolgozó eljárásokhoz képest (Natural Language Processing, vagy röviden NLP) jelentősen hatékonyabban értelmezhetők a különböző nyelvű tartalmak. Míg a korábbi NLP megoldásoknál komoly nyelvi ismeretekre építő előfeldolgozás szükséges, a deep learning esetében nincs szükség ekkora mennyiségű nyelvfüggő előismeretre, azt a rendszer lényegében a szövegből tanulja meg, így gyorsan és kis energiabefektetéssel képes számos nyelvvel megbirkózni. A DeepText egyébként a cég szerint több neurális hálózati architektúrára is épít, és a szavak, illetve karakterek szintjén is képes tanulásra.

A vállalat egyelőre nem engedte rá a DeepTextet az oldal teljes felületére, bizonyos részein azonban már teszteli azt. Ilyen például a Messenger, ahol a rendszer a beszélgetést figyelve a felhasználók későbbi szándékait is értelmezi, és akár az üzenetek között feldobhat releváns ajánlásokat. Ha például egy beszélgetés során az egyik fél azt írja, hogy mindjárt hív egy taxit, az AI automatikusan feldobhat egy valamely taxitársaság rendelőoldalára vezető linket. De a későbbiekben a megoldás az egyes posztok, illetve az alattuk lévő hozzászólások rangsorolásában is hasznos lehet, azokat értelmezve ugyanis a rendszer mindig a felhasználó érdeklődésének leginkább megfelelő tartalmakat veheti előre. Mindezek mellett a vállalat már a képi tartalmak deep learning technológiákra építő felismerésén és értelmezésén is dolgozik.

A közösségi oldal törekvései erősen emlékeztetnek a Google nemrég zárult idei fejlesztői konferenciáján elhangzottakra, ahol a vállalat bemutatta saját intelligens virtuális segédjét, illetve a fentiekhez hasonló képességekkel felszerelt Allo chatkliensét. A csevegőapp értelmezi a beszélgetéseket és válaszokat is ajánl üzenetváltás közben, az adott kontextusnak és a felhasználó stílusának megfelelően. A keresőóriás egyelőre úgy tűnik jócskán a Facebook előtt jár a területen, miután az említett appban a küldött képek értelmezése is jelen van, azok kapcsán a szöveges üzenetekhez hasonló ajánlásokat kapunk - mindezt ráadásul már kész termékben. Emellett a Google már jó ideje elérhető, ugyancsak impresszív képfelismerési képességekkel rendelkező Photos szolgáltatásáról sem érdemes megfeledkezni.

Fontos különbség azonban, hogy míg az Allóban bekapcsolható a titkosítás, vele együtt pedig kiiktatható a cég AI-alapú ajánlója is, a Facebook esetében erre nincs lehetőség. A DeepText megállás nélkül tanul, másodpercenként több ezer poszton rágja át magát, beleértve a privát üzeneteket is, és bár a pontosabb ajánlások mellett az online zaklatás és spam kiirtására is pont ez teszi kifejezetten alkalmassá, a gyakorlat etikailag megkérdőjelezhető - olyannyira, hogy korábban a privát beszélgetések elemzése kapcsán nemrég Észak-Kaliforniában perbe is fogták a céget.

Akárhogy is, az AI-verseny egyre éleződik, legyen szó virtuális asszisztensekről, chatbotokról vagy egyéb szolgáltatások mögé állított gépi tanulási rendszerekről, a vállalatok pedig azok tanítására és a termékek csiszolására egyre elszántabban, egyre több adatot gyűjtenek be a felhasználóikról. Nem valószínű, hogy ez a folyamat belátható időn belül mérséklődne, a kérdés inkább az, mennyire lesz az transzparens a cégek részéről a felhasználók felé.