Szerző: Dojcsák Dániel

2013. szeptember 27. 15:36:00

Új algoritmus van a Google alatt

Nehéz elhinni, hogy a weben bármi képes egy bizonyos fokú állandóságot mutatni, de a Google webkeresője az elmúlt 15 évben alapjait tekintve alig változott külsőre. Megmaradt az egyszerű, tiszta beviteli mező, a szöveges, kék linkekkel és zöld paraméterekkel jelzett találati lista. A motorháztető alatt azonban folyamatos a forradalom.

A saját születésnapra időzítve jelentette be a Google legújabb, Hummingbird névre keresztelt algoritmusát, ami egy sokkal természetesebb nyelvi környezetben is megállja a helyét. Az ígéretek szerint az új keresőmotor nem igényli már a nagyon szögletes, kulcsszavakra épülő keresőkifejezéseket és sokkal több és sokkal komplexebb kérdést képes megválaszolni úgy, hogy valódi választ ad és nem egy listányi relevánsnak ítélt weboldal linkjét.

A Google tovább folytatja hadjáratát, amiben egyre több tartalomszolgáltatót, adatbázist és szolgáltatót rémít meg azzal, hogy a jól bevált forgalomátirányítás helyett a kereső maga válaszolja meg a feltett kérdéseket. A Knowledge Graph bevezetésével már mindenki érezhette, hogy ez az irány, de az a modul csak a hátsó része volt a rendszernek, szükség volt egy olyan algoritmusra is, ami a keresőmezőbe beírt szavakat, vagy éppen a mikrofonba odavetett hangsorokat képes értelmezni és a fogalmi felhő segítségével listák helyett valódi tartalmat visszaadni rá.

Igazi válaszok

A tizenöt évvel ezelőtt egy garázsból induló cég születésnapján igyekszik lenyűgözni felhasználóit és részvényeseit azzal, hogy a továbbra is a legerősebb termékként jelen levő kereső roadmapjének újabb fejezetét mutatja be. Ez pedig nem más, mint az eddig leginkább mechanikus keresőfunkciókat felváltó intelligens megoldások, a Google Now prediktív és statisztikai elemzésen alapuló megoldásainál is látható képességek sora. A legszembetűnőbb változás, hogy az egyre inkább mobilra hangolt felületen a kereső az eddigi találati lista helyett valószínűbb, hogy válaszokat köp majd ki magából. A válaszok a felhasználóban további kérdéseket szülhetnek, ezeket fel is teheti és szép lassan eljutunk oda, hogy egy természetes beszélgetés alakul ki ember és gép között.

A fejlesztések között az egyik legérdekesebb újdonság egy új összehasonlító logika. Két fogalom összehasonlításában a keresők közül eddig egyedül a Wolfram Alpha jeleskedett, de a Google nem hagyta sokáig élni ezt az exkluzivitást. A bemutatón a Google néhány példán keresztül mutatta meg, hogy is néz ki működés közben a funkció. Az amerikai angol nyelvű felületet használva érdemes beírni például a “compare butter with olive oil” vagy a “compare Earth and Mars” kifejezéseket. A felület még elég fapados, illetve a kifejezések köre is nagyon szűk, de jónak látszik az irány.

Beszélgess velem!

A keresőben a jövőben megszaporodnak majd az olyan képességek, amik egy adott keresés vagy kifejezés további megismerését teszik lehetővé. A képkereső már most is úgy működik, hogy egy többértelmű kifejezést beírva, kapunk egy sornyi kategóriát, ami felé tovább szűkíthetjük a találatokat. Ma ez még egy döcögős ping-pong játszma, de a Google egyre komplexebb kérdéseket képes feldolgozni már. Amit Singhal, a Google keresésért felelős alelnöke szerint a Hummingbird algoritmus sokkal inkább koncentrál koncepciókra, azok közti viszonyokra, mint egyszerűen a szavakra. A sok éven keresztül jól működő statisztikai módszertan felé egyre inkább beépül a mesterséges értelem is. Ugyan ma még ne kérdezzük meg a Google-től, hogy “miért vagyunk itt?”, de pár éven belül talán már erre is lesz válasza.

A Hummingbird eljövetele persze nem jelenti azt, hogy a meglévő keresőtechnológiák, algoritmusok és funkciók háttérbe szorulnának azonnal. A jövőben is működni fog a Google-t különlegessé tevő, ma már több mint 200 szignált figyelembe vevő rangsorolás. A klasszikus értelemben a PageRank ma már nem számít fontosnak, nem abszolút rangsorok vannak, a Google ma már egy adott szituációra keresi a releváns találatokat.

Machine learning és Scrum alapozó képzések indulnak! (x) A HWSW októberben induló gyakorlatorientált, 10 alkalmas, 30 órás online képzéseire most early bird kedvezménnyel lehet regisztrálni!

Érdekes, hogy a Hummingbird algoritmus bejelentése csak ma volt, de valójában már több mint egy hónapja élesben működik. A váltást érdekes módon senki nem vette észre, pedig a leírás szerint ez még a 2010-es “Caffeine” frissítésnél is nagyobb szintlépés. Az elmúlt években, ha valaki követte a Google keresővel kapcsolatos híreket, akkor hallhatott a Panda vagy a Penguine frissítésekről is, ezek viszont csak csiszolások voltak a meglévő algoritmuson, a Hummingbird viszont tényleg egy teljesen új motor. Vannak benne részek, amik már tökéletesnek számítottak az előző motorban is, azok valószínűleg átkerültek, kiegészülve az előzőhöz képest 10 évvel későbbi igényekre szabott beállításokkal és a legfrissebb technológiai előrelépések eredményeivel.

Egy kereső, mindenek felett

Míg a 2000-es évek elején az internetet egy nyilvános adatbázisként, lexikonként használhattuk, ma már egy rengeteg rétegből álló, bonyolult szerkezetű, a fizikai világot is átszövő hálózat. A Hummingbird éppen ezért nem áll meg ott, hogy az egymás mögé írt szavak és a saját indexének az összevetése alapján listáz lehetséges weboldalakat, amik érdekesek lehetnek, hanem igyekszik a szókapcsolatok mögé nézni. Ezt egyre inkább képes megtenni, hiszen a Google Translate, a Docs, a Gmail, a Now és általában véve az Android és a Google+ mind azt a közös célt szolgálja, hogy a Google képes legyen mesterséges eszközökkel kontextusokat jobban és pontosabban értelmezni.

a címlapról