Szerző: Dojcsák Dániel

2011. január 20. 12:13:00

Az agykutatás felé halad a webkeresés

Galyatetőn zajlik a SuperSEO konferencia, ami az első nagy rendezvény itthon keresőoptimalizálásról és forgalomelemzésről. A vendégek közt egyaránt jelen vannak a SEO-val foglalkozó szakemberek, a keresőhirdetéssel foglalkozók, illetve a felülettulajdonosok is, akik a fenti két funkciót végeztetik saját szolgáltatásukon.

Az előadók között érthető okokból erős a Google-jelenlét, a konferencia indító beszédet Heal Edina, a Google Magyarország vezetője tartotta, majd Vadász Illés, a hazai iroda Analytics-szakértője, illetve a dublini Google-iroda Search Quality Team vezetője, Nebehaj Viktor osztotta meg a keresők és webes tartalmak kapcsán a Google részéről elárulható praktikákat, tudást és tapasztalatot.

Mit gondoltunk 10 éve a webes keresésről

Az előadások többségében fókuszált, gyakorlati megközelítésűek voltak, az egyik kivételt Gerényi Gábor Index-társalapító, MTE-elnök prezentációja jelentette, ahol azt próbálta meg felrajzolni,  milyen irányba halad a webes keresés. A Retrospektív jövőkutatás cím eleve paradox, de Gerényi a jövő megfejtéséhez először visszanyúlt 10 évvel korábbra. Az AI című film, amit Steven Spielberg és Stanley Kubrick közösen jegyez, nagyon jól példázza, hogy mit vártunk 10 évvel ezelőtt a  kereséstől: a kék tündért kereső kisfiú pénzért teheti fel a kérdéseit, hiszen semmi sem drágább, mint az információ. A keresés kontextusalapú, az adatbázis mindent tartalmaz, ami írásosan, szövegekben fellelhető a világról. Akkoriban viszont azt hitték, hogy a fejlett keresőt nem lehet az otthonokba vinni, hanem el kell menni hozzá, mint egy bankautomatához.

3:54

A.I. - Artificial Intelligence....Looking for the Blue Fairy........

Lorem ipsum dolor sit amet, consectetur adipisicing elit. Doloribus consectetur eaque tempore natus obcaecati ratione ipsum.

Még több videó

A filmrészlet tanulsága az, hogy az információkeresés valóban óriási fejlődésen ment keresztül, s tényleg a világ szövegesen tárolt tudásbázisának jelentős része elérhető már a weben, és így kereshetővé is vált. Ebbe beletartozik az elmúlt időszakban eleve a weben létrejött tartalom, a felhasználói tartalom, a digitalizált könyvek, adatbázisok illetve adott esetben a “mély web” is, ami a nem szerkesztett szövegeket, ember által értelmezhető információkat, hanem a háttéradatbázisokat, gépi adatokat jelenti.

Értelmezési gondok

A 10 évvel ezelőtti jóslat azon része is bejött, hogy a kereső továbbra sem képes értelmezni az emberi nyelv finomságait, s ahogy a filmben a kisfiú nem a gépnek szóló kérdését is magára vette és megválaszolta, úgy a mai keresők sem tudnak különbséget tenni, hogy a “vészhelyzet” szóra keresve az amerikai sorozatra gondoltunk, vagy éppen azt szeretnénk tudni, hogy kell elállítani egy  vérzést vagy hívni a mentőket.

A látványos kezelőfelület a filmből viszont egyáltalán nem valósult meg, sőt az emberarcú számítógép elmélete egyre jobban kikopik. 10 év alatt rájöttünk, hogy a minimalista, egyszerű, átlátható kezelőfelületek hasznosabbak, praktikusabbak és a hétköznapokban könnyebben használhatóak, mint a csilli-villi, animált, túlgondolt megoldások. Az sem jött be, hogy fizetni kell a keresésért, pedig 12-15 évvel ezelőtt, amikor a keresők főoldalai tele voltak hirdetéssel, senki nem gondolta, hogy a bannerek nélkül, vagy fizetés nélkül működhet ilyen szolgáltatás.

Hazavittük a webet, most meg elvisszük otthonról

A Google persze felforgatta a piacot, s a kereső után néhány évvel kifundált AdWords rendszer megoldotta a bevételek kérdését is, illetve felületben is a Google mutatott utat, amit mostanság épp a Bing próbált feltörni egy színesebb keresőoldallal. Az otthonokba való eljuttatás akadályát régen a kis teljesítményű PC-k és a kevés sávszélesség miatt gondolták, de ma már látjuk, hogy mobilon is több tíz Mbps sávszélességet tudunk elérni, s egyáltalán nem látszik, hogy a technológia megrekedt volna, a mai okostelefonok számítási kapacitása nagyságrendekkel nagyobb, mint az Apollo 11 űrprogram teljes számítógépparkjáé, sőt, ma már egy mosógép is nagyobb számítási kapacitással rendelkezik mint az az űrhajó. Már nem az számít meglepőnek, hogy hazavisszük a weben elérhető szolgáltatásokat, hanem az, hogy elvisszük otthonról a zsebünkben.

Gerényi szerint ma már nincs elveszett ismerős, nincs beszerezhetetlen termék és nincs elfelejtett adat. Viszont továbbra is egyértelmű, hogy a webes keresés szöveg alapú. Ha videókat vagy képeket keresünk, akkor is többnyire címkékben turkálunk vagy címekre, leírásokra keresünk. Pedig ahogyan az újságot követte a rádió, majd a tévé, úgy a szöveges keresést is fel kell váltsa a hang és a kép, illetve a távoli jövőben, az emberi test működésének jobb megismerésével egyre több biotechnikai megoldás jön majd szembe.

Digitális lenyomatok

A hangfelismerést és a képazonosítást eredetileg a tudósok a számítógépek irányítására, vezérlésére gondolták ki, de ez régen és most is interfész hibákhoz vezetett. Még most is nagyon messze vagyunk attól, hogy a hangfelismerés teljesen jól működjön, akár gépvezérlésre, akár kommunikációra. A probléma leginkább az, hogy az egyedi hangszínekkel, illetve a nem tökéletes kiejtéssel és a kommunikációs zajjal a felismerők nem sok mindent tudnak kezdeni, s a helyes felismerés aránya nagyon nem akar 90 százalék felé menni. Így a keresésben közvetlenül nem tudjuk használni.

A hiányosságok ellenére viszont már most is használhatunk hangalapú keresést, amire még ég Magyarországon is van  jó példa. Emlékezzünk a néhány évvel ezelőtt 200 millió forintért készített kormányszóvivő.hu oldalra, amely a nagy felhajtás közben elfeledtette a legtöbb emberrel, hogy a szolgáltatás mögé odatették a Mimóza nevű cég Mindroom szolgáltatását, ami a videóanyagokban található beszédet igyekezett felismerni, s a felismert szavak alapján az adott videót időkódokkal ellátva felindexelte és kereshetővé tette. A 90 százalékos pontosság itt pedig jó, mert minden elhangzott 1000 szóból 900-ra rá lehet keresni.

Hasonló keresőtechnológia működik a zenefelismerésben is. Egyrészt akkor, amikor a mobilunkkal a Shazam segítségével szeretnénk azonosítani egy számot, másrészt akkor, amikor a YouTube a szerzői jogvédett tartalmak kizárása érdekében előszűri a feltöltött videók hangsávjait. Egy algoritmus a kiadóktól kapott hangzóanyagokat végigdarálva készít minden számról egy, a felvétel és a keverés során kialakuló egyedi, nem összetéveszthető egyedi hanglenyomatot. Ezzel a módszerrel az adatbázisban lévő hanganyagokat 100 százalékos pontossággal ismerhetjük fel, azaz kereshetjük őket. Mellette pedig léteznek dallamfelismerő algoritmusok is, amiknek akár fütyörészhetünk is.

A csajozás a fejlődés motorja

A másik érdekes terület az arcfelismerés. Mindenki tudja, hogy a technológiai fejlődés egyik hajtómotorja a csajozás/pasizás, s ez hatványozottan igaz az internetre. A Facebook már jelenleg is rendelkezik egy olyan masszív adatbázissal, ami egyaránt tartalmaz a személyiséget leíró adatokat és képi információkat, nem vagyunk messze attól, hogy valaki specifikálja, hogy milyen lány tetszik neki és a rendszer keres neki megfelelőt.

Ugyanerre a Google is képes lehet, s nem titok, hogy a cég erősen dolgozik képfelismerő algoritmusokon. A keresőben már most is képes a rendszer felismerni arcokat, s a Picasa albumban  egy korábban felcímkézett arcot gyakran felismer újabb képeken is. A Google Similar Images funkció pedig már most elkészíti az indexelt képek kicsinyített digitális bélyegét, ami alapján egymáshoz tudja rendelni az azonos témájú, színű vagy egyéb paraméter alapján összefüggő képeket. A Facebook milliárdos fotóadatbázisa csak arra vár, hogy valamilyen fejlett értelmező rendszer bányászni kezdjen benne...

Ha pedig kissé elrugaszkodunk a jelenlegi eredményektől, s a science-fiction magasságokba emelkedünk, akkor Gerényi szerint érdemes a biológiai technológiák felé nézegetni, az agykutatás és az adatbázis-kezelés kombinációját összerakni. Ugyan ma még csak vízió szintjén létezik elképzelés arra vonatkozóan, hogy az agy emlékképeit képesek hogy lehetünk kiolvasni, de hosszútávon ez elképzelhető lehet. Ugyan csak sci-fi, de jó eljátszani a gondolattal, hogy a videokamera feleslegessé válik, mert az emlékeket ki lehetne menteni az agyból, s a szemünk által látott képeket újra lehet nézni valamilyen formátumban. Tudnánk keresni a tegnap éjszakai álmainkban, meg tudnánk nézni, hogy kivel találkoztunk 20 éve vagy hogy hol voltunk tavaly nyáron. Ez egyébként a Futurama című rajzfilm Apple-t kritizáló "EyePhone" epizódjában tűnik fel, ahol az agyba épített okostelefon minden látott képet rögzít, s azonnal meg is lehet osztani azokat.

Sci-fi: elhiszed?

A biotechnológia és az informatika közeledésének jelenleg a legnagyobb akadálya, hogy nem vagyunk képesek közös interfészt építeni, illetve az információ szervezése nagyon más az emberi agyban, mint az ember által épített számítógépben. Viszont nagyon érdekes, hogy a jelenlegi tudásunk szerint az agyban tárolt emlékek rendszerezése asszociatív, mondhatni linkeken keresztül működik, azaz egészen hasonlóan, ahogy ma az internet tartalma felépül.

Miért érdemes belevágnod a Scrum képzésünkbe? (x) Október 21-én Scrum alapozó képzést indít a HWSW, íme néhány jó érv a kurzus mellett.

Az emberi agy is fogalmakat és képeket tárol, s azokat logikai alapon köti össze. Amennyiben a fenti fejlődés megtörténik és képesek leszünk az agyban tárolt információkat kinyerni, akár 50-100 éven belül, akkor Gerényi víziója szerint létrejönnek majd a mostani PageRankhez hasonló algoritmusok. Ijesztő ez is, mint minden komoly fejlődés. Ha még nem is a biotechnikát vesszük alapul, csak a jóval kézzelfoghatóbb hangfelismerést, akkor is adja magát a helyzet, hogy a SEO összeér a retorikával, s a közszereplőknek meg kell tanulnia úgy beszélni, úgy nyilatkozni, hogy az keresés szempontjából releváns legyen.

A Galyatetőn szervezett konferencia természetesen nem a jövővel, inkább a jelennel foglalkozik, s a résztvevők elégedetten állhattak fel az előadások után, ahol a keresőoptimalizálás műhelytitkaival, trükkjeivel ismerkedtek meg, a gyakorló SEO és webanalitikai vagy egyéb keresővel foglalkozó szakemberek véleményét kérdezhették meg arról, hogy egy webshop, szöveges tartalomszolgáltató vagy webes szolgáltatás üzemeltetője mit tehet azért, hogy nagyobb, jobb, használhatóbb forgalom kerüljön az oldalára.

a címlapról