Szerző: Bizó Dániel

2008. július 2. 18:20

Szemantikus keresőt vásárolt fel a Microsoft

Szemantikus keresőt vásárol fel a Microsoft. A Powerset bekebelezésétől a vállalat azt reméli, hogy olyan technológiát szerez, mellyel felvértezve saját keresőjét relevánsabb találatokkal szolgálhat a Google motorjánál.

[HWSW] Szemantikus keresőt vásárol fel a Microsoft. A Powerset bekebelezésétől a vállalat azt reméli, hogy olyan technológiát szerez, mellyel felvértezve saját keresőjét relevánsabb találatokkal szolgálhat a Google motorjánál.

Az ügylet értékét nem hozták nyilvánosságra a felek, becslések szerint 100 millió dollárt tesz ki a tranzakció értéke. Redmond lépése a Yahoo! kudarcba fulladt felvásárlását követő alternatív útvonal első jelentős lépésének tekinthető, melyen a keresési és online hirdetések piacán növekvő fölényt kiépítő Google-t igyekszik befogni. A Microsoft piacrészesedése dollármilliárdos erőfeszítései ellenére eltörpül a Google mögött, a comScore szerint a globális keresésekből a Google 62,4, a Yahoo! 12,8, míg a Microsoft 2,9 százalékkal rendelkezett tavaly év végén -- a kínai Baidu is magasan megelőzte erőteljes hazai jelenléte miatt, 5,2 százalékkal.

A jelenlegi domináns keresőmotorok alapját a kulcsszavak indexelése és a relevancia számítása képezik, melyek természetesen féltve őrzött titkok. Az algoritmusok ugyan rendkívül hatékonyak hatalmas mennyiségű információ megszűrésében és több kulcsszó megadása esetén többnyire a kontextus belövésére, és releváns találatokkal szolgálnak, nem képesek azonban a kulcsszavak jelentését felismerni, minőségükben megkülönböztetni, vagyis érteni -- ami nemcsak a szinonimák és azonos alakú szavak problémáját veti fel, hanem a magyar nyelvben például a ragozásét is.

A szemantikus keresőknek éppen az a célja, hogy egy magasabb szintre emeljék a keresőmotorok munkáját, vagyis a weboldalak jelentését tárolják el, ne csak a kulcsszavak mintáját. Ez természetesen teljes újrafeldolgozást igényel mélyreható, sokkal számításigényesebb elemzéssel, és a generált metaadatok tömege is hatalmassá duzzadhat. A végső cél az, hogy a kereső értse a különbséget a barack pálinka és a Barack Obama között, és ha rákeresünk a barack szóra, akkor csoportosítsa a találatokat jelentésüktől függően, és akár kérdést is lehessen intézni hozzá, melyet jó eséllyel képes megválaszolni a metaadatok tömegéből kibányászott információval.

A Powerset jelenleg, mint ahogyan a többi szemantikus kereső is, egyelőre demóz fázisban tart, és a Wikipedia cikkeit elemzi. A szemantikus feldolgozás legalább egy nagyságrenddel nagyobb számítástechnikai kapacitásokat igényel, így a kérdés nem csak algoritmikus, hanem erőforrásbeli. A Microsoft nem titkolt célja a Powersettel, hogy az egész webre ráeresszék a vállalat keresési infrastruktúrája segítségével. Az eddig kockázati tőkebefektetésekből működő vállalat alapítója és elnök-vezérigazgatója szerint 5 év múlva a jelenlegi kulcsszavas keresőkre úgy kell majd visszaemlékezni.

A technológiai váltás lehetőséggel kecsegteti a Microsoftot, hogy behozza hátrányát a Google-lel szemben, ugyanakkor ésszerűtlen volna azt feltételezni, hogy a keresés királya egy helyben áll, és nem érdeklődik a terület iránt. Valójában már most kínál olyan képességeket, melyekkel a szemantikus keresők kecsegtetnek, például a "hungary population" kulcsszavakra megadja az ország lakosságát, vagy a "light speed" keresésre kidobja a fény sebességét, de a "how old is madonna" is működik a mértékegységek és valuták váltása mellett -- ezek a mutatványok ugyanakkor szűk körre korlátozódnak jelenleg, és magyarul nem is működnek.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról