Szerző: Dojcsák Dániel

2010. május 28. 14:13

A Google lenyúlásával vádolják a magyar keresőt

Óriási fiaskó omlaszthatja össze a hazai webes startupok egyik ígéretesnek tűnő versenyzőjét, a Szörcs.hu-t. A tegnap publicitást kapott vádak szerint a Szörcs nem a Google hazai kihívója, hanem annak lemásolója.

Indulása óta folyamatosan támadják a Szörcs.hu-t azzal, hogy nem önálló keresőről, hanem a Google találatainak újrafelhasználásáról van szó, de a SEOBlog tegnapi blogbejegyzése keményen falhoz állította a szolgáltatást, ez alkalommal az őszinte válaszadás már nehezen kerülhető meg.

\"Kevés webes szolgáltatás végez több számítási műveletet, mint a keresők. Egyetlen Google-lekérdezés átlagosan több száz megabájtnyi adatot olvas be, és futtatásához több tízmilliárd processzor-ciklus szükséges. A beáramló keresések ezreinek kiszolgálását pedig csakis a legnagyobb méretű gépparkok képesek ellátni.\" - írják a Google mérnökei a keresőszolgáltatás szerverarchitechtúrájáról szóló anyagban. A fenti tény ismerete már éppen elég szkepticizmust kelthet a Szörcs.hu-val kapcsolatban, ami azt állította magáról, hogy teljesen saját keresőindexekkel dolgozik.

Vetítés?

Azt ugyan Sajtos István (Zerking), a Szörcs fejlesztője elismerte már korábban, hogy Google- robotnak álcázzák saját \"crawler\" robotjukat, ami válasz lehetett volna arra, hogy a weboldalak üzemeltetői miért nem látnak a szerverük naplófájljaiban Szörcs robotokat. A szakmán belül jó ideje a legtöbb szereplő biztosra veszi, hogy a Szörcs nem rendelkezik ilyen technológiával, hanem a felületükön bevitt keresésekre valós időben indítanak egy Google, Yahoo és Bing keresést, majd a kapott listák kiválasztott elemeit saját paramétereik szerint súlyozva, átalakítva jelenítik meg. Ez persze egyelőre csak egy feltételezés, akkor is, ha a legvalószínűbb forgatókönyv. Szerkesztőségünk megkereste a Szörcs.hu fejlesztőit, de ezidáig nem reagáltak.

A SEOBlog szerzője, Türk István néhány nappal ezelőtt egy levélben állította pellengérre a Szörcs.hu-t, amit indulásként csak az illetékeseknek küldött el, akik ma délre ígértek választ. A SEOBlog levelében egyértelmű bizonyítékok tárt fel arra vonatkozóan, hogy a Szörcs.hu valójában a Google találatait lopja el, s használja fel újra. A blog szerzője, aki egyébként hivatásként is keresőoptimalizálással foglalkozik, azt vette észre a levél elküldése után, hogy a Szörcs találati listájából fokozatosan tűnnek el az általa idézett találatok. A kozmetikázás értelmezhető egyfajta beismerésként is, hiszen igyekeztek kézzel eltüntetni a nyomokat, épp ezért Türk a levelét tegnap nyilvánosságra hozta, nyomatékot adva ezzel a témának.

A Szörcs.hu keresővel kapcsolatos korábbi kérdésekre Türk szerint \"mellébeszélés ízű\" válaszok érkeztek, de ennek ellenére szeretné az érintettek megkérdezésével bemutatni a Szörcs valódi működését. Az nem probléma, ha valaki egy másik szolgáltatásra ráépülve saját hozzáadott értéket tud felmutatni, például a Google indextábláit felhasználva működik, bár az indexek másolása a Google kereső felhasználási feltételeibe ütközik megfelelő megállapodások híján. A gond az, hogy más hasonló magyar kezdeményezésekkel ellentétben a Szörcs mindvégig azt állította magáról, hogy működése teljes egészében saját technológián alapul. Ez az inkorrekt magatartás Türk szerint megvezeti mind a felhasználókat, mind a webes szakmát.

Igaz vagy hamis

Egy forrásunk szerint a webes szakma néhány képviselőjének, akik közeli kapcsolatban állnak a Szörcs fejlesztőivel, végig tudomásuk volt a Szörcs valódi működéséről, de ezt elhallgatták, annak ellenére, hogy lehetőségük lett volna felhívni a problémára a figyelmet. Egy más forrásból származó információ szerint viszont a Szörcs korábban átesett egy alapos verifikációs folyamaton, ami nem tárt fel más keresővel való kapcsolatot.

A SEOBlog kísérletei alapjában véve arra a módszerre épülnek, hogy megvizsgálják a találati listákban lévő elemeket, s összehasonlítják a két érintett kereső eredményeit. Az első gyanújel, hogy egy vasárnap délután élesített SEOBlog bejegyzés oldala a Google kereső után egy perccel a Szörcs által is indexelve volt, de a webszerver naplófájljai szerint az oldalt abban az időszakban nem látogatta meg semmi, leszámítva a Google és a Yahoo keresőrobotjait, illetve egy Facebook-szolgáltatást és egy Androidos mobiltelefont.

Komoly vádak

Mivel a Szörcs azt állítja, hogy Google robotnak álcázza magát, ezért a vizsgálat kiterjedt az IP-címekre is, de ez azt támasztotta alá, hogy a Google Botok mindegyike a Google tulajdonában lévő tartományokból érkezett. Ha tehát ezek között ott lett volna a Szörcs robotja, akkor ahhoz meg kellett volna hamisítaniuk az IP-címüket is, ami nem valószínű.

A további kísérletek olyan oldalak \"snippetjeit\" vizsgálta, ami a kliens IP-címét adja vissza az oldalon. Ilyen például a felhasználók IP-címét megmutató szolgáltatások mindegyike. A betteripaddress.com vagy az ipcimed.hu találati szövegeiből kiderül, hogy a Szörcs.hu minden esetben ugyanazt, az egyébként a Google-höz tartozó IP-t adja találatként, mint a Google. Természetesen a Bing vagy a Yahoo találatai mind-mind saját IP-t mutatnak. Ehhez hasonló leleplezés volt korábban, hogy a látogatóknak az URL-ben is tárolt egyedi azonosítót adó weboldalaknál is pontosan ugyanaz az ID került a Szörcsbe, mint ami a Google-be. A kísérletek részletes leírása, és a nyílt levél olvasható a SEOBlog bejegyzésében ezen a linken.

A mai nap folyamán a Szörcs.hu továbbra sem reagált érdemben, mindössze annyi történt, hogy délelőtt a legtöbb keresési kifejezésre a \"nincs találat\" üzenet érkezett. Közben a kísérletben szereplő oldalak mindegyike eltűnt a keresőből, az összes IP-cím kikerült a snippetekből, illetve a friss tartalmak indexelése láthatóan nem történik meg. Feltételezhetően a jelen állapot tükrözi a Szörcs saját, mentett indexeit, s most a valós idejű Google segítség már nem működik. Így viszont a találati oldalak minősége, frissessége nyomába sem ér az eddiginek. A Twitter üzenetek megjelenítése viszont továbbra is él, a szolgáltatás egyéb részein nem érezhető változás.

Kár érte

Az eset azért sajnálatos, mert sokan lelkesedtek a Szörcs-ért, s alapjában véve támogatható lett volna a projekt úgy is, ha nem állítják, hogy saját megoldással pásztázzák a webet, hiszen a keresési találatok felé épített többi szolgáltatás mind korrekt és sokak számára hasznos. A közösségi tartalmak indexelése, a háttérkép, a keresési trendek mind érdekesek, de amennyiben kiderül, hogy a Szörcs végig a Google találatain élősködött és mindvégig ennek ellenkezőjét állította, az a teljes szolgáltatás hitelét veheti el.

A HWSW a témával kapcsolatban a Szörcs.hu illetékesein túl megkereste a Google-t is, de a válaszokat csak hétfőre ígértek, amint ezek beérkeznek, vagy újabb részletekre derül fény, a cikket frissítjük.

Update: Sajtos István, nyílt levélben válaszolt az őt ért vádakra. A levelet teljes terjedelmében közöljük, amely az alábbi linken olvasható:

[+] Sajtos István: Nyílt levél az IT szakmának

 

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról