Szerző: Rátonyi Gábor Tamás

2003. augusztus 22. 13:02:16

Magyar keresők

Hat hazai keresőt: az Ariadnetet, Heurékát, HuDirt, Góliátot, a Kereső.hu on-line lexikont és a Vizslát fogtuk munkára, s próbáltuk előnyeiket-hátrányaikat összegereblyézni egy cikkben. A keresők kisebb-nagyobb hibákkal ugyan, de állták a próbát.

Alig néhány éve még hitviták folytak arról, melyik kereső az igazi, melyik az, melynek segítségével az internet legeldugottabb bugyrában is fel lehet lelni a keresett szóhoz leginkább passzoló honlapokat. Mára a nemzetközi keresők versenyének egyértelmű győztese és népszerűsége révén évek óta dobogósa a Google. Bár az ismert kereső már a netes szleng egyik szavának névadója is lett (guglizik ~ internetes keresőt használ), mégis sokan használják a kifejezetten magyar tartalmak indexelését ígérő hazai keresőket.

A keresőszolgáltatások rendre ugyanazon az elven működnek: a szolgáltató szerverén egy program (a robot) lehívja a weboldalakat, és azok szöveges vagy akár képes tartalmát a saját adatbázisába tölti. Ha a kereső alkotója úgy álmodta meg, akkor a robot figyelembe veszi a weboldal fejlécének meta tagjeibe rejtett utasításokat, így a szájt webmestere utasíthatja a robotot, hogy például indexelje-e a weboldalt, illetve hogy kövesse-e az oldalon található hivatkozásokat, vagy se.

A hazai keresőket vizsgálva számos innovatív ötlettel és szintén nem kevés javítani való hibával találkoztunk. A nagyobb, ismertebb keresőszolgáltatások közül egy hétig vizsgáltuk az Ariadnetet, a Góliátot, a Heurékát, a HuDirt, az [origo] Vizsláját és újdonságai miatt -- az egyébként nem a webes állományból tallózó -- Kereső.hu-t. Ennél azért valamivel bővebb a hazai kínálat, hiszen a fenti szolgáltatásokon kívül számos más kereső, adott esetben egy-egy szakmát kiszolgáló, tematikus böngészde kínálja magát az interneten.

A keresők jó és rossz minősítését alapvetően két szempontcsoport határozhatja meg: az egyik a beindexelt anyag mennyisége, minősége és frissessége, a másik pedig a találatokat sorba rendezéséért felelős relevancia-vizsgálat. Míg az előbbire viszonylag könnyű jól működő automatizmust kialakítani, a találatok értékét szinte lehetetlen minden látogató szája ízének egyformán megfelelően kialakítani. Ha valaki csak egy szót ír be valamelyik keresőbe (például a csokoládét), a kereső nem képes kitalálni, hogy az illető az édesség kereskedelmére, gyártására, történelmére volt-e kíváncsi, vagy csak egyszerűen édesszájú internetező lévén megkívánt egy kis kalóriabombát és interneten keresztül szeretne rendelni.

Itt persze a keresést végzőnek kell találékonynak lenni, hogy olyan kulcsszóval próbálkozzon, hogy a kereső a számára fontos találatokat a legnagyobb eséllyel adja vissza. Ám a találatok sorba rendezése, a számtalan weboldalon, a legkülönbözőbb szövegkörnyezetben előforduló kifejezések minél emészthetőbb formátumú tálalása mégiscsak a keresőt üzemeltető szakemberek feladata.


napi látogatók
keresések
indulás
Ariadnet
12 000
18 000 2001. július
Góliát
150 000
1200 000 2000. november
Heuréka
60 000
90 000
1996. október
HuDir
30 000
45 000
1995. augusztus
Kereső.hu
760
1 500
2002. november
Vizsla
48 000
200 000
1998. május2

1 = A Góliát a keresőt használó valamennyi portál összesített látogatási adatait adta meg.
2 = 1998 májusában Altavizsla néven indult a kereső

[oldal:Ariadnet]

Az Ariadnet a keresők kivételezettje lehetne, hiszen fejlesztéséhez jelentős költségvetési támogatást kapott: még az Informatikai Kormánybiztosság által kiírt pályázaton 23 300 000 forintot nyert a Hudirt, Heurékát és az Ariadnetet fejlesztő és üzemeltető Hungary Network Rt. (HN) a magyar metakereső programozására, amit kiegészítettek a szintén fejlesztésre fordított saját, mintegy hétmillió, és az üzemeltetésbe fektetett, további hárommillió forinttal. Radnai Tamás, a részvénytársaság igazgatója elmondta, hogy a szerződés értelmében 2 évig nekik kell üzemeltetniük a keresőt -- minden további állami támogatás nélkül.


Ariadnet

A "magyar meta" -- hasonlóan külföldi társaihoz -- nem végez önálló webes indexelést és keresését, hanem a kínálatában szereplő keresőknek küldi szét a keresendő kifejezést, majd a találatokat saját maga rendezi sorba és a forrás megjelölésével tálalja.

Az Ariadnet hazai keresőkínálata a metakereső indulása óta eggyel csökkent: tavaly júliusban a Vizsla még szerepelt a meta kínálatában, ám az [origo] kérésére a HN kénytelen volt törölni választékából a legnagyobb keresőt. A korábban már elhíresült axeleros stratégia (HWSW 2002. november 20.) értelmében a kiadó tartalmát csak a saját üzemeltetésében lévő portálon látják viszont szívesen, így a magyar metakereső sem veheti át a Vizsla találatait. Radnai elképzelése szerint a közeljövőben újra megkeresnék a Vizsla üzemeltetőjét, hiszen a szigorú stratégiát meghatározó axeleros munkatárs azóta már távozott a cégtől.

Más gondok is voltak az Ariadnettel: az egyhetes vizsgálódás ideje alatt egyetlenegy alkalommal sem sikerült találatot kicsikarni az angol és német nyelvű keresőkből -- az igazgató szerint valószínű, hogy az általuk használt portról a keresők nem engedik kiolvasni a találatokat --, s úgyszintén nem működött a Hírkereső és a Wahoo bejelölésével végzett metakeresés sem. Noha Radnai szerint legalábbis egy értesítés erejéig az Ariadnet fejlesztésekor valamennyi kereső üzemeltetőjét megkeresték, ennek ellentmond a Hírkereső és a Wahoo üzemeltetőjének nyilatkozata, aki állítja: soha nem kaptak levelet a HN-től, és nem is tartják követendő példának a találatok megjelentetését az Ariadneten.

A szakma képviselői közül többen úgy nyilatkoztak: a tartalomátvétel legnagyobb problémája, hogy a tartalom megjelenéskor felbukkanó hirdetési felület értékesítésekor a tartalmak eredeti összeállítója nem részesedik a bevételből. További fájó pontnak bizonyult, hogy míg a keresők fejlesztői saját maguk fektettek bele időt és pénzt a keresőmotorok csiszolgatásába, a HN jelentős állami dotációval építette fel a metakeresőt.

Radnai szerint a hirdetési felület problémájának az áthidalására számos megoldás van, melyek jórészt a bannerekből származó bevételek megosztását jelentik. Mint az igazgató hozzátette: érzése szerint a metakereső fenntartása közérdek, így több megértést várna a piaci szereplőktől. Az egyre karcsúbb választékú metakereső értékét tovább csökkenti, hogy olyan kereső is szerepel a kínálatban, melyet tulajdonosa legalább két-három éve magára hagyott: a Magyar Honlap Katalógus (MHK) használhatósága a látványos, régóta kijavítás után kiáltó hibák, a kitörölhetetlen hamis találatok és a magárahagyott vendégkönyv alapján megkérdőjelezhető. Az MHK-n fellelt szerzői jogi deklarálás 1999-ig szól, a kereső üzemeltetője pedig 2000 óta nem válaszolt a látogatók vendégkönyvbe írt kérdéseire.

Pedig ez a kereső azonban éppúgy teljes jogú tagja a magyar meta kínálatának, mint az Index, mely már régen beszüntette a cseh Czentrum technológiáját használó kereső üzemeltetését, így az Ariadnet találati oldalán sem látható indexes keresési eredmény. Ilyenformán az induláskori 12-ről 5-re csökkent a használható találatokkal kecsegtető keresők száma. Radnai ugyanakkor elmondta, hogy az Ariadnet és a HN két saját költségből fejlesztett keresője is megújulás előtt áll: ígérete szerint szeptemberre kijavítgatják az Ariadnet hibáit, és megszűrik a keresőkínálatot.

A kereső hazai viszonyok között elveszni látszó előnyei mellett egy érdekes szolgáltatással is bír, mégpedig a szinonimák felkínálásával. Ha egy szót beírva a szinonimák feliratra bökünk, az Ariadnet felkínálja az általa ismert, hasonló jelentésű szavak listáját, amelyekből választva vagylagos alapon bővíthetjük a keresést.

[oldal:HuDir és Heuréka]

A HuDir és a Heuréka a magyar internet hőskorát idézik, hiszen ez a két legrégebbi hazai kereső -- a HuDir néhány héttel az ismert Yahoo webes felbukkanását követően indult. Mindkettő az Ariadnetet is üzemeltető Hungary Network Rt. "találmánya", s bár már eljárt felettük az idő, Radnai Tamás lát fantáziát a továbbüzemeltetésben.

A Heuréka használhatóságát jelentősen korlátozó hiba, hogy a beindexelt oldalak működését a kereső képtelen később ellenőrizni, így számos fals találat kerül a látogató elé. Évekkel korábban elköltözött weboldalak, megszűnt szájtok borzolhatják a keresést végzők idegeit, így minden más előnye, a találatok pontosságát meghatározó relevanciavizsgálat viszonylagos megbízhatósága ellenére is a konkurens keresőknél gyengébb eredményt produkál a Heuréka.

Könnyen kezelhető, bár nem mindig működik jól a Heuréka szűrője: szűkíthetünk csak magyar oldalakra, vagy friss lapokra, valamint egyetlen domaintartományra is. Ugyanakkor ha csak a friss lapokat választjuk, a több éve elköltöztetett, mára 404-es hibajelzést adó oldalak is belekeverednek a találatok közé.

Radnai szerint az ismert hiba ellenére is érdemes fejleszteni a Heurékát, ugyanis egy jól meghatározható célcsoport ismeri és kedveli ezt a szolgáltatást: az akadémiai-, felsőoktatási- és a közigazgatási hálózat használói az igazgató állítása szerint ragaszkodnak a Heurékához. Ennek egyik magyarázata pedig az lehet, hogy -- a Vizslához hasonlóan -- a kereső képes egyetlen domaintartományra szűkíteni a találatokat, így például olyan óriási adatmennyiséget tartalmazó hálózatok anyagában is lehet keresni, mint például az elte.hu, vagy a bme.hu.

A Hungarian Directoryból rövidített HuDir inkább katalógus típusú keresőként ismert. Itt nem robotok végzik az indexelést, hanem a látogatók küldhetik be az általuk jónak tartott weboldalak címét, melyet a kereső munkatársai egy, a könyvtáraknál használatos tematikus katalógushoz hasonló struktúrába illesztve tesznek hozzáférhetővé.

Megállapításunk, miszerint a HuDirra is ráférne egy kis átalakítás, összecseng a Radnai által említett tervekkel. Jelenleg ugyanis a HuDir szabadszavas keresőjét használva a találati lista tételeinek egymásutániságában semmiféle logika nem fedezhető fel, hacsak az nem, hogy az adatbázisba kerülés időpontja szerint rendeződnek a találatok, ami a látogató számára minden, csak nem segítség. Ráadásul a HuDir kifejezésre nem, csak szavakra képes keresni, így például a köztársasági elnök kifejezés idézőjelek közti beírásakor az első tíz találat közt szerepel egy vidéki közéleti havilap 1999-es száma, benne egy helyi részvénytársasági elnök beszámolójával.

Radnai szerint a HuDir is jelentős átalakítás előtt áll: várhatóan idén ősszel kerül sor a Heuréka, HuDir és az Ariadnet hibáinak korrigálására, és közelebbről nem részletezett látványos újdonságokat is ígért az igazgató.

Ugyanakkor igen használható és pontos találatokat ad a HuDir tematikus katalógusa: a könyvtárak katalógusaihoz hasonlóan többrétegű, strukturált adatbázis -- legalábbis a kevés bejegyzést tartalmazó címszavak esetében -- hasznos segítség lehet a neten eligazodni vágyóknak. Ugyanakkor a több bejegyzést tartalmazó címszavak -- mint például az Egyetemek és főiskolák -- éppúgy követhető rendszer nélkül mutatják a találatokat, mint a szabadszavas keresés esetén.

[oldal:Góliát, Vizsla]

A Góliát több, mint egy webes kereső: az üzemeltető GFX Studio ismertetője több olyan keresőtechnológiát említ, melyet más portálok, vállalati weboldalak is alkalmazni tudnak. A Góliát technológiára többféle keresőmotort építettek, melyek közt van egy-egy tudományág, szakma képviselőit érdeklő weboldalakról és a terminológia kulcsszavaiból összeállítható adatbázis éppúgy, mint például a gyermekekre veszélyes tartalmat szűrő kereső is.


Góliát

Magát a Góliátot egyébként nem csak az ismert www.goliat.hu címen használhatjuk, hiszen Góliát motor hajtja például az Index keresőjét, illetve a Startlapét is. Maga a kereső jó ötletekkel és bosszantó hibákkal egyaránt rendelkezik: az opcionált lista találatainak továbbszűkítésének lehetősége például egy hasznos, más hazai keresőkről hiányzó szolgáltatás, azonban a beviteli mezőben lévő kifejezés karaktereinek átkódolása miatt gyakorlatilag használhatatlan.

A legegyszerűbb, legkezelhetőbb szűrővel is itt találkoztunk: a teljes web, illetve a .hu domaintartomány találatai közti váltás csak egy kattintás, az opcionált lista pedig kitűnő lehetőség a kifejezés szavainak könnyű variálására. A Góliát használatát ismertető oldalak ugyan a többi keresővel szembeni előnyök közt említik az új oldalak 40-45 másodpeen belüli rögzítését, Mutschler Péter, az üzemeltető munkatársa szerint ezt ma már nem tudják tartani, egy-egy új weboldal adatbázisba kerüléséhez a Góliát is egyhavi türelmet kér a webmesterektől.

Noha azt ígértük, a magyar keresőket mutatjuk be, egy kivételt mégis tennünk kellett: az [origo] Vizslája ugyanis nem magyar keresőmotort haszbál, hanem az Overture Services, Inc. partnereként egy londoni szerver adatbázisában keres. A Vizslának egyébként nem ez az első "motorcseréje": míg induláskor még Altavizsla néven az akkoriban népszerű AltaVista Search Engine motorja hajtotta, 2001 március 1-től a kevésbé ismert, ám igen jó keresőként számontartott Northern Light technológiája volt a háttérben. A Yahoo által megvásárolt Overture-rel 2003. március 8.-a óta áll szerződésben a Vizslát üzemeltető Axelero.

Az utolsó "motorcseréből" azonban a felhasználók nem sokat vehettek észre, legfeljebb a szűkített keresés néhány hetes eltűnését március tájékán. Egyvalamit azonban mégiscsak vesztett a Vizsla: korábban a keresés találatai tematikus mappákba is rendeződtek, mely az új motorra való áttéréssel egy időben megszűnt. A Vizsla kínálja egyébként a szűkítési lehetőségek legbőségesebb tárházát: a már-már áttekinthetetlenül bonyolult részletes keresési oldalon egy vagy több szóra, szókapcsolatra, domaintarományokra, dátumra, fájlformátumra, sőt még az oldalba beépült objektumra is kereshetünk, illetve itt állítható be a sokkoló tartalom kivédére szolgáló szűrő is.

Kiegészítő szolgáltatás a tezaurusz (egynyelvű szótár). Ezzel ugyan nem lehet keresni, csak a saját adatbázisába került fogalmakat mutatja, de egy-egy fogalmat szűkíthetünk vagy tágíthatunk a szinomimák, illetve címszavak alapján. A szolgáltatás nem rossz, ha egy-egy kifejezést szeretnénk a címszó struktúrájában látni, de így, a webes kereséstől ennyire elválasztva megkérdőjelezhető a hasznossága.

Kiemelkedik a kép-, az mp3- és a videokereső szolgáltatás: ezeknél azonban már erősen érezhető, hogy külföldi állomány képezte a szolgáltatás alapját: a .hu tartományra itt nem lehet szűkíteni és a találatok java is külföldi szerverre mutat.

A Vizsla sem hibátlan: ottjártunkkor épp nem tett különbséget az ékezetes és az ékezet nélküli karakterek között, így például veréb és véreb, Eger és egér szavak keresésekor a találatok közé számos irreleváns hivatkozás is bekerült. Kárpáti András, a Vizsla csoportvezetője szerint már tudnak a hibáról, ám mivel a keresés külföldi szerveren történik, csak az adatbázis üzemeltetője tudja javítani -- amire már ígéretet kaptak.

[oldal:Kereső.hu]

Újszerűsége és ötletessége egyaránt arra predesztinálta a Kereső.hu on-line lexikont, hogy bekerüljön körképünkbe: a szolgáltatás nem a webet pásztázó robotokkal, hanem a saját adatbázisába került címszavak közt keres. Mivel a hazai interneten átfogó lexikon a mai napig nem érhető el, a Kereső.hu-nak minden esélye megvan arra, hogy ezzel a hiánypótló szolgáltatással irányítsa magára a figyelmet.


Kereső.hu

A Kereső.hu több lexikon anyagát is tartalmazza. Az adatbázis gerincét egyelőre a Révai lexikon és a Tolnai Nagylexikon képviseli, ami -- valljuk be -- a maga idején hasznos forrásnak számított, mára azonban jócskán elavult, s inkább kultúrtörténeti érdekesség, mint a lexikális tudás gyarapítására alkalmas forrás. A két lexikonból származó adatokkal még egy probléma van: az üzemeltető a forrást igen, de az évszámot nem jelölte a találati oldalon. Több korosztálynak amilyen egyértelmű, hogy a Révaiból és a Tolnaiból származó adatokat miként érdemes olvasni, más korosztályok számára ez korántsem evidens. A Horthyt még élő kormányzónak, a Magyar Köztársaságot pedig még királyságnak feltüntető szócikkek azért egy szűkös forrásmegjelölésen túl talán bővebb magyarázatra szorulnának.

Számos további meglepő meghatározás tárul fel az on-line lexikont bogarászva: mivel sajnos a címszavak közti hivatkozások nem kattinthatók (vajon miért?), így az informatika szóra keresve például egyetlen rövid magyarázat bukkan elő, miszerint az informatika Kovácsa maga Kovács Kálmán miniszter. A "lásd" utáni címszót ilyenkor az ember kimásolhatja a böngészőből, vagy kézzel bepötyögheti, hogy valamivel többet tudjon meg Kovács Kálmánról.

Szintén baj, hogy kifejezésekre nem lehet keresni. A Gazdasági Minisztérium kifejezésre összesen 81 találattal örvendeztet meg a kereső: legtöbbjében a gazdasági vagy a minisztérium szavak szerepelnek, a kettő együtt sosem. Nem "érti" a kereső az idézőjelbe tett, vagy az összeadás jelekkel kifejezett együvé tartozást sem: ezeket a webes keresések során már a kevésbé tájékozott felhasználók is ismerik, kár elfelejtetni velük.

Mint Weinreich László, az üzemeltető Kereső Bt. ügyvezetője lapunknak elmondta: a koncepció szerint a lexikon-funkción túl egyfajta kereskedelmi adatbázis kialakítását is tervezik. Azok a címszavak ugyanis, melyek egy átfogó lexikonban nem biztos, hogy helyt kapnának, vagy jelentésük triviális, ám az adott piac szereplőinek fontos, hogy megjelenjenek a keresőkben, némi fizetség ellenében lehetőségük lesz akár saját magukat is reklámozni. Példaként Weinreich az ingatlanközvetítés szót említette, mely nem feltétlenül kell, hogy a részét képezze egy internetes lexikonnak, hiszen a jelentésével valószínűleg mindenki tisztában van. Ám ha az ingatlanpiac valamelyik szereplőjének érdeklődését felkelti ez a marketinglehetőség, akkor a Kereső.hu fogadókésznek bizonyul majd.

Weinreich megismertette a HWSW-vel a lexikongyarapítással kapcsolatos terveiket is: egy-egy tudományág vagy szakma lexikonját úgy tervezik összeállítani, hogy az adott szakma képviselőit kérik fel a legfontosabb szavak, kifejezések lexikonná rendezésére. Így lehet például akár egy csillagászati vagy biológiai szaklexikonnal bővíteni a Kereső.hu-t.

Az általunk felvetett problémákat az ügyvezető is elismerte: mint mondta, a forrásoknál -- ha tudják -- URL-lel is próbálnak konkrétabb fogódzót nyújtani, a letűnt korok lexikonjainál az évszám feltüntetése pedig rövid munkával megoldható.

[oldal:A keresők próbája]

Néhány próbakeresést is végeztünk az egy hét alatt. Valamennyi keresőben ugyanazokat a szavakat, kifejezéseket adtuk meg, s az első tíz találat alapján próbáltunk következtetni a keresők pontosságára, használhatóságára. A magyar keresők mellett a Google-ban is végeztünk egy-egy kontrollkeresést.

Kerestünk egy konkrét személyt (Mádl Ferencet), egy pozíciót (köztársasági elnök) egy intézményt (a Foglalkoztatáspolitikai és Munkaügyi Minisztériumot), egy-egy szót (strucc, víztorony), egy verssort (Tóth Árpád: Meddő órán -- Viaszos vászon az asztalomon), valamint egy idegen szót: defenesztrácó, hogy megállapítsuk melyik kereső bizonyult a legpontosabbnak.

Mádl Ferenc köztársasági elnök szigorúan idézőjelek közé tett -- tehát megbonthatatlan kifejezés keresésére utaló -- nevére valamennyi kereső főleg sajtóhíreket, illetve választási oldalakat adott ki az első tíz találat között. A Google ezen túl egy francia nyelvű oldalt is felkínált, a Kereső.hu ellenben semmit: az 1080 találat közül az első tíz mindegyike csak a Ferencet értelmezte, és Habsburg főrangokkal, szentekkel, francia királyokkal örvendeztetett meg bennünket.

Szerencsésebbnek bizonyultunk a köztársasági elnök kifejezéssel: A Google és a Vizsla az első helyre tette a Köztársasági Elnöki Hivatal weboldalát, mely a tárgyban valóban a legautentikusabbnak tekinthető, a Góliát főleg az alkotmány webes irodalmát kínálta fel, úgyszintén a HuDir, melynél első helyen szerepelt volna maga a köztársasági alkotmány -- sajnos, egy már rég megszűnt szerveren lévő oldala. A Heuréka egy on-line mindentudót kínált fel első találatként, majd további cikkeket (sajnos néha 6-7 évvel ezelőtt megjelenteket) ajánl az első tíz találat közt.

A Foglalkoztatáspolitikai és Munkaügyi Minisztérium kifejezésre a Heuréka, a Vizsla és a Google egyaránt a minisztérium weboldalát kínálja fel elsőként, a Góliát a a miniszterek feladat- és hatáskörének változásával összefüggésben szükséges törvénymódosításokról szóló törvényjavaslatot, valamint szakcikkeket, közmunkapályázatot kínál, a HuDir azonban semmi konkrétumot nem nyújt az első tíz találat közt, míg a Kereső.hu egészen régi szócikkeket ad -- feltételezhetően a minisztérium szót favorizálva.

A strucc szóra a HuDir a hasonnevű könyvkiadó és fotóstúdió oldalait mutatja, hasonlóan a Heurékához, mely mindezt kiegészíti néhány, a strucc tartásával, tenyésztésével kapcsolatos weboldallal, valamint két halott linkkel. A Góliát, a Vizsla és a Google mindezt néhány recepttel is kiegészíti. A Kereső.hu-n való keresés nem eredményezett találatot. A víztorony szóra változatosabb találatokat kapunk: a HuDir néhány halott link mellett több Volán vállalati linket kínál fel, ahol ugyan nem találtuk meg a víztorony szót, de feltételezhető, hogy valamelyik buszjárat menetrendjéből tallózott a kereső. A Heuréka a siófoki víztorony mellett a nívós viztorony.hu oldal több lapját mutatja (egyetlen halott linkkel), a Google mindezt kiegészíti a víztorony működéséről szóló sulinetes oldallal is. A Vizsla szintén a viztorony.hu oldalt favorizálja, ám a margitszigeti, szeged-tarjáni, siófoki, körömi víztornyokról és egy fórum víztorony nickjéről is ad találatot. A Kereső.hu két leírást is ad a víztornyokról, a Góliát pedig -- a már ismerős viztorony.hu-n kívül -- egy építészeti tervezővállalat referencialistáját, egy víztoronyban megrendezett művészeti kiállítást és a korábban szintén ismerős szeged-tarjáni víztorony körüli tér rendezési tervét villantja fel.

Tóth Árpád versét -- érthető okokból a HuDir és a Kereső.hu kivételével -- valamennyi kereső megtalálta. A Heuréka az első négy találattal tévútra vezetett, s végül az ötödik (a relevanciavizsgálatban mindössze egy százalékot kapó) oldal kalauzolt el bennünket a Magyar Elektronikus Könyvtár oldalára. A Góliátnál csak az első két találat bizonyult falsnak, ám a harmadikon már felleltük a verset, míg a Google és a Vizsla első kattintásra értékelhető találatot adott.

A defenesztrációra a HuDir nem adott találatot, a Heuréka igen, bár számos tesztlap volt ezek között, melyeken persze válasz nélkül, szintén kérdésként szerepelt a szó, s végül egy 1 százalékos relevanciaértékkel jelzett találat adta meg a magyarázatot. Igen meglepő módon sem a Vizsla, sem a Google, sem a Góliát nem talált ilyen szót, s a Kereső.hu -- ahol pedig a legnagyobb esély lenne a magyarázat fellelésére -- sem árulta el a defenesztráció jelentését. (Defenesztrációként egyébként a harmincéves háború előzményeként számon tartott, 1618-as eseményt jegyzik, mikor a prágai Hradzsin várából a hivatalnokokat a feldühödött tömeg egész egyszerűen kihajította az ablakon.)

Rövid -- és bizonyára szubjektív -- tesztünk eredményeképp levonható következtetés szerint a Google után a legjobb kereső a Vizsla. Közel ugyanilyen jó, ám sajnos a halott linkek miatt teleszemetelt eredményeket nyújt a Heuréka is. A Góliát találatai sem értéktelenek: ha nem is mindig a legautentikusabb forrásra mutatnak, számos kiegészítő információt meríthetünk a relevanciavizsgálat során előtérbe helyezett oldalakból. A HuDir szabad szavas keresőként gyakorlatilag használhatatlannak bizonyult: a katalógusrendszere több reménnyel kecsegtetett, ám végigkattintgatni a struktúra alján szereplő címszóig, és a több tucat rendezetlen link közül eltalálni a megfelelőt: lassú és szerencsejátékra emlékeztető. A Kereső.hu egy-egy szó keresésénél hasznosnak bizonyult -- már ha nem egy elavult lexikális adattal tájékoztat -- de kerekebb kifejezések esetén nem érdemes ott próbálkozni.

A kereső-üzemeltetők egyikének korábbi megfogalmazását általában kiterjeszthetjük a hazai keresőkre: mindegyikben van fantázia, s érdemes is fejleszteni őket. A kisebb-nagyobb, bosszantó, a használati értéket néha jelentősen rontó, ám fejlesztői szempontból nem túl jelentős hibák kiküszöbölése pedig egyáltalán nem lenne megterhelő feladat.

Szólj hozzá a fórumban!

a címlapról

Hirdetés

Python everywhere!

2020. február 22. 17:54

Gyere Pythonozni a HWSW rendezvényeire! Megmutatjuk, hogy a Python nem csak a fejlesztők nyelve, hiszen egyszerűsége miatt előszeretettel használják az üzemeltetők és DevOps szakemberek, tesztelők, illetve az adattudósok is, és elfut szinte bárhol, a mikrovezérlőktől egészen a böngészőkig.