Szerző: Dojcsák Dániel

2010. június 9. 11:31

Koffeinnel pörög fel a Google

Ma reggel a Google bejelentette, hogy elkészült a webkeresője új indexelési eljárásával. A Caffeine kódnevű megoldás 50 százalékkal gyorsabb indexelést tesz lehetővé, mint a korábbi, azaz a tartalmak még gyorsabban kerülhetnek be a találatok közé.

A Google indexeire eddig sem volt számottevő panasz, ugyanis a nagyobb oldalakon megjelenő új oldalak már eddig is perceken belül megjelentek a Google-ben, a változás ezért inkább a ritkábban látogatott oldalaknak, kisebb szájtoknak, különálló domaineknek jelenthet érezhető gyorsulást. Mivel a keresések indításakor valójában nem a teljes webet, hanem "csak" a Google indexei között böngészünk, ezért mégis fontos, hogy ez a valós állapotokhoz minél közelebbit mutasson.

Rétegek helyett régiók

A régi, eddig működő rendszerben a Google rétegekre osztotta az internetet, s ezek közül a fontosabbak, nagyobb és látogatottabb, gyakrabban változó oldalak indexelése gyakrabban történt meg, mint másoké. Az alap réteg, amibe a futottak még kategóriájú oldalak tartoznak, mindössze néhány hetente frissültek, míg például a híroldalak, blogok szinte percenként. Az eddigi megoldás minden alkalommal a teljes webet vette figyelembe, s emiatt szükségszerűen lassú volt a folyamat bizonyos szint alatt.

A helyzet a Google szerint azonban hosszabb távon tarthatatlan volt, a weben megjelenő információmennyiség növekedése ugrásszerű, a felhasználók pedig sokkal komolyabb elvárásokkal kezdenek bele egy keresésbe, mint korábban. Az internetezők a legfrissebb és legrelevánsabb tartalmat szeretné megkapni, miközben a tartalmat közzétevők elvárják, hogy azonnal megjelenjenek a találatok között. A Caffeine éppen azért jött létre, hogy a Google lépést tarthasson az igények fejlődésével.

Az új kereső index működése annyiban tér el a régitől, hogy a webet már nem egészében, hanem kis részekben kezeli, viszont az adatok frissítése teljesen folyamatos és közvetlen. Ha a robotok új, vagy megváltozott tartalmat észlelnek valahol, akkor az direkt módon bekerül az élő indexbe. Természetesen a teljesítmény is növekedett, s a Caffeine másodpercenként több százezer oldalt jár végig. A teljes adatbázis jelenleg közel 100 millió gigabájt, saz újdonságok naponta további százezer gigabájt nagyságrendnyi adatot érintenek az indexben.

Nincs még vége

A Caffeine létrejötte azonban nem elsősorban az óriási méretek miatt volt fontos, hanem a még gyorsabb, még relevánsabb találatok lehetősége miatt. A hivatalos blogbejegyzés emellett kilátásba helyez további újdonságokat is még ebben a hónapban, de konkrétan nem árulták el, hogy mire lehet számítani.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról