Szerző: Gálffy Csaba

2011. június 6. 11:46

Egységesen kezelik a keresők a strukturált tartalmat

A kezdetek óta okoz gondot a keresőmotoroknak az adatbázisokból generált tartalom visszarendezése adatbázis formába - ezen fog segíteni most a Schema.org szabványosított jelölőnyelve. A több száz kategória segítségével a keresők jobb betekintést tudnak nyújtani az átkattintás után várható tartalomba - ígérik a cégek.

A keresőmotorok előtt tornyosuló legnagyobb probléma a zárt adatbázisokba való bejutás - az internetes szolgáltatások ugyanis a keresők számára láthatatlan adatbázisokból generálják a felhasználó által fogyasztható tartalmat, a keresők számára azonban az egyszerű HTML-oldalból szinte lehetetlen rekonstruálni az eredeti adatstruktúrákat. Az adatok struktúrájához való hozzáférés eddig csupán néhány esetben, egyedi egyezségek alapján jött létre (pl. AllRecipes, IMDb), a webes tartalom többségét adó oldalakhoz azonban nem volt hozzáférés.

Strukturáld magad

A keresőpiacot gyakorlatilag teljesen lefedő három cég ezért összeállt, és megalkottak egy tartalomcímkézési rendszert, amelynek segítségével a generált adatok adatstruktúrába rendezhetőek. A sémát használó oldalak minden eszközt megadnak a keresőmotoroknak, hogy a HTML tartalom egyes részletei között egyértelmű, gépileg értelmezhető kapcsolatot hozzanak létre, gyakorlatilag rekordokba rendezzék azokat. A felcímkézett adatok kikerülhetnek a keresési találatok közé, így például egy termék képe, vásárlói megítélése, ára is.

Az about.com egyéni jelölőrendszert használ.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A schema.org-on közzétett adatcímkézési módszerek segítségével már több száz tartalomfajtára létezik jelölőmechanizmus, beleértve a film-zene-kép típusú tartalmakat, de a webshopokba felvitt termékek adatait is. Arról egyelőre nincs szó, hogy a címkézett adatok használó oldalak előbbre kerülnének a találati listán, az egyes keresők azonban akár így is dönthetnek.

Szemantikus

Ugyan a weben jelenleg is többféle ilyen jelölőséma van jelen, a három legnagyobb keresőmotor által egységesen használt új megoldás gyorsan teret nyerhet, mint a keresőoptimalizálás új formája. Az egyéb jelölősémák között persze ott található a Facebook saját megoldása, az Open Graph, amely elsősorban a webes tartalmak és a felhasználók közötti kapcsolat szabványos megteremtését szolgálja, céljaiban azonban megegyezik a schema.orgéval: gépileg értelmezhetővé tenni a felhasználók (külső oldalakon) végzett aktivitását.

A schema.org nem előzmények nélküli, nagyban épít a Yahoo hasonló kezdeményezésére, a tavaly elkaszált SearchMonkey jelölőmechanizmusra, valamint az SDS Skyserver, a Cyc vagy a dbpedia.org és a linkeddata.org által már elvégzett munkára. Az egységes jelölőnyelv elfogadásával közelebb került a keresőmotorok által értelmezhető web, így a következő generációs, szemantikus kapcsolatokra épülő keresés is.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról