Szerző: Gálffy Csaba

2011. június 6. 11:46

Egységesen kezelik a keresők a strukturált tartalmat

A kezdetek óta okoz gondot a keresőmotoroknak az adatbázisokból generált tartalom visszarendezése adatbázis formába - ezen fog segíteni most a Schema.org szabványosított jelölőnyelve. A több száz kategória segítségével a keresők jobb betekintést tudnak nyújtani az átkattintás után várható tartalomba - ígérik a cégek.

A keresőmotorok előtt tornyosuló legnagyobb probléma a zárt adatbázisokba való bejutás - az internetes szolgáltatások ugyanis a keresők számára láthatatlan adatbázisokból generálják a felhasználó által fogyasztható tartalmat, a keresők számára azonban az egyszerű HTML-oldalból szinte lehetetlen rekonstruálni az eredeti adatstruktúrákat. Az adatok struktúrájához való hozzáférés eddig csupán néhány esetben, egyedi egyezségek alapján jött létre (pl. AllRecipes, IMDb), a webes tartalom többségét adó oldalakhoz azonban nem volt hozzáférés.

Strukturáld magad

A keresőpiacot gyakorlatilag teljesen lefedő három cég ezért összeállt, és megalkottak egy tartalomcímkézési rendszert, amelynek segítségével a generált adatok adatstruktúrába rendezhetőek. A sémát használó oldalak minden eszközt megadnak a keresőmotoroknak, hogy a HTML tartalom egyes részletei között egyértelmű, gépileg értelmezhető kapcsolatot hozzanak létre, gyakorlatilag rekordokba rendezzék azokat. A felcímkézett adatok kikerülhetnek a keresési találatok közé, így például egy termék képe, vásárlói megítélése, ára is.

Az about.com egyéni jelölőrendszert használ.

Platón ragadt informatikusok klubja

Egyetlen más szakma sincs, ahol olyan gyorsan el lehet érni a karrier-platóra, mint az IT. A midlife, a mid-level mellett létezik mid-career krízis is.

Platón ragadt informatikusok klubja Egyetlen más szakma sincs, ahol olyan gyorsan el lehet érni a karrier-platóra, mint az IT. A midlife, a mid-level mellett létezik mid-career krízis is.

A schema.org-on közzétett adatcímkézési módszerek segítségével már több száz tartalomfajtára létezik jelölőmechanizmus, beleértve a film-zene-kép típusú tartalmakat, de a webshopokba felvitt termékek adatait is. Arról egyelőre nincs szó, hogy a címkézett adatok használó oldalak előbbre kerülnének a találati listán, az egyes keresők azonban akár így is dönthetnek.

Szemantikus

Ugyan a weben jelenleg is többféle ilyen jelölőséma van jelen, a három legnagyobb keresőmotor által egységesen használt új megoldás gyorsan teret nyerhet, mint a keresőoptimalizálás új formája. Az egyéb jelölősémák között persze ott található a Facebook saját megoldása, az Open Graph, amely elsősorban a webes tartalmak és a felhasználók közötti kapcsolat szabványos megteremtését szolgálja, céljaiban azonban megegyezik a schema.orgéval: gépileg értelmezhetővé tenni a felhasználók (külső oldalakon) végzett aktivitását.

A schema.org nem előzmények nélküli, nagyban épít a Yahoo hasonló kezdeményezésére, a tavaly elkaszált SearchMonkey jelölőmechanizmusra, valamint az SDS Skyserver, a Cyc vagy a dbpedia.org és a linkeddata.org által már elvégzett munkára. Az egységes jelölőnyelv elfogadásával közelebb került a keresőmotorok által értelmezhető web, így a következő generációs, szemantikus kapcsolatokra épülő keresés is.

a címlapról