Egységesen kezelik a keresők a strukturált tartalmat
A kezdetek óta okoz gondot a keresőmotoroknak az adatbázisokból generált tartalom visszarendezése adatbázis formába - ezen fog segíteni most a Schema.org szabványosított jelölőnyelve. A több száz kategória segítségével a keresők jobb betekintést tudnak nyújtani az átkattintás után várható tartalomba - ígérik a cégek.
A keresőmotorok előtt tornyosuló legnagyobb probléma a zárt adatbázisokba való bejutás - az internetes szolgáltatások ugyanis a keresők számára láthatatlan adatbázisokból generálják a felhasználó által fogyasztható tartalmat, a keresők számára azonban az egyszerű HTML-oldalból szinte lehetetlen rekonstruálni az eredeti adatstruktúrákat. Az adatok struktúrájához való hozzáférés eddig csupán néhány esetben, egyedi egyezségek alapján jött létre (pl. AllRecipes, IMDb), a webes tartalom többségét adó oldalakhoz azonban nem volt hozzáférés.
Strukturáld magad
A keresőpiacot gyakorlatilag teljesen lefedő három cég ezért összeállt, és megalkottak egy tartalomcímkézési rendszert, amelynek segítségével a generált adatok adatstruktúrába rendezhetőek. A sémát használó oldalak minden eszközt megadnak a keresőmotoroknak, hogy a HTML tartalom egyes részletei között egyértelmű, gépileg értelmezhető kapcsolatot hozzanak létre, gyakorlatilag rekordokba rendezzék azokat. A felcímkézett adatok kikerülhetnek a keresési találatok közé, így például egy termék képe, vásárlói megítélése, ára is.
Az about.com egyéni jelölőrendszert használ.
Miért nem beszélni AI tökéletesen magyart? Milyen kihívásokat tartogat egy magyar nyelvi modell, például a PuliGPT fejlesztése?
A schema.org-on közzétett adatcímkézési módszerek segítségével már több száz tartalomfajtára létezik jelölőmechanizmus, beleértve a film-zene-kép típusú tartalmakat, de a webshopokba felvitt termékek adatait is. Arról egyelőre nincs szó, hogy a címkézett adatok használó oldalak előbbre kerülnének a találati listán, az egyes keresők azonban akár így is dönthetnek.
Szemantikus
Ugyan a weben jelenleg is többféle ilyen jelölőséma van jelen, a három legnagyobb keresőmotor által egységesen használt új megoldás gyorsan teret nyerhet, mint a keresőoptimalizálás új formája. Az egyéb jelölősémák között persze ott található a Facebook saját megoldása, az Open Graph, amely elsősorban a webes tartalmak és a felhasználók közötti kapcsolat szabványos megteremtését szolgálja, céljaiban azonban megegyezik a schema.orgéval: gépileg értelmezhetővé tenni a felhasználók (külső oldalakon) végzett aktivitását.
A schema.org nem előzmények nélküli, nagyban épít a Yahoo hasonló kezdeményezésére, a tavaly elkaszált SearchMonkey jelölőmechanizmusra, valamint az SDS Skyserver, a Cyc vagy a dbpedia.org és a linkeddata.org által már elvégzett munkára. Az egységes jelölőnyelv elfogadásával közelebb került a keresőmotorok által értelmezhető web, így a következő generációs, szemantikus kapcsolatokra épülő keresés is.