Szerző: Gálffy Csaba

2011. június 6. 11:46

Egységesen kezelik a keresők a strukturált tartalmat

A kezdetek óta okoz gondot a keresőmotoroknak az adatbázisokból generált tartalom visszarendezése adatbázis formába - ezen fog segíteni most a Schema.org szabványosított jelölőnyelve. A több száz kategória segítségével a keresők jobb betekintést tudnak nyújtani az átkattintás után várható tartalomba - ígérik a cégek.

A keresőmotorok előtt tornyosuló legnagyobb probléma a zárt adatbázisokba való bejutás - az internetes szolgáltatások ugyanis a keresők számára láthatatlan adatbázisokból generálják a felhasználó által fogyasztható tartalmat, a keresők számára azonban az egyszerű HTML-oldalból szinte lehetetlen rekonstruálni az eredeti adatstruktúrákat. Az adatok struktúrájához való hozzáférés eddig csupán néhány esetben, egyedi egyezségek alapján jött létre (pl. AllRecipes, IMDb), a webes tartalom többségét adó oldalakhoz azonban nem volt hozzáférés.

Strukturáld magad

A keresőpiacot gyakorlatilag teljesen lefedő három cég ezért összeállt, és megalkottak egy tartalomcímkézési rendszert, amelynek segítségével a generált adatok adatstruktúrába rendezhetőek. A sémát használó oldalak minden eszközt megadnak a keresőmotoroknak, hogy a HTML tartalom egyes részletei között egyértelmű, gépileg értelmezhető kapcsolatot hozzanak létre, gyakorlatilag rekordokba rendezzék azokat. A felcímkézett adatok kikerülhetnek a keresési találatok közé, így például egy termék képe, vásárlói megítélése, ára is.

Az about.com egyéni jelölőrendszert használ.

Miért nem beszélni AI tökéletesen magyart?

Milyen kihívásokat tartogat egy magyar nyelvi modell, például a PuliGPT fejlesztése?

Miért nem beszélni AI tökéletesen magyart? Milyen kihívásokat tartogat egy magyar nyelvi modell, például a PuliGPT fejlesztése?

A schema.org-on közzétett adatcímkézési módszerek segítségével már több száz tartalomfajtára létezik jelölőmechanizmus, beleértve a film-zene-kép típusú tartalmakat, de a webshopokba felvitt termékek adatait is. Arról egyelőre nincs szó, hogy a címkézett adatok használó oldalak előbbre kerülnének a találati listán, az egyes keresők azonban akár így is dönthetnek.

Szemantikus

Ugyan a weben jelenleg is többféle ilyen jelölőséma van jelen, a három legnagyobb keresőmotor által egységesen használt új megoldás gyorsan teret nyerhet, mint a keresőoptimalizálás új formája. Az egyéb jelölősémák között persze ott található a Facebook saját megoldása, az Open Graph, amely elsősorban a webes tartalmak és a felhasználók közötti kapcsolat szabványos megteremtését szolgálja, céljaiban azonban megegyezik a schema.orgéval: gépileg értelmezhetővé tenni a felhasználók (külső oldalakon) végzett aktivitását.

A schema.org nem előzmények nélküli, nagyban épít a Yahoo hasonló kezdeményezésére, a tavaly elkaszált SearchMonkey jelölőmechanizmusra, valamint az SDS Skyserver, a Cyc vagy a dbpedia.org és a linkeddata.org által már elvégzett munkára. Az egységes jelölőnyelv elfogadásával közelebb került a keresőmotorok által értelmezhető web, így a következő generációs, szemantikus kapcsolatokra épülő keresés is.

Nagyon széles az a skála, amin a állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról

fab

5

Chipgyártó nagyhatalommá válna India

2024. március 18. 12:39

A helyi politikai vezetés szerint van rá esély, hogy a következő néhány évben az ország bekerüljön az öt vezető ország közé.