Szerző: Dojcsák Dániel

2011. június 21. 14:37

Újabb negyedmillió könyvet digitalizál a Google

A Google megállapodást kötött a British Library-val, 250 ezer szerzői jog által már nem védett könyv szkennelésére. A Google számára ez egyrészt misszió, amiben a világ írott tudását rendszerezné egy helyen, másrészt a szemantikus keresés, a jobb fordítás, szövegértelmezés felé vezető úton is egy komoly mérföldkő.

A Google újabb akciója főként régi, 1700 és 1870 között nyomtatott könyvekre vonatkozik, a 250 ezeres listában ugyanúgy megtalálhatóak teljes könyvek, regények, időszaki kiadványok és magazinok is. A Google miután befejezi a könyvek beolvasását, több mint 40 millió oldalnyi új dokumentum lesz elérhető a Google Books szolgáltatáson belül, ami nem csak a keresőcég algoritmusainak okosítására hasznosul, hanem a világon bárki hozzáférhet az anyagokhoz ebben az esetben is.

Emlékek az ipari forradalom idejéről

Mivel a most sorra kerülő könyvek leginkább kordokumentumok és tudományos munkák, ezért a köznép helyett inkább a kutatók, egyetemi hallgatók érdeklődésére számít A British Library. Az érdeklődők letölthetik, megoszthatják, vagy akár manipulálhatják is a tartalmakat, de kizárólag nem-kereskedelmi céllal használható fel bármi.

A szkennelendő könyvek az angol ipari forradalom időszakát fedik le, és olyan meghatározó találmányok kialakulásának történetét lehet kiolvasni ezekből a dokumentumokból, mint a vasút, a távíró vagy az első belső égésű motorral hajtott tengeralattjáró. Ugyanígy meglelhetőek a rabszolgaság felszámolásának vagy a francia forradalomnak a titkai is.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A Google társadalmilag fontosnak tartja az ilyen projekteket, így szinte természetes, hogy a British Library digitalizálási projektjének teljes költségét is vállalja, igaz ezért cserébe a könyvtárnak teljes egészében nyilvánossá kell tennie ezeket az iratokat. A Books projektnek ez már sokadik állomása, és annak ellenére, hogy a Európában több esetben is szerzői jogi problémákba ütközött a cég, a Google nem adja fel. Jelenleg a Google adatbázisában több mint 13 millió könyv van digitalizálva több mint 40 nagy könyvtár készleteiből.

Webkönyves monopólium

Ha így folytatódik, akkor a Google néhány éven belül a már nem jogvédett, kereskedelmi forgalomban nem lévő könyvek és egyéb nyomtatott termékek de facto egyeduralkodójává válik az egész világon. Pont ettől féltek különböző független vagy kiadói szervezetek, amikor peres úton megpróbálták megakadályozni, hogy a Google véghez vihesse a tervét. Az viszont tény, hogy a Google-ön kívül senki más nem foglalkozott eddig ezzel a területtel, sem a kiadók, sem a konkurensek, mint a Microsoft vagy az Amazon, így inkább örömteli, hogy egy cég energiát fektet abba, hogy az emberiség írásos emlékeit egy mindenki által elérhető adatbázisba rendezze.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról