Szerző: Dojcsák Dániel

2010. március 5. 14:37

Megérti az emberi beszédet a YouTube

Egy jó ideje néhány kiválasztott YouTube-felhasználó és nagyobb médium már élhet a lehetőséggel, hogy filmjei alá automatikusan készülő feliratot varázsoljon, de mostantól bárki kiegészítheti a beszédhangokat szöveges verzióval is. Ez a halláskárosultaknak, illetve a videók nyelvét nem értő internetezőknek nagyon hasznos.

A YouTube újabb lépést tesz a nyelvi akadályok leküzdése felé, a videomegosztó felhasználói mostantól igényelhetnek gépi feliratkészítést saját videóikhoz, igaz egyelőre csak angol nyelven  működik a dolog. Ehhez mindössze a saját videók menüpontba lépve a Subtitles and Captions menüpontot kell lekattintani az adott videónál.

Még kérni sem kell

Ezt követően a \"Request automatic transcription\" gombot megnyomva az anyag beáll a fordító-sorba, s miután a YouTube szerverein futó algoritmusok elvégezték dolgukat, rendelkezésre áll majd a nyers feliratszöveg. A legtöbb esetben még ezt sem kell megtenni, mert a YouTube máris átpásztázta a feltöltött videókat, s azokban, ahol szöveget talált, oda máris legyártotta a feliratot.

Természetesen az időzítés viszonylag pontos lesz, viszont a szöveg helyességét érdemes átnéznie a felhasználónak, mert az automata nem mindig azt adja vissza ami elhangzott. A felületen lévő figyelmeztetés szerint a YouTube \"igyekszik kihozni a legjobban a szövegből pár napon belül\", de valójában akár 10-15 percen belül is születhet eredmény tesztünk szerint. Ez az eredmény viszont nagyon vicces lehet, ha nem egy BBC-angolt beszélő hírolvasó, vagy egy dokumentumfilm kommentátora hallható a filmen,   nehezen tudjuk elképzelni például, hogyan kerültek a HWSW alábbi videójába a szerbek, Oregon, vagy a hackerek áldozatai. Ha valaki szórakozna egy jót, nézze végig felirattal a cikkbe beágyazott videót.

Ha az eredeti szöveg nem lenne elég vicces, akkor tovább lehet lépni a Google Translate segítségével. A szöveg lefordítható más nyelvekre, többek között magyarra is. Ezt szintén érdemes óvatosan kezelni, mert az egyébként is torz gépi felirat tovább romlik a fordítással, s ekkorra már kevés köze lesz az eredetileg elhangzottakhoz.

Nem tökéletes, de már ez sem semmi

A YouTube illetékesei maguk is elmondták, hogy a technológia nem tökéletes, s ez a megfogalmazás még enyhe is. Ugyanakkor a módszer és az eddig elért eredmények már önmagukban is megdöbbentőek. Az algoritmus ugyanis lehet, hogy hibázik, de akkor is pillanatok alatt egészen biztató arányban felismeri a nyelvi elemeket \"hallás\" után, s ezt azonnal integrálja, fordítja, lejátssza a videóval együtt.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról