:

Szerző: Bodnár Ádám

2007. március 28. 15:30

Szövegek statisztikai elemzésén alapuló fordítógépet fejleszt a Google

[News.com] A Google olyan újszerű fordítási szolgáltatást tervez, amely nem szótárak és nyelvtani szabályok tárolásán alapul, hanem hatalmas mennyiségű, emberek által korábban lefordított irat statisztikai elemzésén.

[News.com] A Google olyan újszerű fordítási szolgáltatást tervez, amely nem szótárak és nyelvtani szabályok tárolásán alapul, hanem hatalmas mennyiségű, emberek által korábban lefordított irat statisztikai elemzésén.

Franz Och, a Google fordítással kapcsolatos projektjének vezetője ugyan elismeri, hogy a statisztikai gépi fordítés nem tökéletes, de az első eredmények biztatóak. Och példaként említette a Google által már beüzemelt arab-angol fordítógépet, amely egy arab híroldal tartalmát jelenítette meg angolul. A szakember elmondása szerint azok, akik korábban is használtak fordítógépeket, el voltak ragadtatva az eredménytől, de ennél sokatmondóbb azok véleménye, akik még sosem találkoztak fordítógép által írt szöveggel. "Akik még sosem láttak gépi fordítást, átolvasták a szöveget, és közölték, hogy a gépi fordítás teljesen rossz, hiszen az ötödik sorban van egy hiba" -- mesélte Och.

A Google jelenleg több nyelvre lefrodított ENSZ és EU dokumentumok tömegét dolgozza fel, ezzel javítva a fordítás pontosságát. "Minél több adatot táplálunk a rendszerbe, annál jobban működik" -- magyarázza Och. A kevésbé elterjedt nyelvek esetében például kevésbé. A statisztikai elemzéssel elkerülhetők az olyan kínos helyzetek, mint amikor Vlagyimir Putyin tolmácsa Gerhard Schröder német kancellárt "Führernek" szólította. "A Führer Gerhard Schröder szókapcsolat valószínűleg igen ritka lesz, míg a Bundeskanzler [szövetségi kancellár -- a szerk.] Gerhard Schröder százszorta gyakoribb, így a szoftver jól dönt" -- magyarázta Och.

A Google jelenleg arab, kínai és orosz szövegeket tud ezzel az eljárással angolra fordítani, illetve vice versa, a www.google.com/language_tools oldalán elérhető fordítógép a többi nyelvhez más gyártók szoftverét használja. Och szerint a cél az, hogy a lehető legjobb szolgáltatást fejlesszék ki, ami hasznos ls nagy hatással van az emberekre, majd ezután ráérnek azon tűnődni, hogy lehet belőle hasznot húzni.

Természetesen az nem várható el sem a Google-tól, sem más fordítógéptől, hogy pontos és művészi igényességű fordítást hozzon létre, a szoftveres fordítás még jó ideig elsősorban a szöveg megértését fogja szolgálni és nem a nyelvi finomságok kifejezését. A villámgyors fordítási lehetőségnek akár politikai hatásai is lehetnek -- véli Eric Schmidt, a Google igazgatótanácsának elnöke. "Számos társadalomban léteznek olyan közösségek, amelyek működése a nyelvi korlátok miatt nem érthető mások számára és ők maguk sem értik a másként gondolkodókat. Hamarosan ezt az akadályt is elháríthatjuk és ez óriási dolog."

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. április 26. 06:39

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.