:

Szerző: Dojcsák Dániel

2009. június 11. 08:14

Kell a Google fordítóprogramjának az emberi segítség

A gépi fordítás a Google-nél már 47 nyelven elérhető. Noha az eredmények többnyire megmosolyogtatóak, s gyakran az eredeti szöveg értelmét képesek teljesen megfordítani, a Google nem adja fel. A követendő irány nagyon helyesen a gépi fordítás emberi erővel való kisegítése, ami a felhasználók számára egy kényelmesebb felületet, a gépeknek pedig még több helyes mintát jelent majd.

Nem adja fel

A Google Translation Toolkittel a szerkesztők, fordítók könnyen javíthatják ki a gépi fordítást a helyesebb, értelmes változatra. Az eszköz már nem weboldalakra és kifejezésekre fókuszál, hanem teljes szövegekre, dokumentumokra is felkészült. A Google hivatalos blogján hozott példa szerint ha egy arabul beszélő olvasó egy Wikipedia-cikket szeretne lefordítani saját nyelvére, akkor betölti a dokumentumot a Translator Toolkitbe, az automata elvégzi a fordítást, amit a felhasználó kézzel korrigálhat és egy kattintással akár publikálhatja is vagy továbbküldheti bárhová. A korrigálásban segítségére lesznek a fordítást segítő keresések, a kétnyelvű szótárak és a felhasználói értékelési rendszer.

A Translation Toolkitet a Google összekapcsolta a Wikipediával, a programból közvetlenül lehet a népszerű közösségi enciklopédiába tartalmat feltölteni: ez az első fontos terület, ahol a Google szeretné bevetni a fejlesztését. A lényeg az emberi javításokban van, mert a teljes szövegeket átbogarászó önkéntesek által végzett korrekciókat megtanulja a rendszer és egyre jobban finomodik majd a fordítás minősége mind a 47 nyelven.

Kapcsolt üzemek

Az eszköz továbbá integráltan tartalmaz Knol-támogatást (a Google tudástára) is, és elboldogul a legtöbb szabványos dokumentumtípussal, beleértve a HTML-t és a Wordöt. A profi fordítók felé is próbál nyitni az online cég, mégpedig azzal, hogy olyan funkciókat is beépített mint a fordítási memória, illetve a szakszövegek értelmezését segítő terminológiai szedet.

A Google Translate primitív

Pataki E. Balázs, a Sztaki Szótár egyik fejlesztője úgy tudja, hogy a Google megoldása többnyire statisztikai alapon próbálja meg kitalálni, hogy több egymást követő szó együtt mit jelenthet. Ennek eredményeképp a változatos és bonyolult magyar nyelvben sokszor a legtriviálisabb fordulatokat is helytelenül fordítja, például könnyedén lesz állításból tagadás. A Google fordítója jelenleg primitív, inkább szórakoztató, mint hasznos.

Pataki szerint ugyanakkor a Google fordítás nagyon hasznos is lehet más karakterkészletekről való szöveg átemelésekor, vagy teljesen idegen nyelvvel való találkozáskor, persze csak úgy ha saját nyelvi intelligenciánkat is hozzáadjuk. Ha a kontextust ismeri a felhasználó, akkor a rossz fordításból is kisilabizálható a lényeg.

A Google Translate hiába gyenge még, a Mountain View-i cég szívén viseli sorsát, s a fejlesztések, törekvések, új elemek megjelenésének dinamikáját nézve akár pár éven belül áttörés is lehetséges. Az Európai Unió egyik most futó, FP7 kiírásában szerepel egy EU-finanszírozott integrált projekt, ami öt év leforgása alatt létrehozna egy, a Google Translate-t meghaladó, az összes európai nyelvre működő gépi fordítót. A megvalósulás esélye ugyan csekély, de már részeredmények is sokat segíthetnének az európai kommunikációban.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. április 25. 19:50

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.