Szerző: Habók Lilla

2019. január 14. 11:00

Google Fordítóval igyekszik terjeszkedni a Wikipédia

Elérhetővé tette a Wikipédia a Google Translate-et is a tartalomfordító szolgáltatásán belül, hogy ezáltal a szócikkeket a szerkesztők könnyebben fordíthassák le egyik nyelvről a másikra.

Partneri megállapodást kötött a Wikipédia és a Google Translate annak érdekében, hogy még több nyelven és még több szócikk jelenjen meg az online enciklopédián keresztül. A Wikimédia Alapítvány közleményben fejtette ki, hogy több mint 7000 nyelv létezik a világon, de mindebből a Wikipédia nagyjából "csak" 300 nyelven elérhető. A zulu nyelvet például 12 millió ember tartja elsődleges nyelvének és 16 millió másodlagosnak, miközben csak 1100 Wikipédia-szócikk érhető el zuluul. A Wikimédia a víziója szerint viszont a "világ tudását" ingyenesen és mindenkinek a saját nyelvén szeretné eljuttatni az oldalain keresztül, és a tervei szerint ehhez járul hozzá a szerkesztőfelületbe beépített Google Translate is, amellyel egyébként a magyar nyelvű szócikkfordítások is elérhetőek.

A Wikipédia a Google fordítóját a saját tartalomfordító (Content Translation) szolgáltatásába építette be, amely eddig is rendelkezett több szótárral és gépi fordítóval - köztük az Apertium, a LingoCloud, a Matxin, a Yandex és a Youdao. A megoldás elsődleges célja, hogy a tudást minél több nyelven elérhetővé tegye minél rövidebb idő alatt, ezért a szócikkek lefordítását igyekszik megkönnyíteni egyik nyelvről a másikra - segítségével a Wikipédia szerkesztői már több mint 400 ezer szócikket fordítottak le.

Azonban az eddigi tartalomfordító megoldás nem támogatott minden nyelvet, ezért az önkéntes szerkesztők egyik legfőbb igénye volt a Google Translate befoglalása a szolgáltatásba. Ennek köszönhetően most a Content Translation 15 új nyelvvel bővült, úgy mint a zulu, a hausza, a jaruba vagy a kurd - a magyar egyébként 2015 májusa óta része a szolgáltatásnak. Ezzel pedig a Wikipédia tartalomfordítója már összesen 121 nyelvet képes támogatni.

wikipedia_fordito_Content-translation

A Google Translate természetesen többek közt magyar nyelvre is fordít, bár még mindig akadnak nehézségei a nyelvünkkel. A keresőóriás megoldása az utóbbi időben azért erősen próbálkozott, tavaly az offline fordítási lehetőségek közé, idén pedig az Assistant CES-en bejelentett tolmácsmódjába is bevette a magyart, amely egyébként egyelőre csak 27 nyelvet támogat. Azért mindenesetre a Wikipédia szerkesztőinek még mindig érdemes lesz fenntartásokkal és ellenőrzéssel kezelnie a Google Translate-tel magyarra fordított szócikkeket.

"Nem adunk át személyes adatot"

Rust? Kubernetes? FinOps? Melyiket válasszam?

Egy jó karrierdöntéshez sok apróság szükséges. Egy alapos hazai technológiai körkép azoban még hiányzott. Végre van ilyen, és a 21. kraftie adásban kidumáltuk.

Rust? Kubernetes? FinOps? Melyiket válasszam? Egy jó karrierdöntéshez sok apróság szükséges. Egy alapos hazai technológiai körkép azoban még hiányzott. Végre van ilyen, és a 21. kraftie adásban kidumáltuk.

A szervezet igyekszik kikötni, hogy a Google Fordítónak a Wikipédia-féle tartalomfordító eszközbe integrálása során a Google vagy Wikimédia Alapítvány semmilyen személyes adatot nem kap meg. A szócikkeket a Wikimédia szerverei küldik meg a Google szervereinek, miközben nem történik direkt kommunikáció a felhasználó és a külső szolgáltatások közt, így a keresőóriás szerverei nem kapják meg az IP-címet vagy a felhasználónevet. Továbbá a Google Fordító a fordításokat ingyenes licenccel küldi vissza a Wikipédiának (a Translate API ingyenes változatán keresztül), így az eszköz integrálása a szolgáltatásba a szervezet licencszabályainak megfelelően történik. Ez utóbbit a szervezet azért is igyekszik kikötni, mivel a Wikipédia elsősorban nyílt forrású szoftvereket használ, amibe a Translate API egyébként nem tartozik bele.

Ha pedig a felhasználó nem tart igényt a Google Translate fordítására, akkor ki is kapcsolhatja azt a Wikipédia tartalomfordító szolgáltatásán belül. "Bár a Content Translation felhasználói közül nagyon sokan igényelték ezt a fordító szolgáltatást, minden felhasználó önállóan dönthet róla, hogy szeretné-e használni vagy sem" - írja a MediaWiki önálló szócikke.

A Google és a Wikimédia közötti megállapodás egyelőre csak egy évre szól a Translate API ingyenes használatáról, majd ezt követően a partnerek újratárgyalják a feltételeket. Addig is a Wikipédia Content Translation szolgáltatása fejlődik, mivel letárolja a fordításokat, illetve a Content Translation API-n keresztül bárki számára szabadon elérhetővé teszi, hogy azzal a kutatócsoportok, nyílt forrású projektek vagy akár a kereskedelmi cégek a saját gépi fordító rendszereiket fejlesszék.

a címlapról