Szerző: Habók Lilla

2017. február 24. 13:30

Mesterséges Intelligenciát küld a Google a trollokra

A szerkesztőségek munkáját könnyíti meg a Google által közzétett Perspective API. A megoldás kiszűri azokat a hozzászólásokat a cikkek alatti beszélgetésekben, amelyek nem segítik elő az érdemi kommunikációt.

Nyilvánossá teszi fejlesztők felé a Google internetbiztonsággal foglalkozó Jigsaw részlege a sértő, valamint troll hozzászólókat felismerő Perspective API-ját. Az eszköz előzményiről több elképzelés is van, a The Verge szerint már 2010-ben is használta az ágazat a terroristacsoportok fórumos beszervezési akcióinak szűrésére, míg a TechCrunch azt jegyzi meg, hogy a megoldás a Yahoo korábban közzétett algoritmusára épül. A Wired szerint pedig a beszélgetés alapú mesterséges intelligencia fejlesztés mindig is nyílt forrású volt, csak mostantól a fejlesztők a Google szerverein futtathatják kódjaikat - és ez az a pillanat, mikortól kezdve a beszélgetés-AI nem csak egy érdekes kezdeményezés, hanem valós hasznot jelent.

Ezúttal a szoftvert a cég kifejezetten a zaklató, megfélemlítő megjegyzések kiszűrésére ajánlja a fejlesztők figyelmébe, például nagyobb online magazinok, portálok számára. A probléma a szerkesztőségekben folyamatosan jelen van, de a moderálás egyelőre csak az angol nyelvű tartalmaknál működik. Elsősorban az amerikai közönséget célozza meg, ahol különösen érzékenyek erre a témára, például a Reuters már korábban törölte a hozzászólások lehetőségét, a BuzzFeed pedig a szerkesztett tartalommal próbálkozik ebben a rovatban.

A Perspective a gépi tanulás módszerével és tízfős ellenőrző bizottságok közreműködésével állt össze, miközben több millió hozzászólást vizsgált a fórumokon és például a Wikipédia szócikkeihez tartozó szerkesztői megbeszélések közt - a kutatók utóbbi esetben megfigyelték, hogy a sértő megjegyzések közül mindössze 18 százalék kapott moderálást a felületen. Lényege, hogy meg tudja mondani egy adott megjegyzésről, hány százalékos valószínűséggel "mérgező" (toxic) a tartalom a korábbi hasonló példák alapján. A honlap szerint ennek definíciója: "durva, tiszteletlen vagy indokolatlan hozzászólás, amely miatt elhagyná a beszélgetést". A rendszert ebben a formában tesztelni is lehet a felületen, egy mondat begépelése után eldönti, hogy az milyen eséllyel lehet sértő tartalom.

Éles környezetben a szolgáltatás vizsgálja az adott kifejezéseken kívül a környezetét is, hogy a bántó megjegyzés a cikk tartalmára vagy másik hozzászólóra irányul. A szoftver a tartalmat nem törli azonnal, hanem több másik lehetőség közül lehet választani. Az összegyűjtött, legnagyobb százalékos valószínűséggel problémás hozzászólásokat elküldheti adott időközönként a szerkesztőnek, vagy megjelöli a beszélgetésfolyamban sértő tartalomként, és csak külön kattintással lehet hozzáférni. Harmadik változat pedig, hogy üzenetben értesíti a hozzászólás íróját az elért százalékról, és felteszi a kérdést, hogy valóban ezt akarta-e írni és közzétenni.

Miért nem beszélni AI tökéletesen magyart?

Milyen kihívásokat tartogat egy magyar nyelvi modell, például a PuliGPT fejlesztése?

Miért nem beszélni AI tökéletesen magyart? Milyen kihívásokat tartogat egy magyar nyelvi modell, például a PuliGPT fejlesztése?

Nagyobb lapok közül már több is elkezdte a használatát, a The New York Times napi 11 ezer hozzászólásának elemzése korábban 14 moderátor munkáját foglalta le, de reményeik szerint mostantól részt tudnának venni ehelyett az érdemi beszélgetésekben is, a megoldással emellett a TheGuardian és az Economist is kísérletezik. Ebben az esetben a lényeg a cikkek alatti hozzászólások megtisztítása a kommunikációt nem elősegítő megjegyzésektől, és ezáltal a beszélgetések értékesebbé tétele a mostaninál.

Az első teszteredmények szerint a Perspective-nek még lesz hová fejlődnie, mivel leginkább az utóbbi időben használt negatív kifejezésekre érzékeny vagy például az arab tartalomra, de a szexista megjegyzéseket nem igazán ismeri fel. Ez persze a gépi tanulásnál természetes folyamat, hogy a rendszer idővel egyre érzékenyebb lesz a megjelölt kifejezésekre vagy tartalmi környezetre, és talán a jövőben az angolon kívül más nyelveken is elkezdődik a fejlesztése, de a magyar nyelv támogatásához nem érdemes nagy reményeket fűzni.

Egyelőre az angol nyelvű tartalmakat kezelő API-hoz egy űrlapon lehet hozzáférést kérni, annak megadásával, hogy a fejlesztő milyen projekthez és milyen célból szeretné használni az eszközt, és ez hogyan javítaná tovább a meglévő rendszert.

Nagyon széles az a skála, amin a állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról

fab

7

Chipgyártó nagyhatalommá válna India

2024. március 18. 12:39

A helyi politikai vezetés szerint van rá esély, hogy a következő néhány évben az ország bekerüljön az öt vezető ország közé.