Mellékleteink: HUP | Gamekapocs
Keres

Megnyitja pornószűrő algoritmusát a Yahoo

Hlács Ferenc, 2016. október 03. 14:59
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Szabadon igénybe vehető a Yahoo korhatáros tartalmakra vadászó neurális hálója, legalábbis ha az egyszeri fejlesztő hajlandó ki is képezni azt.

A korhatáros tartalmak szűrésének fontosságát valószínűleg senkinek nem kell ecsetelni, a monitoron váratlanul felbukkanó első- és másodlagos nemi jellegek sokaknak okoztak már kellemetlen pillanatokat a munkahelyen. Az online cégek szinte az internet hajnala óta küzdenek a kéretlen genitáliákkal, amelyeket mára javarészt sikerült az azoknak dedikált online bugyrokba száműzni - de hogy ott is maradjanak, az aktív munkát igényel. Ezt a feladatot könnyítheti meg a fejlesztők számára a Yahoo frissen megnyitott pornószűrő algoritmusa.

Fontos megjegyezni, hogy az immár szabadon elérhető deep learning szoftver, akárcsak az egységsugarú tinédzser, kifejezetten pornóra vadászik, más, nem szalonképes tartalmak, mint az például az erőszak, nem akad fent annak szűrőin. Az egyoldalú érdeklődés persze nem meglepő, hiszen a szexuális töltetű képek kiszűrése önmagában sem egyszerű feladat, sok esetben szubjektív területről van szó, egy-egy objektum egy fotón teljesen ártatlanul jelenhet meg, míg más kontextusban már erősen kifogásolható lehet.

A feladatot a Yahoo egy úgynevezett konvolúciós neurális hálózatra bízza - utóbbiak kifejezetten ügyesek a különböző képek besorolásában. A konvolúciós neurális hálózatok virtuális neuronjai közötti kapcsolódási mintákat az állati agy vizuális kérge ihlette, azok a kép- és mozgókép-felismerési megoldások mellett gyakran különböző ajánlórendszerek és természetes nyelvfeldolgozó megoldások mögött is megtalálhatók. Az ilyen hálózatok több réteg "befogadómezőt" tartalmaznak, utóbbiak lényegében olyan neuroncsoportok, amelyek a vizsgált kép egy-egy szekcióját dolgozzák fel. A képrészletek között a jobb eredmény érdekében átfedések is vannak, ez lehetővé teszi továbbá, hogy ugyanazon kép eltolt verzióit is felismerje az algoritmus. A hasonló neurális hálók erőssége a kis memórialábnyom, illetve ebből adódóan a szerényebb erőforrások mellett is hatékony teljesítmény - a különböző neurális hálózatokról korábban itt is megemlékeztünk.

A Yahoo, hogy a hálózatot kiképezze a nem irodakompatibilis tartalmak elcsípésére, annak nagy mennyiségű pozitív, azaz esetünkben pornográf, illetve negatív, azaz "biztonságos" képet mutat, amelyekből aztán a rendszer megtanulja, pontosan milyen állandó paraméterek jellemzik a korhatáros képeket, majd később ezek alapján beazonosíthatja a hasonló tartalmú fotókat. Az elcsípett képekhez a rendszer egy 0 és 1 közötti értéket rendel, amelynél a 0 jelenti a teljesen ártatlan fotókat - a szám alapján a szolgáltatás döntheti el, hogy hol húzza meg a határt és megtűri-e még az vizsgált képet. A Yahoo a frissen bejelentett kezdeményezés keretei között egy még szűz neurális hálót ad a fejlesztőknek, azt az illetlen tartalmak kiszűrésére az érdeklődőknek maguknak kell megtanítaniuk - ipari mennyiségű pornóval.

A rendszer kiképzéséhez a Yahoo fejlesztői 256x256 pixel felbontásúra kicsinyített képeket gyűjtöttek össze, amelyeket véletlenszerűen 224x224 képpontra vágtak meg, és vízszintesen megfordítottak. A cég a Caffe deep learning libraryt és a nyílt forrású CaffeOnSpark, elosztott tanulási keretrendszert teszi a háló alá, utóbbival a Caffe Hadoop és Spark klasztereken is bevethető. Az ideális konvolúciós neurális hálózat létrehozásához a cég több modellt is megvizsgált - az ezekkel kapcsolatos részletekért érdemes felkeresni a vállalat vonatkozó blogposztját - végül pedig a ResNet-50-thin modell kiadása mellett döntött, lévén hogy utóbbi tudja felmutatni a legkedvezőbb pontosság-erőforrás arányt. A szoftver szabadon elérhető a cég kapcsolódó GitHub oldalán.

Facebook

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.