Szerző: Hlács Ferenc

2016. október 3. 14:59

Megnyitja pornószűrő algoritmusát a Yahoo

Szabadon igénybe vehető a Yahoo korhatáros tartalmakra vadászó neurális hálója, legalábbis ha az egyszeri fejlesztő hajlandó ki is képezni azt.

A korhatáros tartalmak szűrésének fontosságát valószínűleg senkinek nem kell ecsetelni, a monitoron váratlanul felbukkanó első- és másodlagos nemi jellegek sokaknak okoztak már kellemetlen pillanatokat a munkahelyen. Az online cégek szinte az internet hajnala óta küzdenek a kéretlen genitáliákkal, amelyeket mára javarészt sikerült az azoknak dedikált online bugyrokba száműzni - de hogy ott is maradjanak, az aktív munkát igényel. Ezt a feladatot könnyítheti meg a fejlesztők számára a Yahoo frissen megnyitott pornószűrő algoritmusa.

Fontos megjegyezni, hogy az immár szabadon elérhető deep learning szoftver, akárcsak az egységsugarú tinédzser, kifejezetten pornóra vadászik, más, nem szalonképes tartalmak, mint az például az erőszak, nem akad fent annak szűrőin. Az egyoldalú érdeklődés persze nem meglepő, hiszen a szexuális töltetű képek kiszűrése önmagában sem egyszerű feladat, sok esetben szubjektív területről van szó, egy-egy objektum egy fotón teljesen ártatlanul jelenhet meg, míg más kontextusban már erősen kifogásolható lehet.

A feladatot a Yahoo egy úgynevezett konvolúciós neurális hálózatra bízza - utóbbiak kifejezetten ügyesek a különböző képek besorolásában. A konvolúciós neurális hálózatok virtuális neuronjai közötti kapcsolódási mintákat az állati agy vizuális kérge ihlette, azok a kép- és mozgókép-felismerési megoldások mellett gyakran különböző ajánlórendszerek és természetes nyelvfeldolgozó megoldások mögött is megtalálhatók. Az ilyen hálózatok több réteg "befogadómezőt" tartalmaznak, utóbbiak lényegében olyan neuroncsoportok, amelyek a vizsgált kép egy-egy szekcióját dolgozzák fel. A képrészletek között a jobb eredmény érdekében átfedések is vannak, ez lehetővé teszi továbbá, hogy ugyanazon kép eltolt verzióit is felismerje az algoritmus. A hasonló neurális hálók erőssége a kis memórialábnyom, illetve ebből adódóan a szerényebb erőforrások mellett is hatékony teljesítmény - a különböző neurális hálózatokról korábban itt is megemlékeztünk.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak

Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

A Yahoo, hogy a hálózatot kiképezze a nem irodakompatibilis tartalmak elcsípésére, annak nagy mennyiségű pozitív, azaz esetünkben pornográf, illetve negatív, azaz "biztonságos" képet mutat, amelyekből aztán a rendszer megtanulja, pontosan milyen állandó paraméterek jellemzik a korhatáros képeket, majd később ezek alapján beazonosíthatja a hasonló tartalmú fotókat. Az elcsípett képekhez a rendszer egy 0 és 1 közötti értéket rendel, amelynél a 0 jelenti a teljesen ártatlan fotókat - a szám alapján a szolgáltatás döntheti el, hogy hol húzza meg a határt és megtűri-e még az vizsgált képet. A Yahoo a frissen bejelentett kezdeményezés keretei között egy még szűz neurális hálót ad a fejlesztőknek, azt az illetlen tartalmak kiszűrésére az érdeklődőknek maguknak kell megtanítaniuk - ipari mennyiségű pornóval.

A rendszer kiképzéséhez a Yahoo fejlesztői 256x256 pixel felbontásúra kicsinyített képeket gyűjtöttek össze, amelyeket véletlenszerűen 224x224 képpontra vágtak meg, és vízszintesen megfordítottak. A cég a Caffe deep learning libraryt és a nyílt forrású CaffeOnSpark, elosztott tanulási keretrendszert teszi a háló alá, utóbbival a Caffe Hadoop és Spark klasztereken is bevethető. Az ideális konvolúciós neurális hálózat létrehozásához a cég több modellt is megvizsgált - az ezekkel kapcsolatos részletekért érdemes felkeresni a vállalat vonatkozó blogposztját - végül pedig a ResNet-50-thin modell kiadása mellett döntött, lévén hogy utóbbi tudja felmutatni a legkedvezőbb pontosság-erőforrás arányt. A szoftver szabadon elérhető a cég kapcsolódó GitHub oldalán.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról