Szerző: Hlács Ferenc

2017. február 06. 15:53:00

Új képfelismerő algoritmust izzít a Facebook

Tartalomfelismeréssel pontosítja képkereséseit a Facebook, gépi tanulásra építő Lumos rendszerével. A megoldás az Egyesült Államokban már élesedett.

Képfelismeréssel turbózza fel keresőalgoritmusát a Facebook, a közösségi oldal mostantól nem csak a képek címére és a hozzá kapcsolódó tagekre épít a fotók és videók közötti keresés során, de azok tényleges tartalmát is felismeri és figyelembe veszi. A technológiát a vállalat először a gyengénlátók segítségére vetette be, akiknek a rendszer szükség esetén leírja a képek tartalmát, mostantól pedig a pontosabb keresési találatokban is szerepet kap a gépi tanulásra építő megoldás.

Akárcsak a Facebook sok más, AI-ra építő kísérleti projektje, a képfelismerési rendszer is az FBLearner FLow névre hallgató platformról rajtolt el. Utóbbi szintén kisebb kaliberű projektként indult a cég AI Research részlegében, majd a vállalat alkalmazott gépi tanulással foglalkozó csapatához vándorolt, ahol komplett platformmá nőtte ki magát. A megoldással a gépi tanulási folyamatokat felépítő kutatóknak nem kell a különböző provisioning és skálázási problémákkal foglalkozni, így számottevően gyorsabban hozhatják létre különböző gépi tanulási projektjeiket. Az FBLearner Flow-n jelenleg nem kevesebb mint havi 1,2 millió kísérleti AI projekt fut le, ez hatszorosa az egy évvel ezelőtti számnak.

Az újonnan bevezetett kép- és videófelismerési megoldás Lumos névre hallgat, és a cég berkein belül egyre több csapat hajtja igába saját projektjeihez - a különböző alkalmazások fejlesztésekor kapott adatoknak hála pedig a rendszer folyamatosan fejlődik és egyre pontosabb lesz. A Facebook a közelmúltig a különböző fényképekhez és videókhoz szánt, gyengénlátókat célzó, automatikusan generált szövegeknél egyszerűen leírta, milyen objektumok láthatók az egyes képeken, a Lumost bevetve azonban a rendszer már különböző tevékenységeket is képes felismerni, így a leírásokban már például a "sétáló emberek" vagy "lovagló emberek" is megjelenhetnek.

Nem véletlen, hogy a közösségi óriás az új rendszert bejelentő blogposztjában elsősorban embereket ábrázoló fotókkal példálózik, hiszen a Facebook felületén közzétett képek, videók jelentős részén a felhasználók szerepelnek. Ennek megfelelően - első körben legalábbis - a képfelismerő rendszert is elsősorban az emberek és tevékenységeik hatékony felismerésére tanította be a vállalat. A rendszer kiképzése ráadásul kifejezetten felhasználó-, vagy inkább fejlesztőbarát folyamat, a vállalat mérnökeinek nincs szükségük külön deep learning vagy gépi látás képzettségre ahhoz, hogy saját projektjükhöz betanítsák a rendszert.

A Lumos neurális hálója persze nem csak az emberekkel birkózik meg, egy sor más objektumkategóriát is sikeresen azonosít, beleértve tárgyakat, állatokat, ismert földrajzi helyeket és épületeket, sőt ruhákat is. A Lumos fejlesztése persze nem áll meg ennyiben, a közösségi oldal csapata a későbbiekben is folyamatosan csiszolja a képfelismerő rendszert, amely idővel a cég újabb szolgáltatásaiba is utat talál. Ezzel a vállalat folytatja felzárkózását a Google mögé, amely Photos szolgáltatásában már megmutatta impresszív képfelismerő rendszerét. A Lumos képességei egyelőre csak a Facebook Egyesült Államokban élő felhasználói számára érhetők el.

a címlapról