Új képfelismerő algoritmust izzít a Facebook
Tartalomfelismeréssel pontosítja képkereséseit a Facebook, gépi tanulásra építő Lumos rendszerével. A megoldás az Egyesült Államokban már élesedett.
Képfelismeréssel turbózza fel keresőalgoritmusát a Facebook, a közösségi oldal mostantól nem csak a képek címére és a hozzá kapcsolódó tagekre épít a fotók és videók közötti keresés során, de azok tényleges tartalmát is felismeri és figyelembe veszi. A technológiát a vállalat először a gyengénlátók segítségére vetette be, akiknek a rendszer szükség esetén leírja a képek tartalmát, mostantól pedig a pontosabb keresési találatokban is szerepet kap a gépi tanulásra építő megoldás.
Akárcsak a Facebook sok más, AI-ra építő kísérleti projektje, a képfelismerési rendszer is az FBLearner FLow névre hallgató platformról rajtolt el. Utóbbi szintén kisebb kaliberű projektként indult a cég AI Research részlegében, majd a vállalat alkalmazott gépi tanulással foglalkozó csapatához vándorolt, ahol komplett platformmá nőtte ki magát. A megoldással a gépi tanulási folyamatokat felépítő kutatóknak nem kell a különböző provisioning és skálázási problémákkal foglalkozni, így számottevően gyorsabban hozhatják létre különböző gépi tanulási projektjeiket. Az FBLearner Flow-n jelenleg nem kevesebb mint havi 1,2 millió kísérleti AI projekt fut le, ez hatszorosa az egy évvel ezelőtti számnak.
Hyperscaler vagy hazai felhő? Lehet, hogy nem kell választani! Egy jól felépített hibrid vagy multicloud modellben a különböző felhők nem versenytársai, hanem kiegészítői egymásnak.
Az újonnan bevezetett kép- és videófelismerési megoldás Lumos névre hallgat, és a cég berkein belül egyre több csapat hajtja igába saját projektjeihez - a különböző alkalmazások fejlesztésekor kapott adatoknak hála pedig a rendszer folyamatosan fejlődik és egyre pontosabb lesz. A Facebook a közelmúltig a különböző fényképekhez és videókhoz szánt, gyengénlátókat célzó, automatikusan generált szövegeknél egyszerűen leírta, milyen objektumok láthatók az egyes képeken, a Lumost bevetve azonban a rendszer már különböző tevékenységeket is képes felismerni, így a leírásokban már például a "sétáló emberek" vagy "lovagló emberek" is megjelenhetnek.
Nem véletlen, hogy a közösségi óriás az új rendszert bejelentő blogposztjában elsősorban embereket ábrázoló fotókkal példálózik, hiszen a Facebook felületén közzétett képek, videók jelentős részén a felhasználók szerepelnek. Ennek megfelelően - első körben legalábbis - a képfelismerő rendszert is elsősorban az emberek és tevékenységeik hatékony felismerésére tanította be a vállalat. A rendszer kiképzése ráadásul kifejezetten felhasználó-, vagy inkább fejlesztőbarát folyamat, a vállalat mérnökeinek nincs szükségük külön deep learning vagy gépi látás képzettségre ahhoz, hogy saját projektjükhöz betanítsák a rendszert.
A Lumos neurális hálója persze nem csak az emberekkel birkózik meg, egy sor más objektumkategóriát is sikeresen azonosít, beleértve tárgyakat, állatokat, ismert földrajzi helyeket és épületeket, sőt ruhákat is. A Lumos fejlesztése persze nem áll meg ennyiben, a közösségi oldal csapata a későbbiekben is folyamatosan csiszolja a képfelismerő rendszert, amely idővel a cég újabb szolgáltatásaiba is utat talál. Ezzel a vállalat folytatja felzárkózását a Google mögé, amely Photos szolgáltatásában már megmutatta impresszív képfelismerő rendszerét. A Lumos képességei egyelőre csak a Facebook Egyesült Államokban élő felhasználói számára érhetők el.