Mellékleteink: HUP | Gamekapocs
Keres
DevOps és frontend-fejlesztői témákkal indul idén a HWSW meetup-sorozata

Újabb gépi tanulási rendszert nyit meg a Google

Hlács Ferenc, 2019. február 19. 11:00

A PlaNet a modellalapú megerősítéses gépi tanulásban lehet a kutatók segítségére.

hirdetés

A modellalapú megerősítéses gépi tanulással foglalkozó szakértők dolgát könnyítheti meg a Google és a DeepMind a kiadott tervezőrendszere, a Deep Planning Network vagy röviden PlaNet.

A megerősítéses gépi tanulás során az adott rendszer a különböző kapott szenzoros értékeket, például kameraképeket vizsgálva hoz döntéseket, például egy robotkar mozgatására vonatkozóan - ha pedig jó döntést hoz, amely közelebb viszi a kitűzött célhoz, pozitív megerősítést kap. A modellalapú megerősítéses tanulásnál a rendszerek már nem csak közvetlenül a megfigyelésekre építenek, de a környezet működését is értelmezik, ami lehetővé teszi, hogy a különböző műveleteket előre megtervezzék, ismereteik, illetve a lehetséges végkimenetelek számbavétele alapján. Hasonló alapokon működik például a Google-től ismert AlphaGo is.

 

Ezt a fajta tervezést teszi egyszerűbbé a PlaNet, amely a bevitt képek alapján épít fel úgynevezett látens dinamikamodelleket. Utóbbiakkal a rendszer nem közvetlenül próbálja előre jelezni egy adott képből a rákövetkezőt, helyette magát a látens állapotváltozást igyekszik megjósolni. Ezzel a módszerrel a Google szerint a PlaNetre támaszkodó rendszer olyan elvontabb tulajdonságokat is képes automatikusan megtanulni, mint az egyes tárgyak pozíciója vagy sebessége.

A vállalat szerint az előrejelzések során hagyományos esetben az adott képek kódolása és dekódolása komoly számításai teljesítményt igényel, ami ugyancsak megspórolható a látens állapotváltozások előrejelzésével a komplett képek helyett. A cég példájával élve egy rendszer vizsgálhatja, hogy bizonyos mozdulatok hatására hogyan fog változni egy labda pozíciója, a predikciókat pedig az adott helyzet vizualizációja nélkül is meghozhatja. A PlaNet ráadásul előre lefektetett irányelvek nélkül használható, a rendszer kizárólag a tervezésre alapozva hoz döntéseket. A Google eddigi tapasztalatai kifejezetten biztatóak, a PlaNet hat, folyamatos vezérlést igénylő feladat során is közel megegyező, vagy jobb teljesítményt produkált, mint a hasonló modellek nélküli eljárások.

A PlaNet tehát szabadon elérhető, a Google a megoldásforráskódját is megnyitotta. Az a érdeklődőknek érdemes felkeresni a projekt GitHub oldalát, illetve a cég kapcsolódó kutatását is.

Facebook

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.
Két hét múlva újraindul a legnagyobb hazai tech meetup-sorozat, a HWSW free!