Szerző: Hlács Ferenc

2019. február 19. 11:00

Újabb gépi tanulási rendszert nyit meg a Google

A PlaNet a modellalapú megerősítéses gépi tanulásban lehet a kutatók segítségére.

A modellalapú megerősítéses gépi tanulással foglalkozó szakértők dolgát könnyítheti meg a Google és a DeepMind a kiadott tervezőrendszere, a Deep Planning Network vagy röviden PlaNet.

A megerősítéses gépi tanulás során az adott rendszer a különböző kapott szenzoros értékeket, például kameraképeket vizsgálva hoz döntéseket, például egy robotkar mozgatására vonatkozóan - ha pedig jó döntést hoz, amely közelebb viszi a kitűzött célhoz, pozitív megerősítést kap. A modellalapú megerősítéses tanulásnál a rendszerek már nem csak közvetlenül a megfigyelésekre építenek, de a környezet működését is értelmezik, ami lehetővé teszi, hogy a különböző műveleteket előre megtervezzék, ismereteik, illetve a lehetséges végkimenetelek számbavétele alapján. Hasonló alapokon működik például a Google-től ismert AlphaGo is.

 

01:20
 

Learning Latent Dynamics for Planning from Pixels

Még több videó

Ezt a fajta tervezést teszi egyszerűbbé a PlaNet, amely a bevitt képek alapján épít fel úgynevezett látens dinamikamodelleket. Utóbbiakkal a rendszer nem közvetlenül próbálja előre jelezni egy adott képből a rákövetkezőt, helyette magát a látens állapotváltozást igyekszik megjósolni. Ezzel a módszerrel a Google szerint a PlaNetre támaszkodó rendszer olyan elvontabb tulajdonságokat is képes automatikusan megtanulni, mint az egyes tárgyak pozíciója vagy sebessége.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

A vállalat szerint az előrejelzések során hagyományos esetben az adott képek kódolása és dekódolása komoly számításai teljesítményt igényel, ami ugyancsak megspórolható a látens állapotváltozások előrejelzésével a komplett képek helyett. A cég példájával élve egy rendszer vizsgálhatja, hogy bizonyos mozdulatok hatására hogyan fog változni egy labda pozíciója, a predikciókat pedig az adott helyzet vizualizációja nélkül is meghozhatja. A PlaNet ráadásul előre lefektetett irányelvek nélkül használható, a rendszer kizárólag a tervezésre alapozva hoz döntéseket. A Google eddigi tapasztalatai kifejezetten biztatóak, a PlaNet hat, folyamatos vezérlést igénylő feladat során is közel megegyező, vagy jobb teljesítményt produkált, mint a hasonló modellek nélküli eljárások.

A PlaNet tehát szabadon elérhető, a Google a megoldásforráskódját is megnyitotta. Az a érdeklődőknek érdemes felkeresni a projekt GitHub oldalát, illetve a cég kapcsolódó kutatását is.

a címlapról