Szerző: Hlács Ferenc

2019. február 19. 11:00

Újabb gépi tanulási rendszert nyit meg a Google

A PlaNet a modellalapú megerősítéses gépi tanulásban lehet a kutatók segítségére.

A modellalapú megerősítéses gépi tanulással foglalkozó szakértők dolgát könnyítheti meg a Google és a DeepMind a kiadott tervezőrendszere, a Deep Planning Network vagy röviden PlaNet.

A megerősítéses gépi tanulás során az adott rendszer a különböző kapott szenzoros értékeket, például kameraképeket vizsgálva hoz döntéseket, például egy robotkar mozgatására vonatkozóan - ha pedig jó döntést hoz, amely közelebb viszi a kitűzött célhoz, pozitív megerősítést kap. A modellalapú megerősítéses tanulásnál a rendszerek már nem csak közvetlenül a megfigyelésekre építenek, de a környezet működését is értelmezik, ami lehetővé teszi, hogy a különböző műveleteket előre megtervezzék, ismereteik, illetve a lehetséges végkimenetelek számbavétele alapján. Hasonló alapokon működik például a Google-től ismert AlphaGo is.

 

01:20
 

Learning Latent Dynamics for Planning from Pixels

Még több videó

Ezt a fajta tervezést teszi egyszerűbbé a PlaNet, amely a bevitt képek alapján épít fel úgynevezett látens dinamikamodelleket. Utóbbiakkal a rendszer nem közvetlenül próbálja előre jelezni egy adott képből a rákövetkezőt, helyette magát a látens állapotváltozást igyekszik megjósolni. Ezzel a módszerrel a Google szerint a PlaNetre támaszkodó rendszer olyan elvontabb tulajdonságokat is képes automatikusan megtanulni, mint az egyes tárgyak pozíciója vagy sebessége.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak

Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

A vállalat szerint az előrejelzések során hagyományos esetben az adott képek kódolása és dekódolása komoly számításai teljesítményt igényel, ami ugyancsak megspórolható a látens állapotváltozások előrejelzésével a komplett képek helyett. A cég példájával élve egy rendszer vizsgálhatja, hogy bizonyos mozdulatok hatására hogyan fog változni egy labda pozíciója, a predikciókat pedig az adott helyzet vizualizációja nélkül is meghozhatja. A PlaNet ráadásul előre lefektetett irányelvek nélkül használható, a rendszer kizárólag a tervezésre alapozva hoz döntéseket. A Google eddigi tapasztalatai kifejezetten biztatóak, a PlaNet hat, folyamatos vezérlést igénylő feladat során is közel megegyező, vagy jobb teljesítményt produkált, mint a hasonló modellek nélküli eljárások.

A PlaNet tehát szabadon elérhető, a Google a megoldásforráskódját is megnyitotta. Az a érdeklődőknek érdemes felkeresni a projekt GitHub oldalát, illetve a cég kapcsolódó kutatását is.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról