A robotokat vezérlő szoftverek a nagy nyelvi modellek fejlődésével egyre szofisztikáltabbak, illetve egyre jobbak abban, hogy felismerjék a környezetüket és szóbeli utasításokra manipuláljanak tárgyakat.

A humanoid robotok működése ma még meglehetősen messze áll a hollywoodi víziótól, a mesterséges intelligencia fejlesztéseknek köszönhetően azonban ennek a területnek a fejlődése is szárnyra kapott az elmúlt években.

Szerdán a Google DeepMind csapata két olyan AI-modellről is lerántotta a leplet, melyek a Gemini 2.0 nagy nyelvi modellre építve a gépi látással összedrótozott szóbeli parancsfeldolgozásnak (vision-language-action, azaz VLA) köszönhetően képesek a környezetükre és a szóban kapott utasításokra bizonyos fizikai műveletek elvégzésére.

Gemini Robotics: Bringing AI to the physical world Még több videó

Mentorhatás: tapasztalt szememmel vezetem a kezedet A sikeres IT karrierek többsége mögött ott áll egy erős mentor, szerepének azonban nagyon sokféle árnyalata lehet. A sikeres IT karrierek többsége mögött ott áll egy erős mentor, szerepének azonban nagyon sokféle árnyalata lehet.

Mentorhatás: tapasztalt szememmel vezetem a kezedet A sikeres IT karrierek többsége mögött ott áll egy erős mentor, szerepének azonban nagyon sokféle árnyalata lehet.

A fejlesztőcsapat által közzétett demó alapján a Gemini Robotics-szel vezérelt robotkarok meg tudják különböztetni a különböző gyümölcsöket, illetve azokat képesek elhelyezni abban az edényben, amit a vezérlőszemélyzet szóban kijelöl a számukra. A robotkarok emellett a finommotorikus mozgást igénylő feladatokban is egyre ügyesebbek, így nemrég ugyanezek a karok cipőfűzőt kötöttek be, most pedig gond nélkül behúzzák egy táska zippzárját, illetve becsomagolnak egy szendvicset.

Gemini Robotics: Dexterous skills Még több videó

Ha ez nem lenne elég, a robotkarok már origamit is képesek hajtogatni, illetve akár amőbázni is be tudnak szállni. A Gemini Robotics nyelv nagy áttörése, hogy a robotok ezzel olyan tárgyakkal is képesek interakcióba lépni, melyekkel soha nem találkoztak még korábban, illetve a műveletvégzés nem lett előre felprogramozva.

Aki azonnal az utcákon emberekre lövöldöző terminátoroktól kezdett rettegni, azt szeretnénk megnyugtatni, hogy a Google már elkezdett dolgozni egy olyan keretrendszeren, mely hatékonyabban kívánja megakadályozni azt, hogy a robotok fizikai kárt okozzanak, az AI-modell révén a robot ugyanis képes megérteni és kontextusba helyezni a tetteinek a következményét. Már ha ez bárkit megnyugtat.