:

Szerző: Koi Tamás

2025. március 13. 13:37

Simán tudna uzsonnát csomagolni a gyereknek a Google DeepMind robottechnológiája

A robotokat vezérlő szoftverek a nagy nyelvi modellek fejlődésével egyre szofisztikáltabbak, illetve egyre jobbak abban, hogy felismerjék a környezetüket és szóbeli utasításokra manipuláljanak tárgyakat.

A humanoid robotok működése ma még meglehetősen messze áll a hollywoodi víziótól, a mesterséges intelligencia fejlesztéseknek köszönhetően azonban ennek a területnek a fejlődése is szárnyra kapott az elmúlt években. 

Szerdán a Google DeepMind csapata két olyan AI-modellről is lerántotta a leplet, melyek a Gemini 2.0 nagy nyelvi modellre építve a gépi látással összedrótozott szóbeli parancsfeldolgozásnak (vision-language-action, azaz VLA) köszönhetően képesek a környezetükre és a szóban kapott utasításokra bizonyos fizikai műveletek elvégzésére.

03:00
 

Gemini Robotics: Bringing AI to the physical world

Még több videó

Az AI és a nagy full-full-stack trend

Az AI farvizén számos új informatikai munkakör születik, vagy már ismert munkák kapnak új nevet és vele extra elvárásokat is.

Az AI és a nagy full-full-stack trend Az AI farvizén számos új informatikai munkakör születik, vagy már ismert munkák kapnak új nevet és vele extra elvárásokat is.

A fejlesztőcsapat által közzétett demó alapján a Gemini Robotics-szel vezérelt robotkarok meg tudják különböztetni a különböző gyümölcsöket, illetve azokat képesek elhelyezni abban az edényben, amit a vezérlőszemélyzet szóban kijelöl a számukra. A robotkarok emellett a finommotorikus mozgást igénylő feladatokban is egyre ügyesebbek, így nemrég ugyanezek a karok cipőfűzőt kötöttek be, most pedig gond nélkül behúzzák egy táska zippzárját, illetve becsomagolnak egy szendvicset.

01:42
 

Gemini Robotics: Dexterous skills

Még több videó

Ha ez nem lenne elég, a robotkarok már origamit is képesek hajtogatni, illetve akár amőbázni is be tudnak szállni. A Gemini Robotics nyelv nagy áttörése, hogy a robotok ezzel olyan tárgyakkal is képesek interakcióba lépni, melyekkel soha nem találkoztak még korábban, illetve a műveletvégzés nem lett előre felprogramozva.

Aki azonnal az utcákon emberekre lövöldöző terminátoroktól kezdett rettegni, azt szeretnénk megnyugtatni, hogy a Google már elkezdett dolgozni egy olyan keretrendszeren, mely hatékonyabban kívánja megakadályozni azt, hogy a robotok fizikai kárt okozzanak, az AI-modell révén a robot ugyanis képes megérteni és kontextusba helyezni a tetteinek a következményét. Már ha ez bárkit megnyugtat.

Szeptember 15-én, hétfőn ONLINE formátumú, a Kafka alapjaiba bevezető képzést indít a HWSW, ezért most összefoglaltuk röviden, hogy miért érdemes részt venni ezen a tanfolyamon.

a címlapról

MS

0

Lezárta a Teams-ügyet az EU

2025. szeptember 12. 12:45

A Bizottság elfogadta a Microsoft által tett engedményeket, nincs retorzió az idestova öt éve húzódó eljárás végén.

bango

5

Tartalomautomatával bővül a OneTV

2025. szeptember 12. 09:27

A One tévés platformjába a Bango DVM-jét integrálják, ami jelentős mértékben megkönnyíti az új tartalomszolgáltatások bevezetését.