
Gemini Robotics: AI ontmoet de echte wereld
Met de AI-modellen Gemini Robotics en Gemini Robotics-ER, gebaseerd op Gemini 2.0, wil Google DeepMind de robotica vooruit helpen: Het basismodel beheerst fysieke taken, terwijl ER complexe problemen in dynamische omgevingen oplost.
Google DeepMind wil robots maken die zelfstandig handelen en denken. Op weg daar naartoe heeft het bedrijf nu een nieuwe mijlpaal gepresenteerd in de combinatie van kunstmatige intelligentie (AI) en robotica : de Gemini Robotics en Gemini Robotics-ER (Embodied Reasoning) modellen gebaseerd op Gemini 2.0. Beide modellen zijn erop gericht om AI-systemen niet alleen in staat te stellen om te handelen in de digitale wereld, maar ook in de fysieke wereld.
Terwijl Gemini Robotics zich richt op de basis van fysieke interactie, vult Gemini Robotics-ER deze mogelijkheden aan met logisch redeneren voor complexe problemen. De focus ligt hierbij op de ontwikkeling van robots die zelfstandig taken kunnen uitvoeren in dynamische omgevingen - van magazijnlogistiek tot alledaagse assistentie.
Drie kerninnovaties stimuleren de ontwikkeling
De vooruitgang van Gemini Robotics is gebaseerd op drie technologische pijlers:
1. universaliteit
De mogelijkheid om AI-modellen universeel toe te passen op verschillende robots en taken - zonder maatwerk. Dezelfde AI kan bijvoorbeeld zowel een robotarm in de productie als een mobiele robot in de logistiek besturen. De AI kan ook omgaan met situaties die nooit in een training aan bod zijn gekomen en deze de baas worden.
2. interactiviteit
Net als Gemini 2.0 is Gemini Robotics intuïtief en interactief. De AI begrijpt verschillende talen en alledaagse taal en kan reageren op complexe instructies. Omdat hij de omgeving continu in de gaten houdt, herkent hij veranderingen en kan hij daar dynamisch op reageren.
3. behendigheid
Het systeem helpt bij het nauwkeurig fysiek manipuleren van voorwerpen in 3D-ruimten. Het kan breekbare voorwerpen vastpakken, papier vouwen of dozen stapelen zonder voorafgaande programmering.
Verbeterd vermogen door belichaamd redeneren
Gemini Robotics-ER bouwt voort op de drie fundamenten en integreert het vermogen tot beter logisch redeneren in realtime. Dit is vooral bedoeld om het ruimtelijk denken te verbeteren. Het model is ontworpen om robots in staat te stellen complexe problemen in onvoorspelbare omgevingen op te lossen - bijvoorbeeld door handelingsketens te plannen, prioriteiten te stellen of oorzaak-en-gevolgrelaties te herkennen. Dankzij Gemini kunnen robots ook volledig nieuwe vaardigheden leren door ruimtelijk denken in combinatie met programmeervermogen - met andere woorden, ze kunnen intuïtief handelen.

Bron: Google DeepMind
Als een oplossing voor een probleem niet uit zichzelf kan worden gevonden, kan het model ook een menselijke demonstratie volgen om contextueel te leren.
Op de lange termijn moeten de nieuwe AI-modellen worden gebruikt in de industrie, bij rampenbestrijding en als alledaagse hulp. Gemini Robotics is bedoeld om repetitieve fysieke taken te automatiseren, terwijl Gemini Robotics-ER fungeert als probleemoplosser in onvoorspelbare contexten.
14 mensen vinden dit artikel leuk


De dagelijkse kus van de muze stimuleert mijn creativiteit. Als ze me vergeet, probeer ik mijn creativiteit terug te winnen door te dromen, zodat het leven mijn dromen niet verslindt.