Le dernier modèle IA de DeepMind permet aux robots de faire de l’origami et de fermer des sachets zip

Le dernier modèle d'intelligence artificielle de DeepMind offre une assistance aux robots, leur permettant de réaliser des tâches délicates comme plier de l'origami ou fermer des sacs Ziploc.
Tl;dr
- Gemini 2.0 alimente de nouveaux modèles robotiques de Google DeepMind.
- Gemini Robotics vise à améliorer la généralité, l’interactivité et la dextérité des robots.
- DeepMind s’associe à Apptronik pour développer une nouvelle génération de robots humanoïdes.
Google DeepMind : une nouvelle ère de robotique avec Gemini 2.0
Depuis son introduction fin de l’année dernière, Gemini 2.0 a permis d’alimenter plusieurs produits Google, dont un nouveau chatbot en mode IA. Aujourd’hui, Google DeepMind exploite cette technologie pour des projets encore plus fascinants. La société a annoncé mercredi deux nouveaux modèles basés sur Gemini qui, selon elle, vont « poser les bases d’une nouvelle génération de robots utiles« .
Une amélioration significative de la robotique
Le premier modèle, Gemini Robotics, a été conçu pour faciliter la commande directe des robots. Selon DeepMind, les systèmes d’IA pour les robots doivent exceller en trois qualités : la généralité, l’interactivité et la dextérité. Ces qualités comprennent :
- La généralité, qui concerne la flexibilité d’un robot à s’adapter à de nouvelles situations, y compris celles qui ne sont pas couvertes par sa formation.
- L’interactivité, qui englobe la capacité d’un robot à répondre aux personnes et à l’environnement.
- La dextérité, qui représente les compétences motrices fines que les humains peuvent accomplir sans effort, mais qui sont difficiles à maîtriser pour les robots.
Des robots plus performants et polyvalents
« Bien que nos travaux précédents aient montré des progrès dans ces domaines, Gemini Robotics représente une avancée substantielle dans les performances sur ces trois axes, nous rapprochant de robots véritablement polyvalents« , déclare DeepMind. Par exemple, le robot ALOHA 2 de DeepMind, alimenté par Gemini Robotics, peut plier des origamis et fermer un sac Ziploc. Ce robot à deux bras comprend toutes les instructions qui lui sont données en langage naturel quotidien, et peut même accomplir des tâches malgré des obstacles.
Des partenariats pour l’avenir de la robotique
Google s’associe à Apptronik pour construire la prochaine génération de robots humanoïdes. En parallèle, DeepMind lance Gemini Robotics-ER (ou embodied reasoning), un second modèle qui permettra aux roboticiens d’exécuter leurs propres programmes en utilisant les capacités de raisonnement avancées de Gemini. DeepMind donne également accès au système à des « testeurs de confiance », y compris Boston Dynamics, anciennement filiale de Google.