Gemini 1.5 : quand les robots plient le linge mieux que vous (et savent pourquoi)

Plier une chemise, préparer une valise selon la météo de Londres, ou trier compost et recyclables selon les règles de votre ville… Hier encore, c’était le lot de l’humain distrait. Aujourd’hui, Google DeepMind annonce que ses robots, boostés aux nouveaux modèles Gemini Robotics 1.5, sont capables de gérer tout ça — et mieux que vous, parce qu’ils savent pourquoi ils le font.

Un cerveau à deux têtes : ER ↔ VLA

Pour comprendre la révolution en marche, il faut imaginer un duo cérébral.

  • Gemini Robotics-ER 1.5 est le stratège : il observe, planifie, consulte le web, vérifie les contraintes.
  • Gemini Robotics 1.5, lui, est l’exécutant : il voit, comprend, et traduit ces plans en gestes précis.

Résultat : un système capable de décomposer une mission en étapes logiques, de vérifier chaque détail, puis d’agir sans hésitation. Hier, les robots suivaient un ordre à la fois. Aujourd’hui, ils réfléchissent, anticipent et raisonnent comme un majordome pressé de bien faire.

De la chemise froissée à la poubelle bien triée

Concrètement, cela donne des scènes presque comiques :

  • Un robot qui plie votre pile de linge en distinguant les couleurs sombres des claires.
  • Une machine qui consulte la météo londonienne avant de glisser un parapluie dans votre valise.
  • Un assistant qui fouille Google pour savoir si, chez vous, les pots de yaourt vont dans le recyclage… ou à la poubelle classique.

Bref, une forme de conscience domestique qui ne se contente plus d’obéir, mais comprend la logique derrière l’action. Et là, avouons-le, le robot fait déjà preuve d’un sérieux que nous, humains, n’avons pas toujours.

Des robots qui s’enseignent entre eux

Autre prouesse : ce que l’un apprend, l’autre le refait.
DeepMind a testé le système sur plusieurs machines : ALOHA2 (bras mécaniques), Franka (bi-bras), et même l’humanoïde Apollo d’Apptronik. Verdict : une tâche apprise par ALOHA2 fonctionne zéro-shot sur Apollo, sans reprogrammation.

C’est le rêve d’un langage universel du geste robotique : la capacité de partager des compétences entre robots aux corps différents. Demain, plier un t-shirt appris sur un bras industriel pourrait se retrouver, comme par magie, chez votre robot de compagnie.

Google ouvre (un peu) la boîte

Évidemment, Google ne livre pas toutes ses cartes.

  • Gemini Robotics-ER 1.5 est déjà disponible via l’API Gemini, pour les développeurs qui veulent tester la planification et le raisonnement.
  • Mais Gemini Robotics 1.5, la pièce maîtresse, reste réservé à quelques partenaires triés sur le volet.

DeepMind insiste aussi sur la sécurité : garde-fous contre les gestes absurdes, tests intensifs pour éviter que le robot ne transforme votre salon en champ de bataille, et un contrôle serré sur qui peut accéder à ces modèles.

Et demain ?

Avec Gemini 1.5, la robotique bascule dans une nouvelle ère : celle de l’agentique. Des machines capables non seulement d’exécuter, mais de comprendre et d’adapter leurs actions. Elles plient le linge, trient vos poubelles, prévoient la pluie… et peut-être bientôt, improviseront des solutions à vos problèmes quotidiens.

Alors posons la question : demain, qui pliera vraiment vos chaussettes ? Vous… ou Google ?

Laisser un commentaire