Gemini de Google pourrait bientôt être capable de faire votre travail.

Des informations indiquent que Google travaille sur une mise à jour majeure de son assistant d'IA générative. GEMINICela pourrait transformer cet assistant conversationnel en un véritable agent commercial. Une analyse expérimentale récente du code de l'application Google par [nom de l'auteur] 9to5GoogleDes développeurs ont découvert des extraits de code qui pointent vers une fonctionnalité interne appelée « automatisation d'écran ». Cela suggère que Gemini pourrait bientôt être en mesure d'effectuer des actions directement pour votre compte dans certaines applications Android, comme passer des commandes ou réserver des vols, sans que l'utilisateur ait besoin de naviguer manuellement entre les écrans.

Alors que Gemini gère déjà des tâches conversationnelles comme la rédaction d'e-mails ou la création de plans de recherche, cette mise à jour semble viser à lui permettre d'interagir directement avec les interfaces des applications, en appuyant sur des boutons et en naviguant entre les écrans pour accomplir des tâches que vous réaliseriez normalement vous-même. Les premiers retours de la version bêta suggèrent que ces fonctionnalités seront initialement limitées à quelques applications compatibles et mettront l'accent sur la supervision de l'utilisateur. Google avertit d'ailleurs que « Gemini peut commettre des erreurs » et que les utilisateurs restent responsables des actions effectuées en son nom.

Logo Gemini Advanced

Comment cette mise à jour transforme-t-elle l'IA d'assistante en agent ?

Le concept d'automatisation d'écran représente une avancée majeure vers une plus grande autonomie de l'IA dans les flux de travail numériques quotidiens. Au lieu de simplement suggérer des actions possibles, Gemini pourrait bientôt les intégrer directement dans les applications. Les premiers extraits de code de la version bêta de Google soulignent également les mesures de protection de la vie privée, comme la recommandation aux utilisateurs de ne pas saisir leurs identifiants ou informations de paiement lors des conversations avec l'IA et l'avertissement que les captures d'écran pourraient être analysées afin d'améliorer la fonctionnalité. Google propose déjà certaines fonctionnalités d'agent via sa plateforme Gemini Agent dans Workspace et sur le Web, où l'IA peut gérer des flux de travail complexes et coordonner les services. L'automatisation d'écran pourrait quant à elle étendre ces fonctionnalités directement aux smartphones et à l'utilisation quotidienne des applications.

Une image montrant Google Gemini en fonctionnement sur un téléphone Pixel.

Si ces fonctionnalités sont largement déployées, cela pourrait transformer notre interaction avec les appareils mobiles, en passant d'une navigation tactile intuitive à l'autorisation donnée à des outils d'IA d'agir à notre place. Cela pourrait simplifier les tâches quotidiennes, mais soulève également des questions de contrôle, de sécurité et de supervision, notamment lorsque l'automatisation concerne des opérations sensibles comme les réservations ou les transactions financières.

D'après certaines sources, Google présente ces mises à jour comme optionnelles et supervisées, permettant aux utilisateurs de désactiver ou de remplacer Gemini à tout moment. Cependant, la fonctionnalité d'automatisation de l'écran est encore en développement et n'est pas encore disponible dans les versions stables.

Les commentaires sont fermés.