Gemini 2.5 Computer Use : l’agent Google qui clique, tape et scrolle pour vous 12 octobre 2025 à 18:55

Gemini 2.5 Computer Use : l’agent Google qui clique, tape et scrolle pour vous

SysKB

Par : Max

12 octobre 2025 à 18:55

Gemini 2.5 Computer Use est le nouveau modèle de Google dédié aux agents capables d’agir dans une interface web comme un humain. Il “voit” l’écran, comprend le contexte, puis décide où cliquer, quoi taper, et quand faire défiler. Cette approche vise tous les cas où l’on n’a pas d’API, mais où un navigateur suffit pour accomplir une tâche de bout en bout.

Ce que l’agent sait faire et pour quoi l’utiliser

Concrètement, l’agent exécute des actions UI standardisées : ouvrir une page, suivre un lien, remplir un formulaire, valider un paiement test, ou récupérer une information derrière un login. Grâce à la vision d’écran, il repère les éléments visuels même si leur code change légèrement. Dès lors, on automatise des parcours métiers côté web sans réécrire des scripts fragiles.
Dans un premier temps, l’accent porte sur le navigateur. C’est un choix pragmatique : le web est l’interface universelle des services modernes. Par conséquent, on cible des scénarios à fort ROI comme l’e-commerce, le support client, la qualification de leads, les tests UI, ou la collecte d’informations structurées.

Comment fonctionne la boucle d’actions

Le fonctionnement suit un schéma simple et robuste. D’abord, votre application capture l’écran et passe l’historique des pas déjà effectués. Ensuite, Gemini 2.5 Computer Use propose la “prochaine meilleure action” sous forme d’instruction structurée : clic, saisie, scroll, raccourci clavier, ou navigation. Puis votre app exécute cette action via l’automatisation du navigateur et renvoie une nouvelle capture.
Cette boucle de perception-action se répète jusqu’à réussite, blocage, ou attente d’une confirmation. Ainsi, l’agent reste explicable : chaque pas est loggé, rejouable et auditable. En outre, ce design facilite le “retry” ou l’adaptation à des variations d’interface, ce qui améliore la robustesse en production.

Benchmarks et premiers retours

Côté performance, les derniers benchmarks publics indiquent un taux de réussite élevé sur des suites de tâches du monde réel. Sur un test de navigation complexe, le modèle atteint 79,9 % de succès, devant des agents concurrents qui plafonnent plus bas. Sur d’autres évaluations multi-sites, il se classe également en tête, avec une latence en baisse et des coûts maîtrisés.
Sur le terrain, les premiers pilotes rapportent des exécutions plus rapides que les alternatives, parfois jusqu’à 50 % selon les scénarios. Par ailleurs, l’orientation “web d’abord” simplifie l’adoption : les équipes peuvent brancher l’agent dans leurs pipelines QA, leurs assistants internes, ou leurs scripts d’automatisation sans refonte d’outillage.

Sécurité : confirmations et garde-fous par étape

Google a conçu une surcouche de sécurité qui analyse chaque étape avant exécution. Dès qu’une action présente un risque — par exemple cliquer sur “Acheter maintenant”, lire un document médical, ou envoyer un message sensible — l’agent doit demander une confirmation explicite. De plus, des politiques contrôlent l’accès aux données, les domaines autorisés, et les opérations critiques.
Ce modèle de “permission granulaire” réduit les erreurs coûteuses et rassure les équipes conformité. Mieux, il favorise l’adoption dans des contextes réglementés, car les actions deviennent traçables et gouvernées. Ainsi, les responsables produit gardent la main, tout en déléguant l’exécution répétitive à l’IA.

Limites actuelles et feuille de route implicite

Aujourd’hui, le périmètre privilégié est le navigateur. L’agent n’a pas vocation, pour l’instant, à piloter l’intégralité d’un système d’exploitation. Toutefois, la boucle perception-action, la vision de l’écran, et l’outillage développeur laissent penser que l’extension à d’autres surfaces d’UI suivra. En attendant, les cas d’usage web couvrent déjà une large part des besoins opérationnels.

Comment démarrer

Pour tester rapidement, on passe par AI Studio ou par Vertex AI. On décrit la tâche, on donne les accès nécessaires, et on branche l’exécution du navigateur. Ensuite, on mesure la fiabilité sur vos parcours et on rajuste les “prompts d’agent”, les timeouts, et les règles de confirmation. Enfin, on industrialise via des files de jobs et de la télémétrie, afin d’observer les taux de succès dans le temps.

Gemini 2.5 Computer Use apporte un vrai saut pour les agents web. Il combine vision d’écran, planification d’actions, et garde-fous solides. Résultat : des workflows plus rapides, plus fiables et plus sûrs, sans dépendre d’intégrations API fragiles.

Cet article original intitulé Gemini 2.5 Computer Use : l’agent Google qui clique, tape et scrolle pour vous a été publié la première sur SysKB.

Dessine ton patron ✏️, couds ton projet 🪡 : le tuto spécial fermoir métallique ✨ - YouTube 12 octobre 2025 à 12:38

Dessine ton patron ✏️, couds ton projet 🪡 : le tuto spécial fermoir métallique ✨ - YouTube

Mes liens

12 octobre 2025 à 12:38

Vraiment pratique, je me suis toujours demandé comment on faisait avec ces fermoirs

— Liens directs

Une arnaque au "faux garage" fait de plus en plus de victimes,"ils peuvent faire débourser 20 000 euros à n'importe qui" 12 octobre 2025 à 07:57

Une arnaque au "faux garage" fait de plus en plus de victimes,"ils peuvent faire débourser 20 000 euros à n'importe qui"

Shaarli de Marc

12 octobre 2025 à 07:57

Arnaque au "faux garage".
Même véhicule vendu à plusieurs personnes.

Je suis totalement d'accord avec la fin de l'article :
"L'avocat souhaite que la responsabilité des banques soit interrogée. "Un compte contenant plusieurs centaines de milliers d'euros, vidé d'un coup, c'est une procédure inhabituelle et suspecte. Il y a eu un manque de vigilance"."

Encore une fois, une absence de contrôle du capitalisme, qui entraîne cette fois ci des arnaques aux particuliers.

À rapprocher de https://ascadia.net/links/shaare/t2snuQ

— Permalink

Voldemort (Acoustique) - YouTube 11 octobre 2025 à 20:00

Voldemort (Acoustique) - YouTube

Bill2's Links

11 octobre 2025 à 20:00

Et paf, encore un texte qu'on se prend dans la tronche.

J'ai tendance à dire que les groupes de (hard)rock font les plus belles balades.

Et bien, quand les humoristes font du sérieux, c'est pareil.
Laura Laune, spécialiste de l'humour noir et du sarcasme, nous livre ici un texte magnifique.
Sous couvert de vannes touchant aux univers d'Harry Potter et Disney, on sent qu'elle en a (très) gros sur la patate.
C'est pas super bien chanté (avec tout mon respect), mais c'est très finement écrit, et tellement bien dit !
(Permalink)

IA ou réel ? 3 jeux en ligne gratuits pour entraîner vos élèves à repérer les images factices 11 octobre 2025 à 18:36

IA ou réel ? 3 jeux en ligne gratuits pour entraîner vos élèves à repérer les images factices

Les Outils Tice

Par : Fidel Navamuel

11 octobre 2025 à 18:36

Dernière mise à jour le 11 octobre 2025 Comment enseigner à nos élèves à distinguer une image réelle, capturée par un objectif, d’une création d’un des multiples outils pour générer des images avec l’iA...

L’article IA ou réel ? 3 jeux en ligne gratuits pour entraîner vos élèves à repérer les images factices est apparu en premier sur Les Outils Tice.

ressources sur la question du climat 11 octobre 2025 à 09:19

ressources sur la question du climat

OpenNews

11 octobre 2025 à 09:19

vid{56af2ca8f75d51c405f4e500d36f4675bad893c47f64870219b82dcae6a62213}
— Permalink

Donald Trump et Pete Hegseth appellent 800 généraux à combattre « l’ennemi intérieur » 11 octobre 2025 à 09:09

Donald Trump et Pete Hegseth appellent 800 généraux à combattre « l’ennemi intérieur »

OpenNews

11 octobre 2025 à 09:09

Outch, ça pue très très fort

via https://sebsauvage.net/links/?V8BUEA

État de la fascisation des USA :
- État-major remodelé par Trump (limogeage des généraux pas en accord avec les idées de Trump)
- "Département de la défense" renommé en "Département de la guerre".
- Dénonce de la "dérive woke" (critique des femmes dans les unités combattantes, transsexuels, gros, barbus, cheveux longs…)
- Augmentation des salaires de militaires.
- Désignation d'un ennemi de l'intérieur.
- Les villes tenues par l'opposition (les démocrates) sont qualifiées de "zones de guerre" et désignées comme cibles.

Je crois que c'est clair, non ?

EDIT: Trunc de dingue, cette vidéo n'est pas truquée : Trump déclare la guerre à ceux qui luttent contre le fascisme.
https://xcancel.com/WhiteHouse/status/1976426210155692062
Les antifascistes sont donc officiellement déclarés comme organisation terroriste et ennemis de l'état.

EDIT: Et Trump continue à s'en prendre aux membres de la Cour pénale internationale.
En particulier, les juges voient tous leurs services bloqués : Amazon, PayPal, Airbnb, cartes de crédit (Visa et Mastercard sont américains). Les commandes sont annulées, les colis pas livrés, les paiements annulés. Toute entreprise américaine n'a plus le droit de leur fournir de services, que ce soit à titre gracieux ou non.
https://www.france24.com/fr/info-en-continu/20251010-vis%C3%A9-par-des-sanctions-am%C3%A9ricaines-le-juge-fran%C3%A7ais-de-la-cpi-d%C3%A9nonce-des-atteintes-%C3%A0-l-etat-de-droit

vid{264b93c4a3a4d80dafcc27fd6e4ad7f6302c34d253cd12a3fd161a5e78c50555}
— Permalink

Tout le monde connaît votre emplacement : me localiser grâce aux publicités dans les applications, par Tim 10 octobre 2025 à 21:41

Tout le monde connaît votre emplacement : me localiser grâce aux publicités dans les applications, par Tim

Liens Ecyseo

10 octobre 2025 à 21:41

Vous pensiez avoir désactiver la géolocalisation de votre iPhone ou votre Android ?
Ah, ah !!! Vous vous mettez le doigt dans l'œil !
— Permalink

Portail primaire de la Forge 10 octobre 2025 à 06:29

Portail primaire de la Forge

Les bons liens du Gégé...

10 octobre 2025 à 06:29

Applications destinées aux primaires
— Permalien

Lighthouse - The feed reader for finding actionable content 10 octobre 2025 à 13:57

Lighthouse - The feed reader for finding actionable content

Mes liens

10 octobre 2025 à 13:57

Une liste non exhaustive de client et agrégateur RSS. Perso, je suis sur Miniflux en auto-hébergé

— Liens directs

Les échecs à l’ère de l’IA, avec Laurent Fressinet, grand maître international 2/3 : Pourquoi Magnus Carlsen s’est mis à sacrifier ses pions ? 10 octobre 2025 à 11:05

Les échecs à l’ère de l’IA, avec Laurent Fressinet, grand maître international 2/3 : Pourquoi Magnus Carlsen s’est mis à sacrifier ses pions ?

Shaarli | Orangina Rouge

10 octobre 2025 à 11:05

Décidément, j'adore ce podcast !
Ici, on parle de l'intelligence artificielle et des échecs. En mentionnant le titre d'un livre qui s'appelle Intelligence Artificielle versus Intelligence Humaine, il me vient la réflexion suivante.

L'intelligence artificielle est meilleure que l'homme pour résoudre des problèmes.
Tandis que l'intelligence humaine est meilleure que la machine pour énoncer les problèmes.

— Permalien

France Inter : Laurence Bloch et Charline Vanhoenacker racontent le crépuscule du rire politique – Libération 10 octobre 2025 à 10:51

France Inter : Laurence Bloch et Charline Vanhoenacker racontent le crépuscule du rire politique – Libération

Sammy Fisher Jr

10 octobre 2025 à 10:51

France Inter : fini de rire (ou en tout cas, plus avec la politique)

> Charline Vanhoenacker, qui, on s’en doute, ne peut pas s’épancher de la même manière sur son actuel employeur, se contente de dédicacer aux journalistes son Canari dans la mine avec une formule pleine de sous-entendus : «Avant le coup de grisou.» Sent-elle le terminus s’approcher ? Dans la présentation du livre, c’est plus explicite : «L’humour politique, c’est le canari dans la mine : quand il arrête de chanter, arrive le coup de grisou», écrit-elle.
(Permalink)

France Inter : Laurence Bloch et Charline Vanhoenacker racontent le crépuscule du rire politique – Libération 10 octobre 2025 à 10:51

France Inter : Laurence Bloch et Charline Vanhoenacker racontent le crépuscule du rire politique – Libération

Choses vues, sur le web et ailleurs

10 octobre 2025 à 10:51

France Inter : fini de rire (ou en tout cas, plus avec la politique)

> Charline Vanhoenacker, qui, on s’en doute, ne peut pas s’épancher de la même manière sur son actuel employeur, se contente de dédicacer aux journalistes son Canari dans la mine avec une formule pleine de sous-entendus : «Avant le coup de grisou.» Sent-elle le terminus s’approcher ? Dans la présentation du livre, c’est plus explicite : «L’humour politique, c’est le canari dans la mine : quand il arrête de chanter, arrive le coup de grisou», écrit-elle.
(Permalink)

Rapport du _Shift Project_ sur l'IA 10 octobre 2025 à 09:18

Rapport du _Shift Project_ sur l'IA

Mes liens

10 octobre 2025 à 09:18

Les recommandations du Shift

Mesure et transparence : assurer un suivi public de la filière et la transparence des services d’IA.

Optimisation : limiter l'empreinte environnementale des solutions d'IA et des équipements associés et suivre les référentiels sur l'IA frugale.

Réorganisation collective vers la sobriété : définir et faire respecter une trajectoire plafond de consommation électrique des centres de données.

Formation & compétences : ne pas réorienter les ressources de formation et le débat public vers l’IA plutôt que vers la transition environnementale.

— Liens directs

Biais de faux consensus : Pourquoi surestimons-nous à quel point les autres partagent nos opinions ? 10 octobre 2025 à 06:33

Biais de faux consensus : Pourquoi surestimons-nous à quel point les autres partagent nos opinions ?

Windtopik

Par : Régis

10 octobre 2025 à 06:33

En tant que rédacteurs passionnés par la science cognitive et le lifehacking, nous savons combien il est précieux de comprendre nos propres modes de pensée. Parmi les nombreux biais cognitifs qui influencent notre quotidien, le biais de faux consensus occupe une place centrale : il nous pousse à croire que nos opinions et comportements sont bien plus […]

L’article Biais de faux consensus : Pourquoi surestimons-nous à quel point les autres partagent nos opinions ? est apparu en premier sur Windtopik.

36 Points 10 octobre 2025 à 03:21

36 Points

Zertrin's links

10 octobre 2025 à 03:21

Un logiciel qui créé des motifs intéressants, presque "naturels".
(Permalink)

Lex Imperii - https://www.youtube.com/@leximperii 9 octobre 2025 à 21:47

Lex Imperii - https://www.youtube.com/@leximperii

OpenNews

9 octobre 2025 à 21:47

Petit coup de pouce pour une chaîne YouTube qui parle essentiellement des impérialismes modernes (geopolitique).

J'en parle car le créateur de la chaine se fait shadow ban par les algos de youtube depuis quelques temps.

Contenu de qualité de ce que j'ai pu en entendre.
vid{4d0f461e0418a6689e658b89a7f3c092bcb5f68273762511b8b771f1b2a7934c}
— Permalink

Morgan & Morgan takes Disney to court over rights to feature ‘Steamboat Willie’ in law firm ads - YouTube 9 octobre 2025 à 13:19

Morgan & Morgan takes Disney to court over rights to feature ‘Steamboat Willie’ in law firm ads - YouTube

Shaarli de Marc

9 octobre 2025 à 13:19

Le Mickey de la fin des années 20 est en domaine public.
Morgan and Morgan s'en sont servi.
Reste plus qu'un film d'horreur...

J'adore la liberté. Vraiment.
EDIT : La liberté de s'exprimer pour dénoncer. Précision utile.

— Permalink

Fluid Glass 9 octobre 2025 à 13:15

Fluid Glass

Shaarli de Marc

9 octobre 2025 à 13:15

Magnifique.
Bravo.

Via : https://sebsauvage.net/links/?J2mMVA

— Permalink

Writing Doom – Award-Winning Short Film on Superintelligence (2024) - YouTube 9 octobre 2025 à 13:13

Writing Doom – Award-Winning Short Film on Superintelligence (2024) - YouTube

Liens utiles et à partager

9 octobre 2025 à 13:13

A writing team are given the task of making Artificial Superintelligence the 'bad guy' for the next season of their TV show. With the help of a newcomer to the team (a Machine Learning PhD), they must figure out how and why an ASI might function as an antagonist - and the threat it might pose to humanity.

I loved it ❤️

— Permalien

Vue normale

Ce que l’agent sait faire et pour quoi l’utiliser

Comment fonctionne la boucle d’actions

Benchmarks et premiers retours

Sécurité : confirmations et garde-fous par étape

Limites actuelles et feuille de route implicite

Comment démarrer