// FRANDROID — INTELLIGENZA ARTIFICIALE
Gemini 3.5 Flash veut créer des agents IA « capables de voir, de raisonner et d’agir » sur votre smartphone et votre PC
Gemini va encore un cran plus loin dans la course aux agents IA avec sa nouvelle fonction Computer Use directement intégrée à la version 3.5 Flash.
« Gemini excelle déjà dans l’appel de fonctions et l’utilisation d’outils intégrés tels que la recherche et la géolocalisation de Maps. Grâce à ses capacités informatiques intégrées, les développeurs peuvent désormais utiliser Flash 3.5 pour créer de manière fiable des agents personnalisés capables de voir, de raisonner et d’agir aussi bien sur navigateur que sur mobile et sur ordinateur de bureau », affirme Google.
Bref, l’agent IA va pouvoir utiliser tout ce qu’il y a sur votre appareil pour mener à bien une tâche. D’après Google, l’outil vise les corvées longues : tests logiciels en continu, recherche sur plusieurs sites, paperasse numérique répétitive, etc.
Avant, cette capacité faisait l’objet d’un modèle à part, le Gemini 2.5 Computer Use sorti en octobre 2025, limité au navigateur. Le souci : il ne savait faire que ça et ne pouvait pas utiliser en même temps Google Search ou Maps. Les développeurs devaient donc jongler entre deux modèles. Désormais, le tout est fondu dans Gemini 3.5 Flash.
Un seul appel suffit pour qu’un agent regarde un écran, vérifie une info via la recherche et récupère une adresse. Autre nouveauté concrète : l’outil Computer Use gère désormais trois environnements, le navigateur, le smartphone et le desktop (au lieu de rester cantonné au web).
Côté performances, Google avance un score de 78,4 % sur OSWorld-Verified, un test qui évalue les agents sur Ubuntu, Windows et macOS. C’est mieux que la génération précédente, Gemini 3 Flash (65,1 %), et à 0,3 point sous GPT-5.5 d’OpenAI. Sauf que le vrai argument, c’est le prix : Gemini 3.5 Flash coûte 1,50 dollar par million de tokens en entrée et 9 dollars en sortie (environ 1,30 € et 7,90 €), contre 5 et 30 dollars pour GPT-5.5 (environ 4,40 € et 26 €). Sur des tâches qui enchaînent des centaines d’actions, l’écart se chiffre vite. Attention quand même : ces scores sont communiqués par Google, et un test en labo n’est pas un usage réel.
Un point de contexte sur la concurrence : sur le même benchmark OSWorld-Verified, c’est Claude Opus 4.8 d’Anthropic qui mène avec 83,4 %, devant GPT-5.5 (78,7 %). Au sommet du classement, l’écart se joue à quelques dixièmes de point, ce qui relativise la course aux records.
Une IA qui contrôle un navigateur avec accès à vos formulaires et vos fichiers pose forcément des questions liées à la sécurité. Le risque principal, c’est l’injection de prompt : un site cache des instructions malveillantes pour détourner l’agent. Google dit avoir entraîné spécifiquement le modèle contre ça et propose deux garde-fous optionnels : demander une confirmation avant une action sensible ou irréversible, et stopper net une tâche si une injection est détectée. L’entreprise recommande aussi de cloisonner l’agent et de garder un humain dans la boucle. Sa propre documentation déconseille d’ailleurs d’utiliser l’outil pour des décisions critiques ou des données sensibles sans supervision.
Pour l’instant, le « computer use » vise les développeurs et les entreprises, via l’API Gemini et la Gemini Enterprise Agent Platform. L’outil n’est pas encore un bouton accessible dans l’application grand public. Mais c’est clairement la brique sur laquelle Google construit ses futurs assistants capables d’agir à votre place, et l’injection de prompt reste un problème que toute l’industrie n’a pas résolu.
Le futur n’attend pas : anticipez l’avenir des nouvelles technologies et de l’IA en lisant gratuitement ToujoursPlus, chaque jeudi dans votre boîte mail !