// STADT-BREMERHAVEN — INTELLIGENZA ARTIFICIALE
Google integriert Computersteuerung direkt in Gemini 3.5 Flash
Google baut die Agenten-Fähigkeiten seiner KI weiter aus. Mit Gemini 3.5 Flash erhält das Modell ein integriertes Werkzeug zur Computersteuerung („Computer Use“). Entwickler können damit Anwendungen erstellen, die selbstständig mit Webseiten sowie Desktop- und mobilen Apps interagieren.
Die neue Funktion ist direkt in Gemini 3.5 Flash integriert und soll laut Google komplexe, mehrstufige Aufgaben vereinfachen. Statt lediglich Text zu erzeugen oder APIs aufzurufen, kann ein Agent Benutzeroberflächen bedienen und Aktionen in verschiedenen Umgebungen ausführen. Ergänzt wird dies durch Verbesserungen beim Function Calling, wodurch externe Dienste und Werkzeuge zuverlässiger eingebunden werden können.
Google sieht den Anwendungsbereich vor allem bei individuellen KI-Agenten, die wiederkehrende Arbeitsabläufe automatisieren oder Aufgaben über mehrere Anwendungen hinweg erledigen. Die Funktion steht Entwicklern über die Gemini API sowie die Gemini Enterprise Agent Platform zur Verfügung.
Beim Thema Sicherheit verweist Google auf mehrere Schutzmechanismen. Dazu gehören speziell trainierte Modelle gegen Prompt-Injection-Angriffe sowie zusätzliche Schutzsysteme für Unternehmenskunden. Diese sollen verhindern, dass bösartige Inhalte oder manipulierte Eingaben den Agenten zu unerwünschten Aktionen verleiten.
Mit der Integration von Computer Use folgt Google natürlich einem Trend, den auch andere KI-Anbieter verfolgen: Sprachmodelle sollen nicht mehr nur Antworten liefern, sondern eigenständig Aufgaben am Computer ausführen können.
Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.