Google Gemini wird lebendiger und selbstständiger

Künstlerische Darstellung von Google Gemini mit neuem Design und autonomen Agenten, die auf einem Smartphone und Laptop interagieren.

Tech Von June 20.05.2026, 11:25

Die neuen Agenten-Funktionen geben einem Kollegen, der digitale Assistenten nutzt, etwas gemeinsamen Kontext.

Google Gemini wird lebendiger und selbstständiger Handlungsfluss und Kernfakten

Auf der Google I/O 2026 hat das Unternehmen ein umfassendes Update für seinen KI-Assistenten Gemini vorgestellt. Das neue Design mit der Sprache „Neural Expressive“ nutzt dynamische Animationen, verbesserte Typografie und haptisches Feedback. Die Antworten von Gemini werden nun stärker multimodal aufbereitet: je nach Kontext mit Bildern, interaktiven Zeitachsen, Grafiken oder vertonten Videos kombiniert. Auch die Sprachfunktion Gemini Live wurde optimiert, um Unterbrechungen während des Redeflusses zu vermeiden.

Ergänzt wird das Angebot um Gemini Omni, ein neues multimodales Modell, das Text-, Bild- und Video-Eingaben in hochauflösende Videos umwandeln kann. Die Steuerung erfolgt dabei über natürliche Spracheingaben. Abonnenten von Google AI Plus, Pro und Ultra können zudem eigene KI-Avatare aus persönlichem Bild- und Tonmaterial erstellen.

Der zentrale Fokus liegt jedoch auf den neuen autonomen Agenten. Der „Daily Brief“-Agent analysiert verknüpfte Google-Dienste wie Gmail und Kalender, priorisiert wichtige Inhalte und liefert morgens eine strukturierte Zusammenfassung mit Handlungsvorschlägen. Noch weiter geht „Gemini Spark“, der auf dem Modell Gemini 3.5 Flash und dem Framework „Antigravity“ basiert. Er arbeitet cloudbasiert und bleibt auch bei gesperrtem Gerät aktiv. In Google Workspace integriert, automatisiert er Aufgaben wie die Suche nach Abogebühren in Kreditkartenabrechnungen oder die Erstellung von Dokumenten aus Besprechungsprotokollen.

Für die Verbindung mit Drittanbietern wie Canva, OpenTable und Instacart kommt das Model Context Protocol (MCP) zum Einsatz. Bei sensiblen Aktionen wie Zahlungen oder dem Versand von E-Mails ist jedoch weiterhin eine manuelle Bestätigung erforderlich. Die Beta-Version von Gemini Spark startet zunächst für US-Nutzer mit Google AI Ultra. Nutzer der macOS-Desktop-App erhalten Zugang im Laufe des Sommers, wodurch auch lokale Dateien in die Workflows eingebunden werden können. Die Sprachsteuerung wird ebenfalls erweitert und kann gesprochene Eingaben direkt an der Cursor-Position in strukturierte Textentwürfe umwandeln.

Fakten

Google stellte auf der I/O 2026 ein neues Design für Gemini vor, basierend auf der Sprache „Neural Expressive“ mit Animationen und haptischem Feedback.
Gemini Omni kann multimodale Eingaben in hochauflösende Videos umwandeln und steht Abonnenten von Google AI Plus, Pro und Ultra zur Verfügung.
Der autonome Agent „Daily Brief“ analysiert Gmail und Kalender, um morgens eine personalisierte Zusammenfassung zu erstellen.
„Gemini Spark“ basiert auf Gemini 3.5 Flash und dem Framework „Antigravity“ und automatisiert Aufgaben in Google Workspace.
Die Beta von Gemini Spark startet für Google AI Ultra-Nutzer in den USA, macOS-Nutzer erhalten Zugriff im Laufe des Sommers.

Visuelle Nachrichtenerklärung von Canto. KI-Werkzeuge können die Produktion unterstützen. Redaktionelle Richtlinien

Fakten

Google launcht Googlebooks & Android 17

Home Assistant bringt Mai-Update

KI greift in die Geldbörse

Die SaaSpocalypse hat begonnen

Pixel 10: Kein Zurück mehr nach Update