Gemini Robotics-ER 1.5 ist ein Vision-Language-Modell (VLM), das die agentenorientierten Funktionen von Gemini in die Robotik bringt. Es wurde für fortschrittliche Schlussfolgerungen in der physischen Welt entwickelt und ermöglicht Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen aus Befehlen in natürlicher Sprache zu planen.
Dokumentation
Auf der Seite Robotics finden Sie eine vollständige Übersicht über die Funktionen.
gemini-robotics-er-1.5-preview
| Attribut | Beschreibung |
|---|---|
| Modellcode | gemini-robotics-er-1.5-preview |
| Unterstützte Datentypen |
Eingaben Text, Bilder, Video, Audio Ausgabe Text |
| Token-Limits[*] |
Eingabetokenlimit 1.048.576 Tokenausgabelimit 65.536 |
| Funktionen |
Audiogenerierung Nicht unterstützt Batch API Nicht unterstützt Caching Nicht unterstützt Codeausführung Unterstützt Funktionsaufrufe Unterstützt Fundierung mit Google Maps Nicht unterstützt Bildgenerierung Nicht unterstützt Live API Nicht unterstützt Suchfundierung Unterstützt Strukturierte Ausgaben Unterstützt Denken Unterstützt URL-Kontext Unterstützt |
| -Versionen |
|
| Letzte Aktualisierung | September 2025 |
| Wissensstichtag | Januar 2025 |