Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 ist ein Vision-Language-Modell (VLM), das die agentenorientierten Funktionen von Gemini in die Robotik bringt. Es wurde für fortschrittliche Schlussfolgerungen in der physischen Welt entwickelt und ermöglicht Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen aus Befehlen in natürlicher Sprache zu planen.

Dokumentation

Auf der Seite Robotics finden Sie eine vollständige Übersicht über die Funktionen.

gemini-robotics-er-1.5-preview

Attribut Beschreibung
Modellcode gemini-robotics-er-1.5-preview
Unterstützte Datentypen

Eingaben

Text, Bilder, Video, Audio

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

65.536

Funktionen

Audiogenerierung

Nicht unterstützt

Batch API

Nicht unterstützt

Caching

Nicht unterstützt

Codeausführung

Unterstützt

Funktionsaufrufe

Unterstützt

Fundierung mit Google Maps

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Live API

Nicht unterstützt

Suchfundierung

Unterstützt

Strukturierte Ausgaben

Unterstützt

Denken

Unterstützt

URL-Kontext

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-robotics-er-1.5-preview
Letzte Aktualisierung September 2025
Wissensstichtag Januar 2025