Gemini 2.5 Flash-Sprachausgabe

Unsere schnellste Engine für hochwertige Sprachsynthese mit geringer Latenz und kosteneffizienter Audiogenerierung. Gemini 2.5 Flash TTS eignet sich am besten für Echtzeit-Assistenten, die Sprachausgabe großer Textmengen und Konversationsanwendungsfälle, die eine detaillierte Steuerung von Sprachstil und Tempo erfordern.

Dokumentation

Eine vollständige Beschreibung der Funktionen und Möglichkeiten finden Sie im Leitfaden zur Sprachausgabe.

gemini-2.5-flash-preview-tts

Attribut Beschreibung
Modellcode gemini-2.5-flash-preview-tts
Unterstützte Datentypen

Eingaben

Text

Ausgabe

Audio

Token-Limits[*]

Eingabetokenlimit

8.192

Tokenausgabelimit

16.384

Funktionen

Audiogenerierung

Unterstützt

Batch API

Unterstützt

Caching

Nicht unterstützt

Codeausführung

Nicht unterstützt

Dateisuche

Nicht unterstützt

Funktionsaufrufe

Nicht unterstützt

Fundierung mit Google Maps

Nicht unterstützt

Bildgenerierung

Nicht unterstützt

Live API

Nicht unterstützt

Suchfundierung

Nicht unterstützt

Strukturierte Ausgaben

Nicht unterstützt

Denken

Nicht unterstützt

URL-Kontext

Nicht unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • gemini-2.5-flash-preview-tts
Letzte Aktualisierung Dezember 2025