Modele Gemini

Warianty modelu

Gemini API oferuje różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wersji Gemini:

Wariant modelu Dane wejściowe Wyniki Zoptymalizowany dla
Gemini 2.5 Pro
gemini-2.5-pro
dźwięk, obrazy, filmy, tekst i pliki PDF; Tekst Ulepszone myślenie i rozumowanie, multimodalne rozumienie, zaawansowane kodowanie i inne funkcje
Gemini 2.5 Flash
gemini-2.5-flash
dźwięk, obrazy, filmy i tekst; Tekst Myślenie adaptacyjne, opłacalność
Wersja podglądowa Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17
Tekst, obraz, film oraz plik dźwiękowy Tekst Najbardziej ekonomiczny model obsługujący dużą przepustowość
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
Audio, filmy i tekst Tekst i dźwięk, przeplatane Wysokiej jakości, naturalne wyjścia audio rozmowy z myśleniem lub bez niego
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts
Tekst Dźwięk Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Wersja podglądowa Gemini 2.5 Pro TTS
gemini-2.5-pro-preview-tts
Tekst Dźwięk Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Gemini 2.0 Flash
gemini-2.0-flash
dźwięk, obrazy, filmy i tekst; Tekst Funkcje nowej generacji, szybkość i transmisja strumieniowa w czasie rzeczywistym.
Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation
dźwięk, obrazy, filmy i tekst; Tekst, obrazy Generowanie i edytowanie obrazów w trybie konwersacyjnym
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
dźwięk, obrazy, filmy i tekst; Tekst Opłacalność i krótkie czasy oczekiwania
Gemini 1.5 Flash
gemini-1.5-flash
dźwięk, obrazy, filmy i tekst; Tekst Szybkie i wszechstronne działanie w różnych zadaniach.
Wycofane
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
dźwięk, obrazy, filmy i tekst; Tekst Zadania o dużej liczbie zapytań i mniejszym stopniu złożoności
Wycofane
Gemini 1.5 Pro
gemini-1.5-pro
dźwięk, obrazy, filmy i tekst; Tekst Złożone zadania wymagające większej inteligencji
Wycofane
Umieszczanie Gemini
gemini-embedding-001
Tekst Wektory dystrybucyjne tekstu Pomiar podobieństwa ciągów tekstowych
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06
Tekst Obrazy Nasz najnowszy model do generowania obrazów
Imagen 3
imagen-3.0-generate-002
Tekst Obrazy Model generowania obrazów wysokiej jakości
Veo 2
veo-2.0-generate-001
Tekst, obrazy Wideo Generowanie filmów w wysokiej jakości
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
dźwięk, obraz i tekst; Tekst, dźwięk Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
dźwięk, obraz i tekst; Tekst, dźwięk Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami

Limity szybkości dla poszczególnych modeli znajdziesz na tej stronie.

Gemini 2.5 Pro

Gemini 2.5 Pro to nasz najnowocześniejszy model myślący, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu gemini-2.5-pro
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy, tekst i pliki PDF;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj groundingu

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Obsługiwane

Batch API

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Stable: gemini-2.5-pro
  • Preview: gemini-2.5-pro-preview-06-05
  • Preview: gemini-2.5-pro-preview-05-06
  • Preview: gemini-2.5-pro-preview-03-25
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o niskim czasie oczekiwania i dużej objętości, które wymagają myślenia, oraz zastosowań związanych z agentami.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy, dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Możliwości

Generowanie dźwięku

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Wykonanie kodu

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Obsługiwane

Myślenie

Obsługiwane

Dostrajanie

Nieobsługiwane

Batch API

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Stabilny: gemini-2.5-flash
  • Podgląd: gemini-2.5-flash-preview-05-20
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Wersja testowa Gemini 2.5 Flash-Lite

Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-lite-preview-06-17
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy i dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 000 000

Limit tokenów wyjściowych

64 000

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Kontekst URL

Obsługiwane

Szukaj groundingu

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.5-flash-lite-preview-06-17
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash Native Audio

Nasze natywne modele dialogów audio z myśleniem i bez niego, dostępne w ramach interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy z użyciem promptów dotyczących stylu i kontroli.

Wypróbuj natywny dźwięk w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-preview-native-audio-dialog &
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
Obsługiwane typy danych

Dane wejściowe

Audio, wideo, tekst

Dane wyjściowe

Dźwięk i tekst

Limity tokenów[*]

Limit tokenów wejściowych

128 000

Limit tokenów wyjściowych

8000

Możliwości

Generowanie dźwięku

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Obsługiwane

Dostrajanie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.5-flash-preview-05-20
  • Eksperymentalne: gemini-2.5-flash-exp-native-audio-thinking-dialog
Ostatnia aktualizacja Maj 2025 r.
Granica wiedzy Styczeń 2025 r.

Podgląd zamiany tekstu na mowę w Gemini 2.5 Flash

Gemini 2.5 Flash Preview TTS to nasz model zamiany tekstu na mowę o korzystnym stosunku ceny do wydajności, który zapewnia dużą kontrolę i przejrzystość w przypadku ustrukturyzowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji przedpremierowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Dźwięk

Limity tokenów[*]

Limit tokenów wejściowych

8000

Limit tokenów wyjściowych

16 000

Możliwości

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • gemini-2.5-flash-preview-tts
Ostatnia aktualizacja Maj 2025 r.

Przesłuchiwanie tekstu w Gemini 2.5 Pro

Gemini 2.5 Pro Preview TTS to nasz najpotężniejszy model zamiany tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w przypadku uporządkowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny lub w wersji testowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-pro-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Dźwięk

Limity tokenów[*]

Limit tokenów wejściowych

8000

Limit tokenów wyjściowych

16 000

Możliwości

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • gemini-2.5-pro-preview-tts
Ostatnia aktualizacja Maj 2025 r.

Gemini 2.0 Flash

Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne korzystanie z narzędzi i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Obsługiwane

Myślenie

Eksperymentalne

Batch API

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-2.0-flash
  • Stabilny: gemini-2.0-flash-001
  • Eksperymentalne: gemini-2.0-flash-exp
Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Generowanie obrazów w Gemini 2.0 Flash

Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edycję obrazów w formie konwersacji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-preview-image-generation
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst i obrazy

Limity tokenów[*]

Limit tokenów wejściowych

32 000

Limit tokenów wyjściowych

8192

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie obrazów

Obsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.0-flash-preview-image-generation
  • Funkcja gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w kilku krajach w Europie, na Bliskim Wschodzie i w Afryce

Ostatnia aktualizacja Maj 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-lite
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Batch API

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-2.0-flash-lite
  • Stabilny: gemini-2.0-flash-lite-001
Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania wykorzystywany w różnorodnych zadaniach.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Możliwości

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-flash-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash
  • Stabilna:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do mniej wymagających zadań.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash-8b
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Możliwości

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-flash-8b-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash-8b
  • Stabilna:
    • gemini-1.5-flash-8b-001
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini.

Gemini 1.5 Pro to średniej wielkości model multimodalny zoptymalizowany pod kątem szerokiego zakresu zadań wymagających wnioskowania. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. linii kodu lub 2000 stron tekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-pro
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

2 097 152

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

7200

Maksymalna długość filmu

2 godziny

Maksymalna długość dźwięku

Około 19 godzin

Możliwości

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-pro-latest
  • Najnowsza stabilna wersja: gemini-1.5-pro
  • Stabilna:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Wrzesień 2024 r.

Imagen 4

Imagen 4 to nasz najnowszy model obrazów, który potrafi generować bardzo szczegółowe obrazy z bogatszym oświetleniem, znacznie lepszym renderowaniem tekstu i wyższą rozdzielczością niż poprzednie modele.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Obrazy

Limity tokenów[*]

Limit tokenów wejściowych

480 tokenów (tekst)

Obrazy wyjściowe

1 (Ultra)
1–4 (Standard)

Ostatnia aktualizacja Czerwiec 2025 r.

Imagen 3

Imagen 3 to nasz najwyższej jakości model do zamiany tekstu na grafikę, który generuje obrazy o jeszcze większej szczegółowości, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

imagen-3.0-generate-002

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Obrazy

Limity tokenów[*]

Limit tokenów wejściowych

Nie dotyczy

Obrazy wyjściowe

Maksymalnie 4

Ostatnia aktualizacja Luty 2025 r.

Veo 2

Veo 2 to nasz model do generowania wysokiej jakości filmów na podstawie tekstu i obrazów. Umożliwia on tworzenie szczegółowych filmów, które oddają artystyczne niuanse w Twoich promptach.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

veo-2.0-generate-001

Obsługiwane typy danych

Wejście

Tekst, obraz

Dane wyjściowe

Wideo

Limity

Wpisywanie tekstu

Nie dotyczy

Wejście obrazu

Dowolna rozdzielczość i format obrazu, rozmiar pliku do 20 MB

Film wyjściowy

Do 2

Ostatnia aktualizacja Kwiecień 2025 r.

Gemini 2.5 Flash Live

Model Gemini 2.5 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-live-2.5-flash-preview
Obsługiwane typy danych

Dane wejściowe

dźwięk, obraz i tekst;

Dane wyjściowe

tekst i dźwięk,

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-live-2.5-flash-preview
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-live-001
Obsługiwane typy danych

Dane wejściowe

dźwięk, obraz i tekst;

Dane wyjściowe

tekst i dźwięk,

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Możliwości

Ustrukturyzowane dane wyjściowe

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.0-flash-live-001
Ostatnia aktualizacja Kwiecień 2025 r.
Granica wiedzy Sierpień 2024 r.

Umieszczanie Gemini

Model Gemini Embedding osiąga najlepsze wyniki w wielu kluczowych obszarach, w tym w przypadku kodu, wielu języków i wyszukiwania.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

gemini-embedding-001

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Wektory dystrybucyjne tekstu

Limity tokenów[*]

Limit tokenów wejściowych

2048

Rozmiar wymiaru wyjściowego

Elastyczny, obsługuje wartości od 128 do 3072. Zalecane wartości: 768, 1536, 3072.

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • Stabilny: gemini-embedding-001
  • Podgląd: gemini-embedding-exp-03-07
Ostatnia aktualizacja Czerwiec 2025 r.

Starsze modele wektorów dystrybucyjnych

Wektor dystrybucyjny tekstu (starsza wersja)

Osadzanie tekstu służy do pomiaru podobieństwa ciągów znaków i jest powszechnie stosowane w wielu aplikacjach AI.

Szczegóły modelu
Właściwość Opis
Kod modelu

Gemini API

models/text-embedding-004

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Wektory dystrybucyjne tekstu

Limity tokenów[*]

Limit tokenów wejściowych

2048

Rozmiar wymiaru wyjściowego

768

Limity żądań[**] 1500 żądań na minutę
regulowane ustawienia bezpieczeństwa, Nieobsługiwane
Data wycofania Styczeń 2026 r.
Ostatnia aktualizacja Kwiecień 2024 r.

AQA

Modelu AQA możesz używać do wykonywania zadań związanych z odpowiadaniem na pytania z atrybucją (AQA) w odniesieniu do dokumentu, korpusu lub zestawu fragmentów. Model AQA zwraca odpowiedzi na pytania na podstawie podanych źródeł oraz szacuje prawdopodobieństwo, że na pytanie można odpowiedzieć.

Szczegóły modelu

Właściwość Opis
Kod modelu models/aqa
Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Tekst

Obsługiwany język angielski
Limity tokenów[*]

Limit tokenów wejściowych

7168

Limit tokenów wyjściowych

1024

Limity żądań[**] 1500 żądań na minutę
regulowane ustawienia bezpieczeństwa, Obsługiwane
Ostatnia aktualizacja Grudzień 2023 r.

Zapoznaj się z przykładami, aby poznać możliwości tych wariantów modeli.

[*] W przypadku modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, wersji testowej lub eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i wersji chcesz użyć.

Najnowsza stabilna

Wskazuje najnowszą stabilną wersję wydaną dla określonego modelu, generacji i wariantu.

Aby określić najnowszą stabilną wersję, użyj tego wzorca:<model>-<generation>-<variation>. Na przykład: gemini-2.0-flash.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle nie ulegają zmianom. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.0-flash-001.

Podgląd

Wskazuje model w wersji przedpremierowej, który może nie być odpowiedni do użytku produkcyjnego, ma bardziej restrykcyjne limity szybkości, ale może mieć włączone rozliczenia.

Aby określić wersję podglądową, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.5-pro-preview-06-05.

Modele w wersji podglądowej nie są stabilne, a dostępność punktów końcowych modeli może ulec zmianie.

Eksperymentalna

Wskazuje model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko przekazywać deweloperom najnowsze aktualizacje.

Aby określić wersję eksperymentalną, użyj tego wzorca:<model>-<generation>-<variation>-<version>. Na przykład:gemini-2.0-pro-exp-02-05.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.

Modele eksperymentalne

Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie być odpowiednie do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity szybkości.

Udostępniamy modele eksperymentalne, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo innowacji w Google. Dzięki temu, czego dowiadujemy się z eksperymentalnych wersji, możemy lepiej przygotować się na szersze wdrożenie modeli. Model eksperymentalny można zastąpić innym bez wcześniejszego powiadomienia. Nie gwarantujemy, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Poprzednie modele eksperymentalne

Gdy pojawią się nowe wersje lub stabilne wydania, usuwamy modele eksperymentalne i zastępujemy je nowymi. Poprzednie modele eksperymentalne, które udostępniliśmy, znajdziesz w sekcji poniżej wraz z wersją zastępczą:

Kod modelu Model podstawowy Wersja zastępcza
gemini-embedding-exp-03-07 Umieszczanie Gemini gemini-embedding-001
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Obsługiwane języki

Modele Gemini są trenowane do pracy w tych językach:

  • arabski (ar),
  • bengalski (bn)
  • bułgarski (bg),
  • chiński uproszczony i tradycyjny (zh),
  • chorwacki (hr),
  • czeski (cs)
  • duński (da),
  • Niderlandzki (nl)
  • angielski (en),
  • estoński (et),
  • fiński (fi),
  • francuski (fr),
  • Niemiecki (de)
  • grecki (el),
  • hebrajski (iw)
  • hindi (hi),
  • węgierski (hu),
  • Indonezyjski (id)
  • Włoski (it)
  • japoński (ja),
  • koreański (ko),
  • łotewski (lv)
  • litewski (lt),
  • norweski (no),
  • polski (pl),
  • portugalski (pt),
  • rumuński (ro),
  • rosyjski (ru)
  • serbski (sr)
  • słowacki (sk)
  • słoweński (sl),
  • hiszpański (es),
  • suahili (sw),
  • szwedzki (sv),
  • tajski (th),
  • turecki (tr),
  • ukraiński (uk),
  • wietnamski (vi),