2.5 Pro
Nasz najbardziej zaawansowany model myślenia o maksymalnej dokładności odpowiedzi i najnowocześniejszej wydajności
- Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz otrzymywanie odpowiedzi tekstowych
- Rozwiązywanie trudnych problemów, analizowanie dużych baz danych i inne działania
- Najlepszy do złożonego kodowania, wyciągania wniosków i rozumienia multimodalnego
2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości.
- przesyłać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe;
- Model myśli w razie potrzeby lub możesz skonfigurować budżet na myślenie.
- Najlepszy do zadań o niskim opóźnieniu i dużej liczbie, które wymagają zastanowienia
2.5 Flash-Lite
Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.
- przesyłać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe;
- Najbardziej ekonomiczny model obsługujący dużą przepustowość
- Najlepszy w przypadku zastosowań wymagających krótkiego czasu oczekiwania i przetwarzania w czasie rzeczywistym
Warianty modelu
Gemini API oferuje różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wersji Gemini:
Wariant modelu | Dane wejściowe | Wyniki | Zoptymalizowany dla |
---|---|---|---|
Gemini 2.5 Pro
gemini-2.5-pro |
dźwięk, obrazy, filmy, tekst i pliki PDF; | Tekst | Ulepszone myślenie i rozumowanie, multimodalne rozumienie, zaawansowane kodowanie i inne funkcje |
Gemini 2.5 Flash
gemini-2.5-flash |
dźwięk, obrazy, filmy i tekst; | Tekst | Myślenie adaptacyjne, opłacalność |
Wersja podglądowa Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17 |
Tekst, obraz, film oraz plik dźwiękowy | Tekst | Najbardziej ekonomiczny model obsługujący dużą przepustowość |
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog |
Audio, filmy i tekst | Tekst i dźwięk, przeplatane | Wysokiej jakości, naturalne wyjścia audio rozmowy z myśleniem lub bez niego |
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts |
Tekst | Dźwięk | Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników. |
Wersja podglądowa Gemini 2.5 Pro TTS
gemini-2.5-pro-preview-tts |
Tekst | Dźwięk | Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników. |
Gemini 2.0 Flash
gemini-2.0-flash |
dźwięk, obrazy, filmy i tekst; | Tekst | Funkcje nowej generacji, szybkość i transmisja strumieniowa w czasie rzeczywistym. |
Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation |
dźwięk, obrazy, filmy i tekst; | Tekst, obrazy | Generowanie i edytowanie obrazów w trybie konwersacyjnym |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
dźwięk, obrazy, filmy i tekst; | Tekst | Opłacalność i krótkie czasy oczekiwania |
Gemini 1.5 Flash
gemini-1.5-flash |
dźwięk, obrazy, filmy i tekst; | Tekst | Szybkie i wszechstronne działanie w różnych zadaniach.
Wycofane |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
dźwięk, obrazy, filmy i tekst; | Tekst | Zadania o dużej liczbie zapytań i mniejszym stopniu złożoności
Wycofane |
Gemini 1.5 Pro
gemini-1.5-pro |
dźwięk, obrazy, filmy i tekst; | Tekst |
Złożone zadania wymagające większej inteligencji
Wycofane |
Umieszczanie Gemini
gemini-embedding-001 |
Tekst | Wektory dystrybucyjne tekstu | Pomiar podobieństwa ciągów tekstowych |
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06 |
Tekst | Obrazy | Nasz najnowszy model do generowania obrazów |
Imagen 3
imagen-3.0-generate-002 |
Tekst | Obrazy | Model generowania obrazów wysokiej jakości |
Veo 2
veo-2.0-generate-001 |
Tekst, obrazy | Wideo | Generowanie filmów w wysokiej jakości |
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview |
dźwięk, obraz i tekst; | Tekst, dźwięk | Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
dźwięk, obraz i tekst; | Tekst, dźwięk | Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami |
Limity szybkości dla poszczególnych modeli znajdziesz na tej stronie.
Gemini 2.5 Pro
Gemini 2.5 Pro to nasz najnowocześniejszy model myślący, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | gemini-2.5-pro |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy, tekst i pliki PDF; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Obsługiwane Batch API Obsługiwane |
Wersje |
|
Ostatnia aktualizacja | Czerwiec 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Gemini 2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o niskim czasie oczekiwania i dużej objętości, które wymagają myślenia, oraz zastosowań związanych z agentami.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash |
Obsługiwane typy danych |
Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
Możliwości |
Generowanie dźwięku Nieobsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Dostrajanie Nieobsługiwane Batch API Obsługiwane |
Wersje |
|
Ostatnia aktualizacja | Czerwiec 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Wersja testowa Gemini 2.5 Flash-Lite
Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-lite-preview-06-17 |
Obsługiwane typy danych |
Dane wejściowe Tekst, obrazy, filmy i dźwięk Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 000 000 Limit tokenów wyjściowych 64 000 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Kontekst URL Obsługiwane Szukaj groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Obsługiwane |
Wersje |
|
Ostatnia aktualizacja | Czerwiec 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Gemini 2.5 Flash Native Audio
Nasze natywne modele dialogów audio z myśleniem i bez niego, dostępne w ramach interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy z użyciem promptów dotyczących stylu i kontroli.
Wypróbuj natywny dźwięk w Google AI Studio
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-native-audio-dialog &models/gemini-2.5-flash-exp-native-audio-thinking-dialog |
Obsługiwane typy danych |
Dane wejściowe Audio, wideo, tekst Dane wyjściowe Dźwięk i tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 128 000 Limit tokenów wyjściowych 8000 |
Możliwości |
Generowanie dźwięku Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Obsługiwane Dostrajanie Nieobsługiwane |
Wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Podgląd zamiany tekstu na mowę w Gemini 2.5 Flash
Gemini 2.5 Flash Preview TTS to nasz model zamiany tekstu na mowę o korzystnym stosunku ceny do wydajności, który zapewnia dużą kontrolę i przejrzystość w przypadku ustrukturyzowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji przedpremierowej.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-tts |
Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Dźwięk |
[*] | Limity tokenów
Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000 |
Możliwości |
Ustrukturyzowane dane wyjściowe Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane |
Wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Przesłuchiwanie tekstu w Gemini 2.5 Pro
Gemini 2.5 Pro Preview TTS to nasz najpotężniejszy model zamiany tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w przypadku uporządkowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny lub w wersji testowej.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-pro-preview-tts |
Obsługiwane typy danych |
Dane wejściowe Tekst Dane wyjściowe Dźwięk |
[*] | Limity tokenów
Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000 |
Możliwości |
Ustrukturyzowane dane wyjściowe Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane |
Wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Gemini 2.0 Flash
Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne korzystanie z narzędzi i okno kontekstu z milionem tokenów.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Obsługiwane Myślenie Eksperymentalne Batch API Obsługiwane |
Wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Generowanie obrazów w Gemini 2.0 Flash
Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edycję obrazów w formie konwersacji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-preview-image-generation |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst i obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych 32 000 Limit tokenów wyjściowych 8192 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie obrazów Obsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane |
Wersje |
Funkcja gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w kilku krajach w Europie, na Bliskim Wschodzie i w Afryce |
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 2.0 Flash-Lite
Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-lite |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Batch API Obsługiwane |
Wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 1.5 Flash
Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania wykorzystywany w różnorodnych zadaniach.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacje audiowizualne |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Możliwości |
Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
Wersje |
|
Data wycofania | Wrzesień 2025 r. |
Ostatnia aktualizacja | Wrzesień 2024 r. |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B to mały model przeznaczony do mniej wymagających zadań.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash-8b |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacje audiowizualne |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Możliwości |
Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
Wersje |
|
Data wycofania | Wrzesień 2025 r. |
Ostatnia aktualizacja | Październik 2024 r. |
Gemini 1.5 Pro
Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini.
Gemini 1.5 Pro to średniej wielkości model multimodalny zoptymalizowany pod kątem szerokiego zakresu zadań wymagających wnioskowania. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. linii kodu lub 2000 stron tekstu.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-pro |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192 |
Specyfikacje audiowizualne |
Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin |
Możliwości |
Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
Wersje |
|
Data wycofania | Wrzesień 2025 r. |
Ostatnia aktualizacja | Wrzesień 2024 r. |
Imagen 4
Imagen 4 to nasz najnowszy model obrazów, który potrafi generować bardzo szczegółowe obrazy z bogatszym oświetleniem, znacznie lepszym renderowaniem tekstu i wyższą rozdzielczością niż poprzednie modele.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych 480 tokenów (tekst) Obrazy wyjściowe 1 (Ultra) |
Ostatnia aktualizacja | Czerwiec 2025 r. |
Imagen 3
Imagen 3 to nasz najwyższej jakości model do zamiany tekstu na grafikę, który generuje obrazy o jeszcze większej szczegółowości, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych Nie dotyczy Obrazy wyjściowe Maksymalnie 4 |
Ostatnia aktualizacja | Luty 2025 r. |
Veo 2
Veo 2 to nasz model do generowania wysokiej jakości filmów na podstawie tekstu i obrazów. Umożliwia on tworzenie szczegółowych filmów, które oddają artystyczne niuanse w Twoich promptach.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst, obraz Dane wyjściowe Wideo |
Limity |
Wpisywanie tekstu Nie dotyczy Wejście obrazu Dowolna rozdzielczość i format obrazu, rozmiar pliku do 20 MB Film wyjściowy Do 2 |
Ostatnia aktualizacja | Kwiecień 2025 r. |
Gemini 2.5 Flash Live
Model Gemini 2.5 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-live-2.5-flash-preview |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obraz i tekst; Dane wyjściowe tekst i dźwięk, |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślenie Nieobsługiwane |
Wersje |
|
Ostatnia aktualizacja | Czerwiec 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Gemini 2.0 Flash Live
Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-live-001 |
Obsługiwane typy danych |
Dane wejściowe dźwięk, obraz i tekst; Dane wyjściowe tekst i dźwięk, |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Możliwości |
Ustrukturyzowane dane wyjściowe Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślenie Nieobsługiwane |
Wersje |
|
Ostatnia aktualizacja | Kwiecień 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Umieszczanie Gemini
Model Gemini Embedding osiąga najlepsze wyniki w wielu kluczowych obszarach, w tym w przypadku kodu, wielu języków i wyszukiwania.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego Elastyczny, obsługuje wartości od 128 do 3072. Zalecane wartości: 768, 1536, 3072. |
Wersje |
|
Ostatnia aktualizacja | Czerwiec 2025 r. |
Starsze modele wektorów dystrybucyjnych
Wektor dystrybucyjny tekstu (starsza wersja)
Osadzanie tekstu służy do pomiaru podobieństwa ciągów znaków i jest powszechnie stosowane w wielu aplikacjach AI.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768 |
[**] | Limity żądań1500 żądań na minutę |
regulowane ustawienia bezpieczeństwa, | Nieobsługiwane |
Data wycofania | Styczeń 2026 r. |
Ostatnia aktualizacja | Kwiecień 2024 r. |
AQA
Modelu AQA możesz używać do wykonywania zadań związanych z odpowiadaniem na pytania z atrybucją (AQA) w odniesieniu do dokumentu, korpusu lub zestawu fragmentów. Model AQA zwraca odpowiedzi na pytania na podstawie podanych źródeł oraz szacuje prawdopodobieństwo, że na pytanie można odpowiedzieć.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/aqa |
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Tekst |
Obsługiwany język | angielski |
[*] | Limity tokenów
Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024 |
[**] | Limity żądań1500 żądań na minutę |
regulowane ustawienia bezpieczeństwa, | Obsługiwane |
Ostatnia aktualizacja | Grudzień 2023 r. |
Zapoznaj się z przykładami, aby poznać możliwości tych wariantów modeli.
[*] W przypadku modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.
Wzorce nazw wersji modelu
Modele Gemini są dostępne w wersjach stabilnej, wersji testowej lub eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i wersji chcesz użyć.
Najnowsza stabilna
Wskazuje najnowszą stabilną wersję wydaną dla określonego modelu, generacji i wariantu.
Aby określić najnowszą stabilną wersję, użyj tego wzorca:<model>-<generation>-<variation>
. Na przykład: gemini-2.0-flash
.
Stabilny
Wskazuje konkretny stabilny model. Modele stabilne zwykle nie ulegają zmianom. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.
Aby określić wersję stabilną, użyj tego wzorca:<model>-<generation>-<variation>-<version>
Na przykład:gemini-2.0-flash-001
.
Podgląd
Wskazuje model w wersji przedpremierowej, który może nie być odpowiedni do użytku produkcyjnego, ma bardziej restrykcyjne limity szybkości, ale może mieć włączone rozliczenia.
Aby określić wersję podglądową, użyj tego wzorca:<model>-<generation>-<variation>-<version>
Na przykład:gemini-2.5-pro-preview-06-05
.
Modele w wersji podglądowej nie są stabilne, a dostępność punktów końcowych modeli może ulec zmianie.
Eksperymentalna
Wskazuje model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko przekazywać deweloperom najnowsze aktualizacje.
Aby określić wersję eksperymentalną, użyj tego wzorca:<model>-<generation>-<variation>-<version>
. Na przykład:gemini-2.0-pro-exp-02-05
.
Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.
Modele eksperymentalne
Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie być odpowiednie do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity szybkości.
Udostępniamy modele eksperymentalne, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo innowacji w Google. Dzięki temu, czego dowiadujemy się z eksperymentalnych wersji, możemy lepiej przygotować się na szersze wdrożenie modeli. Model eksperymentalny można zastąpić innym bez wcześniejszego powiadomienia. Nie gwarantujemy, że model eksperymentalny stanie się w przyszłości modelem stabilnym.
Poprzednie modele eksperymentalne
Gdy pojawią się nowe wersje lub stabilne wydania, usuwamy modele eksperymentalne i zastępujemy je nowymi. Poprzednie modele eksperymentalne, które udostępniliśmy, znajdziesz w sekcji poniżej wraz z wersją zastępczą:
Kod modelu | Model podstawowy | Wersja zastępcza |
---|---|---|
gemini-embedding-exp-03-07 |
Umieszczanie Gemini | gemini-embedding-001 |
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation |
Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-06-05 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro | gemini-2.5-pro |
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
Obsługiwane języki
Modele Gemini są trenowane do pracy w tych językach:
- arabski (
ar
), - bengalski (
bn
) - bułgarski (
bg
), - chiński uproszczony i tradycyjny (
zh
), - chorwacki (
hr
), - czeski (
cs
) - duński (
da
), - Niderlandzki (
nl
) - angielski (
en
), - estoński (
et
), - fiński (
fi
), - francuski (
fr
), - Niemiecki (
de
) - grecki (
el
), - hebrajski (
iw
) - hindi (
hi
), - węgierski (
hu
), - Indonezyjski (
id
) - Włoski (
it
) - japoński (
ja
), - koreański (
ko
), - łotewski (
lv
) - litewski (
lt
), - norweski (
no
), - polski (
pl
), - portugalski (
pt
), - rumuński (
ro
), - rosyjski (
ru
) - serbski (
sr
) - słowacki (
sk
) - słoweński (
sl
), - hiszpański (
es
), - suahili (
sw
), - szwedzki (
sv
), - tajski (
th
), - turecki (
tr
), - ukraiński (
uk
), - wietnamski (
vi
),