Przedstawiamy Gemini Embedding 2, nasz pierwszy w pełni multimodalny model wektora dystrybucyjnego.

Modele

Gemini 3

Gemini 3.1 Pro

Zaawansowana inteligencja, umiejętności rozwiązywania złożonych problemów oraz zaawansowane możliwości kodowania agentów i wibracji.

Nowość Podgląd

Gemini 3 Flash

Wydajność klasy Frontier, która dorównuje większym modelom, ale jest dostępna za ułamek ceny.

Podgląd

Gemini 3.1 Flash-Lite

Wydajność klasy Frontier, która dorównuje większym modelom, ale jest dostępna za ułamek ceny.

Nowość Podgląd

Nano Banana 2

Wydajne generowanie obrazów i edycja o wysokiej skuteczności, zoptymalizowane pod kątem szybkości i dużej liczby przypadków użycia.

Podgląd

Nano Banana Pro

Najnowocześniejsze modele do generowania i edytowania obrazów, które umożliwiają tworzenie wysoce kontekstowych obrazów natywnych.

Podgląd

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności w przypadku zadań wymagających rozumowania, które charakteryzują się krótkim czasem oczekiwania i dużą liczbą zapytań.

Nano Banana

Najnowocześniejszy model do generowania i edytowania obrazów, zaprojektowany z myślą o szybkiej pracy twórczej.

Gemini 2.5 Flash Live (wersja testowa)

Zoptymalizowany pod kątem agentów konwersacyjnych działających w czasie rzeczywistym, którzy przesyłają strumieniowo dźwięk w czasie poniżej sekundy.

Gemini 2.5 Flash TTS (wersja testowa)

Generowanie dźwięku za pomocą funkcji zamiany tekstu na mowę z precyzyjną kontrolą stylu i tempa.

Gemini 2.5 Flash-Lite

Najszybszy i najbardziej przystępny cenowo model multimodalny z rodziny 2.5.

Gemini 2.5 Pro

Nasz najbardziej zaawansowany model do złożonych zadań, który ma zaawansowane możliwości rozumowania i kodowania.

Gemini 2.5 Pro TTS wersja testowa

Synteza mowy o wysokiej wierności zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.

Modele audio

Ta sekcja zawiera wszystkie modele audio, w tym te, które mogą być już wymienione w innych sekcjach.

Gemini 2.5 Flash Live (wersja testowa)

Nasz flagowy model interfejsu Live API do dwukierunkowych agentów głosowych i wideo o krótkim czasie oczekiwania z natywnym rozumowaniem dźwięku.

Gemini 2.5 Flash TTS (wersja testowa)

Szybka i łatwa w obsłudze zamiana tekstu na mowę w przypadku aplikacji o niskich opóźnieniach i kosztach oraz asystentów działających w czasie rzeczywistym.

Gemini 2.5 Pro TTS wersja testowa

Synteza mowy o wysokiej wierności zoptymalizowana pod kątem jakości w przypadku uporządkowanych przepływów pracy, takich jak podcasty i audiobooki.

Lyria (eksperymentalna)

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę nad instrumentami, tempem i złożonymi kompozycjami.

Generatywne modele multimedialne

Ta sekcja zawiera wszystkie modele generatywnych mediów, w tym te, które mogą być już wymienione w innych sekcjach.

Nano Banana 2 – wersja testowa

Wysoka wydajność tworzenia wizualizacji na skalę produkcyjną, łącząca inteligencję serii Gemini 3 z błyskawiczną szybkością generowania.

Veo 3.1 Podgląd

Najnowocześniejsza technologia generowania filmów z zaawansowanymi ustawieniami kreatywnymi i natywnie zsynchronizowanym dźwiękiem.

Nano Banana Pro wersja testowa

Profesjonalny silnik projektowania z rdzeniem rozumowania, który zapewnia wizualizacje w jakości studyjnej 4K, złożone układy i precyzyjne renderowanie tekstu.

Lyria (eksperymentalna)

Model generowania muzyki o wysokiej jakości, który zapewnia szczegółową kontrolę nad instrumentami, tempem i złożonymi kompozycjami.

Nano Banana

Najnowocześniejszy model do generowania i edytowania obrazów, zaprojektowany z myślą o szybkiej pracy twórczej.

Imagen 4

Model do zamiany tekstu na obraz, który umożliwia szybkie i bardzo szybkie generowanie obrazów o wyjątkowej wyrazistości w rozdzielczości do 2K.

Modele narzędzi i agentów

Korzystanie z komputera (wersja przedpremierowa)

Specjalistyczny model, który „widzi” ekran cyfrowy i wykonuje działania w interfejsie, takie jak klikanie, pisanie i nawigowanie, aby zautomatyzować złożone zadania w przeglądarce.

Deep Research w Gemini (wersja podglądowa)

Model agentowy, który autonomicznie planuje i przeprowadza wieloetapowe poszukiwania w setkach źródeł, aby tworzyć interaktywne raporty z cytatami.

Modele do zadań specjalistycznych

Gemini Embedding 2 (wersja testowa)

Nasz pierwszy model multimodalnych wektorów dystrybucyjnych, który mapuje tekst, obrazy, filmy, dźwięk i pliki PDF w ujednoliconej przestrzeni wektorów dystrybucyjnych na potrzeby zaawansowanego wyszukiwania semantycznego i systemów RAG.

Umieszczanie Gemini

Wielowymiarowe reprezentacje wektorowe do zaawansowanego wyszukiwania semantycznego, klasyfikacji tekstu i systemów RAG.

Gemini Robotics (wersja testowa)

Zaawansowany model rozumowania przestrzennego, który rozumie przestrzenie fizyczne i planuje wieloetapowe zadania dla robotów.

Poprzednie modele

Gemini 2.0 Flash Wycofany

Nasz model roboczy drugiej generacji z funkcjami nowej generacji i ulepszonymi możliwościami, w tym większą szybkością, natywnym korzystaniem z narzędzi i oknem kontekstu z milionem tokenów.

Gemini 2.0 Flash-Lite Wycofany

Nasz najszybszy model drugiej generacji, zoptymalizowany pod kątem opłacalności i niskich opóźnień.

Gemini 3 Pro (wersja testowa) Wyłącz

Nasz najnowocześniejszy model rozumujący z zaawansowanym rozpoznawaniem multimodalnym.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, wersji zapoznawczej, najnowszej lub eksperymentalnej.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle nie ulegają zmianom. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.

Przykład: gemini-2.5-flash.

Podgląd

Wskazuje model w wersji podglądowej, który może być używany w środowisku produkcyjnym. W przypadku modeli w wersji testowej zwykle włączone są płatności, mogą one mieć bardziej restrykcyjne ograniczenia liczby żądań i zostaną wycofane z co najmniej 2-tygodniowym wyprzedzeniem.

Przykład: gemini-2.5-flash-preview-09-2025.

Najnowsze

Wskazuje najnowszą wersję konkretnego wariantu modelu. Może to być wersja stabilna, podglądowa lub eksperymentalna. Ten alias będzie wymieniany na gorąco z każdą nową wersją konkretnego modelu. 2-tygodniowe powiadomienie o zmianie wersji starszej niż najnowsza zostanie wysłane e-mailem.

Przykład: gemini-flash-latest.

Eksperymentalna

Wskazuje model eksperymentalny, który zwykle nie nadaje się do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Udostępniamy modele eksperymentalne, aby zbierać opinie i szybko udostępniać deweloperom najnowsze aktualizacje.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.

Wycofane modele

Informacje o wycofywaniu modeli znajdziesz na stronie Wycofywanie Gemini.