Przedstawiamy Gemini Embedding 2, nasz pierwszy w pełni multimodalny model wektora dystrybucyjnego.

Ograniczenia liczby żądań

Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe użytkowanie, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Wyświetlanie aktywnych limitów żądań w AI Studio

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

Żądania na minutę (RPM)
Tokeny na minutę (dane wejściowe) (TPM)
Żądania dziennie (RPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API. Limity liczby żądań dziennie (RPD) są resetowane o północy czasu pacyficznego.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Nano Banana), ale jest podobna do liczby tokenów na minutę. Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji zapoznawczych limity są bardziej restrykcyjne.

Poziomy wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków automatycznie przejdziesz na wyższy poziom z większymi limitami liczby żądań.

Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.

Poziom	Kwalifikacje
Bezpłatnie	Użytkownicy w kwalifikujących się krajach
Poziom 1	W pełni opłacone konto rozliczeniowe połączone z projektem
Poziom 2	Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności
Poziom 3	Łączne wydatki: > 1000 USD i co najmniej 30 dni od pomyślnej płatności

Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy interfejsu Gemini API dla wszystkich użytkowników.

Limity liczby żądań interfejsu Gemini API

Limity zależą od wielu czynników (np. od poziomu limitu) i można je sprawdzić w Google AI Studio. W miarę jak Twój poziom i stan konta będą się zmieniać, limity żądań będą automatycznie aktualizowane.

Wyświetlanie aktywnych limitów żądań w AI Studio

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity częstotliwości żądań interfejsu Batch API

Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.

Równoczesne żądania zbiorcze: 100
Limit rozmiaru pliku wejściowego: 2 GB
Limit miejsca na pliki: 20 GB
Tokeny w kolejce według modelu: tabela Tokeny w kolejce do przetwarzania wsadowego zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.

Poziom 1

Model	Tokeny w kolejce do przetwarzania zbiorczego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa)	5 000 000
Gemini 3.1 Flash-Lite (wersja testowa)	10 000 000
Gemini 3 Flash (wersja testowa)	3 000 000
Gemini 2.5 Pro	5 000 000
Gemini 2.5 Pro TTS	25 000
Gemini 2.5 Flash	3 000 000
Gemini 2.5 Flash (wersja testowa)	3 000 000
Wersja testowa Gemini 2.5 Flash Image	3 000 000
Gemini 2.5 Flash TTS	100 000
Gemini 2.5 Flash-Lite	10 000 000
Gemini 2.5 Flash-Lite (wersja testowa)	10 000 000
Gemini 2.0 Flash	10 000 000
Gemini 2.0 Flash Image	3 000 000
Gemini 2.0 Flash-Lite	10 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌	1 000 000
Gemini 3 Pro Image (wersja testowa) 🍌	2 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini	500 000

Poziom 2

Model	Tokeny w kolejce do przetwarzania zbiorczego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa)	500 000 000
Gemini 3.1 Flash-Lite (wersja testowa)	500 000 000
Gemini 3.1 Flash (wersja testowa)	400 000 000
Gemini 2.5 Pro	500 000 000
Gemini 2.5 Pro TTS	100 000
Gemini 2.5 Flash	400 000 000
Gemini 2.5 Flash (wersja testowa)	400 000 000
Wersja testowa Gemini 2.5 Flash Image	400 000 000
Gemini 2.5 Flash TTS	100 000
Gemini 2.5 Flash-Lite	500 000 000
Gemini 2.5 Flash-Lite (wersja testowa)	500 000 000
Gemini 2.0 Flash	1 000 000 000
Gemini 2.0 Flash Image	400 000 000
Gemini 2.0 Flash-Lite	1 000 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌	250 000 000
Gemini 3 Pro Image (wersja testowa) 🍌	270 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini	5 000 000

Poziom 3

Model	Tokeny w kolejce do przetwarzania zbiorczego
Modele generujące tekst
Gemini 3.1 Pro (wersja testowa)	1 000 000 000
Gemini 3.1 Flash-Lite (wersja testowa)	1 000 000 000
Gemini 3.1 Flash (wersja testowa)	1 000 000 000
Gemini 2.5 Pro	1 000 000 000
Gemini 2.5 Pro TTS	1 000 000
Gemini 2.5 Flash	1 000 000 000
Gemini 2.5 Flash (wersja testowa)	1 000 000 000
Wersja testowa Gemini 2.5 Flash Image	1 000 000 000
Gemini 2.5 Flash TTS	4 000 000
Gemini 2.5 Flash-Lite	1 000 000 000
Gemini 2.5 Flash-Lite (wersja testowa)	1 000 000 000
Gemini 2.0 Flash	5 000 000 000
Gemini 2.0 Flash Image	1 000 000 000
Gemini 2.0 Flash-Lite	5 000 000 000
Modele generowania multimodalnego
Gemini 3.1 Flash Image (wersja testowa) 🍌	750 000 000
Gemini 3 Pro Image (wersja testowa) 🍌	1 000 000 000
Modele wektorów dystrybucyjnych
Osadzanie Gemini	10 000 000

Jak przejść na wyższy poziom

Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw skonfigurować płatności w AI Studio.

Gdy Twój projekt spełni określone kryteria, zostanie automatycznie uaktualniony do wyższego poziomu. Przejście z abonamentu Free na abonament Tier 1 zwykle następuje natychmiast, a kolejne przejścia na wyższe abonamenty zaczynają obowiązywać w ciągu 10 minut. Otwórz stronę Projekty w AI Studio, aby sprawdzić swoje poziomy.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Każda odmiana modelu ma powiązany limit częstotliwości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz na stronie Limity szybkości w AI Studio.

Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej

Nie możemy zagwarantować zwiększenia limitu żądań, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.