Ograniczenia liczby żądań

Limity liczby żądań regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

  • Żądania na minutę (RPM)
  • Tokeny na minutę (dane wejściowe) (TPM)
  • Żądania dziennie (RPD)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API.

Limity RPD są resetowane o północy czasu pacyficznego.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest podobna do liczby tokenów na minutę (TPM). Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji testowych limity są bardziej restrykcyjne.

Poziomy wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami szybkości.

Kryteria kwalifikacji do poziomów 2 i 3 są oparte na łącznych wydatkach na usługi Google Cloud (w tym na interfejs Gemini API) na koncie rozliczeniowym połączonym z Twoim projektem.

Poziom Kwalifikacje
Wersja bezpłatna Użytkownicy w kwalifikujących się krajach
Poziom 1 Konto rozliczeniowe połączone z projektem
Poziom 2 Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności
Poziom 3 Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności

Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji jest zwykle wystarczające do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.

Standardowe limity częstotliwości żądań interfejsu API

W tabeli poniżej znajdziesz limity liczby żądań dla wszystkich standardowych wywołań interfejsu Gemini API.

poziom bezpłatny

Model RPM TPM RPD
Modele tekstowe
Gemini 2.5 Pro 5 250 000 100
Gemini 2.5 Flash 10 250 000 250
Gemini 2.5 Flash-Lite 15 250 000 1000
Gemini 2.0 Flash 15 1 000 000 200
Gemini 2.0 Flash-Lite 30 1 000 000 200
Interfejs Live API
Gemini 2.5 Flash Live 3 sesje 1 000 000 *
Okno podglądu Gemini 2.5 Flash Native Audio 1 sesja 25 000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 10 000 5
Gemini 2.0 Flash Live 3 sesje 1 000 000 *
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 3 10 000 15
Generowanie obrazów w Gemini 2.0 Flash 10 200 000 100
Inne modele
Gemma 3 i 3n 30 15 000 14 400
Osadzanie Gemini 100 30 000 1000
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 15 250 000 50
Gemini 1.5 Flash-8B (wersja wycofana) 15 250 000 50

Poziom 1

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 150 2 000 000 10 000 5 000 000
Gemini 2.5 Flash 1000 1 000 000 10 000 3 000 000
Gemini 2.5 Flash-Lite 4000 4 000 000 * 10 000 000
Gemini 2.0 Flash 2000 4 000 000 * 10 000 000
Gemini 2.0 Flash-Lite 4000 4 000 000 * 10 000 000
Interfejs Live API
Gemini 2.5 Flash Live 50 sesji 4 000 000 * *
Okno podglądu Gemini 2.5 Flash Native Audio 3 sesje 50 000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50 *
Gemini 2.0 Flash Live 50 sesji 4 000 000 * *
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 10 10 000 100 *
Wersja testowa Gemini 2.5 Pro TTS 10 10 000 50 *
Podgląd obrazu Gemini 2.5 Flash 500 500 000 2000 *
Generowanie obrazów w Gemini 2.0 Flash 1000 1 000 000 10 000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
Inne modele
Gemma 3 i 3n 30 15 000 14 400 *
Osadzanie Gemini 3000 1 000 000 * *
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000 * *
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000 * *
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000 * *

Poziom 2

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 1000 5 000 000 50 000 500 000 000
Gemini 2.5 Flash 2000 3 000 000 100 000 400 000 000
Gemini 2.5 Flash-Lite 10 000 10 000 000 * 500 000 000
Gemini 2.0 Flash 10 000 10 000 000 * 1 000 000 000
Gemini 2.0 Flash-Lite 20 000 10 000 000 * 1 000 000 000
Interfejs Live API
Gemini 2.5 Flash Live 1000 sesji 10 000 000 * *
Okno podglądu Gemini 2.5 Flash Native Audio 100 sesji 1 000 000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50 *
Gemini 2.0 Flash Live 1000 sesji 10 000 000 * *
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 1000 100 000 10 000 *
Wersja testowa Gemini 2.5 Pro TTS 100 25 000 1000 *
Podgląd obrazu Gemini 2.5 Flash 2000 1 500 000 50 000 *
Generowanie obrazów w Gemini 2.0 Flash 2000 3 000 000 100 000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
Inne modele
Gemma 3 i 3n 30 15 000 14 400 *
Osadzanie Gemini 5000 5 000 000 * *
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000 * *
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000 * *
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000 * *

Poziom 3

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 2000 8 000 000 * 1 000 000 000
Gemini 2.5 Flash 10 000 8 000 000 * 1 000 000 000
Gemini 2.5 Flash-Lite 30 000 30 000 000 * 1 000 000 000
Gemini 2.0 Flash 30 000 30 000 000 * 5 000 000 000
Gemini 2.0 Flash-Lite 30 000 30 000 000 * 5 000 000 000
Interfejs Live API
Gemini 2.5 Flash Live 1000 sesji 10 000 000 * *
Okno podglądu Gemini 2.5 Flash Native Audio 100 sesji 1 000 000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50 *
Gemini 2.0 Flash Live 1000 sesji 10 000 000 * *
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 1000 1 000 000 * *
Wersja testowa Gemini 2.5 Pro TTS 100 1 000 000 * *
Podgląd obrazu Gemini 2.5 Flash 5000 5 000 000 * *
Generowanie obrazów w Gemini 2.0 Flash 5000 5 000 000 * *
Imagen 4 Standard/Fast 20 * 15 000 *
Imagen 4 Ultra 15 * 5000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
Inne modele
Gemma 3 i 3n 30 15 000 14 400 *
Osadzanie Gemini 10 000 10 000 000 * *
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000 * *
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000 * *
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000 * *

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity częstotliwości żądań interfejsu Batch API

Żądania interfejsu Batch API podlegają własnym limitom liczby żądań, które są niezależne od wywołań interfejsu API niebędących żądaniami zbiorczymi.

  • Równoczesne żądania zbiorcze: 100
  • Limit rozmiaru pliku wejściowego: 2 GB
  • Limit miejsca na pliki: 20 GB
  • Tokeny w kolejce według modelu: kolumna Tokeny w kolejce do przetwarzania wsadowego w tabeli limitów częstotliwości zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu. Znajdziesz je w tabeli standardowych limitów interfejsu API.

Jak przejść na wyższy poziom

Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.

Gdy projekt spełni określone kryteria, będzie można go przenieść na wyższy poziom. Aby poprosić o przekształcenie:

Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.

Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej

Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.