Ograniczenia liczby żądań

Limity częstotliwości regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.

Jak działają limity szybkości

Limity szybkości są zwykle mierzone w 3 wymiarach:

  • Żądania na minutę (RPM)
  • Żądania dziennie (RPD)
  • Tokeny na minutę (dane wejściowe) (TPM)

Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API.

Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest podobna do liczby tokenów na minutę. Inne modele mogą mieć limit tokenów na dzień (TPD).

W przypadku modeli eksperymentalnych i wersji testowych limity są bardziej restrykcyjne.

Poziomy wykorzystania

Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami szybkości.

Poziom Kwalifikacje
Wersja bezpłatna Użytkownicy w kwalifikujących się krajach
Poziom 1 Konto rozliczeniowe połączone z projektem
Poziom 2 Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności
Poziom 3 Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności

Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji zwykle wystarcza do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.

Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.

Standardowe limity częstotliwości żądań interfejsu API

W tabeli poniżej znajdziesz limity szybkości dla wszystkich standardowych wywołań interfejsu Gemini API.

poziom bezpłatny

Model RPM TPM RPD
Modele tekstowe
Gemini 2.5 Pro 5 250 000 100
Gemini 2.5 Flash 10 250 000 250
Wersja testowa Gemini 2.5 Flash-Lite 17.06 15 250 000 1000
Gemini 2.0 Flash 15 1 000 000 200
Gemini 2.0 Flash-Lite 30 1 000 000 200
Interfejs Live API
Gemini 2.5 Flash Live 3 sesje 1 000 000
Okno podglądu Gemini 2.5 Flash Native Audio 1 sesja 25 000 5
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 10 000 5
Gemini 2.0 Flash Live 3 sesje 1 000 000
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 3 10 000 15
Wersja testowa Gemini 2.5 Pro TTS
Generowanie obrazów w Gemini 2.0 Flash 10 200 000 100
Imagen 3
Veo 2
Inne modele
Gemma 3 i 3n 30 15 000 14 400
Umieszczanie Gemini 100 30 000 1000
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 15 250 000 50
Gemini 1.5 Flash-8B (wersja wycofana) 15 250 000 50
Gemini 1.5 Pro (wersja wycofana)

Poziom 1

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 150 2 000 000 1000 5 000 000
Gemini 2.5 Flash 1000 1 000 000 10 000 3 000 000
Wersja testowa Gemini 2.5 Flash-Lite 17.06 4000 4 000 000
Gemini 2.0 Flash 2000 4 000 000 10 000 000
Gemini 2.0 Flash-Lite 4000 4 000 000 10 000 000
Interfejs Live API
Gemini 2.5 Flash Live 50 sesji 4 000 000
Okno podglądu Gemini 2.5 Flash Native Audio 3 sesje 50 000 50
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50
Gemini 2.0 Flash Live 50 sesji 4 000 000
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 10 10 000 100
Wersja testowa Gemini 2.5 Pro TTS 10 10 000 50
Generowanie obrazów w Gemini 2.0 Flash 1000 1 000 000 10 000
Imagen 3 20
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Veo 2 2 filmy na minutę 50 filmów dziennie
Inne modele
Gemma 3 i 3n 30 15 000 14 400
Umieszczanie Gemini 1000 100 000 10 000
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000

Poziom 2

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 1000 5 000 000 50 000 500 000 000
Gemini 2.5 Flash 2000 3 000 000 100 000 400 000 000
Wersja testowa Gemini 2.5 Flash-Lite 17.06 10 000 10 000 000 100 000
Gemini 2.0 Flash 10 000 10 000 000 1 000 000 000
Gemini 2.0 Flash-Lite 20 000 10 000 000 1 000 000 000
Interfejs Live API
Gemini 2.5 Flash Live 1000 sesji 10 000 000
Okno podglądu Gemini 2.5 Flash Native Audio 100 sesji 1 000 000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50
Gemini 2.0 Flash Live 1000 sesji 10 000 000
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 1000 100 000 10 000
Wersja testowa Gemini 2.5 Pro TTS 100 25 000 1000
Generowanie obrazów w Gemini 2.0 Flash 2000 3 000 000 100 000
Imagen 3 20
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Veo 2 2 filmy na minutę 50 filmów dziennie
Inne modele
Gemma 3 i 3n 30 15 000 14 400
Umieszczanie Gemini 5000 500 000 -- --
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000

Poziom 3

Model RPM TPM RPD Tokeny w kolejce do przetwarzania zbiorczego
Modele tekstowe
Gemini 2.5 Pro 2000 8 000 000 1 000 000 000
Gemini 2.5 Flash 10 000 8 000 000 1 000 000 000
Wersja testowa Gemini 2.5 Flash-Lite 17.06 30 000 30 000 000
Gemini 2.0 Flash 30 000 30 000 000 5 000 000 000
Gemini 2.0 Flash-Lite 30 000 30 000 000 5 000 000 000
Interfejs Live API
Gemini 2.5 Flash Live 1000 sesji 10 000 000
Okno podglądu Gemini 2.5 Flash Native Audio 100 sesji 1 000 000
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog 1 sesja 25 000 50
Gemini 2.0 Flash Live 1000 sesji 10 000 000
Modele generowania multimodalnego
Gemini 2.5 Flash Preview TTS 1000 1 000 000
Wersja testowa Gemini 2.5 Pro TTS 100 1 000 000
Generowanie obrazów w Gemini 2.0 Flash 5000 5 000 000
Imagen 3 20
Imagen 4 Standard 10 70
Imagen 4 Ultra 5 30
Veo 2 2 filmy na minutę 50 filmów dziennie
Inne modele
Gemma 3 i 3n 30 15 000 14 400
Umieszczanie Gemini 10 000 1 000 000 -- --
Wycofane modele
Gemini 1.5 Flash (wersja wycofana) 2000 4 000 000
Gemini 1.5 Flash-8B (wersja wycofana) 4000 4 000 000
Gemini 1.5 Pro (wersja wycofana) 1000 4 000 000

Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.

Limity szybkości w trybie wsadowym

Żądania w trybie wsadowym podlegają własnym limitom liczby żądań, które są oddzielne od wywołań interfejsu API w trybie innym niż wsadowy.

  • Równoczesne żądania zbiorcze: 100
  • Limit rozmiaru pliku wejściowego: 2 GB
  • Limit miejsca na pliki: 20 GB
  • Tokeny w kolejce według modelu: poniższa tabela zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.

Jak przejść na wyższy poziom

Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.

Gdy projekt spełni określone kryteria, będzie można go przenieść na wyższy poziom. Aby poprosić o przekształcenie:

Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.

Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej

Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.