Limity częstotliwości regulują liczbę żądań, które możesz wysyłać do interfejsu Gemini API w określonym czasie. Te limity pomagają zachować uczciwe korzystanie z usługi, chronić przed nadużyciami i utrzymywać wydajność systemu dla wszystkich użytkowników.
Jak działają limity szybkości
Limity szybkości są zwykle mierzone w 3 wymiarach:
- Żądania na minutę (RPM)
- Żądania dziennie (RPD)
- Tokeny na minutę (dane wejściowe) (TPM)
Wykorzystanie jest oceniane pod kątem każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd limitu szybkości. Jeśli na przykład limit RPM wynosi 20, wysłanie 21 żądań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.
Limity liczby żądań są stosowane w przypadku poszczególnych projektów, a nie kluczy interfejsu API.
Limity różnią się w zależności od używanego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli, które mogą generować obrazy (Imagen 3), ale jest podobna do liczby tokenów na minutę. Inne modele mogą mieć limit tokenów na dzień (TPD).
W przypadku modeli eksperymentalnych i wersji testowych limity są bardziej restrykcyjne.
Poziomy wykorzystania
Limity liczby żądań są powiązane z poziomem wykorzystania projektu. Wraz ze wzrostem wykorzystania interfejsu API i wydatków będziesz mieć możliwość przejścia na wyższy poziom z większymi limitami szybkości.
Poziom | Kwalifikacje |
---|---|
Wersja bezpłatna | Użytkownicy w kwalifikujących się krajach |
Poziom 1 | Konto rozliczeniowe połączone z projektem |
Poziom 2 | Łączne wydatki: > 250 USD i co najmniej 30 dni od pomyślnej płatności |
Poziom 3 | Łączne wydatki: > 1000 PLN i co najmniej 30 dni od pomyślnej płatności |
Gdy poprosisz o przejście na wyższą wersję, nasz automatyczny system ochrony przed nadużyciami przeprowadzi dodatkowe kontrole. Spełnienie podanych kryteriów kwalifikacji zwykle wystarcza do zatwierdzenia, ale w rzadkich przypadkach prośba o przejście na wyższy poziom może zostać odrzucona z powodu innych czynników wykrytych podczas procesu weryfikacji.
Ten system pomaga zachować bezpieczeństwo i integralność platformy Gemini API dla wszystkich użytkowników.
Standardowe limity częstotliwości żądań interfejsu API
W tabeli poniżej znajdziesz limity szybkości dla wszystkich standardowych wywołań interfejsu Gemini API.
poziom bezpłatny
Model | RPM | TPM | RPD |
---|---|---|---|
Modele tekstowe | |||
Gemini 2.5 Pro | 5 | 250 000 | 100 |
Gemini 2.5 Flash | 10 | 250 000 | 250 |
Wersja testowa Gemini 2.5 Flash-Lite 17.06 | 15 | 250 000 | 1000 |
Gemini 2.0 Flash | 15 | 1 000 000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1 000 000 | 200 |
Interfejs Live API | |||
Gemini 2.5 Flash Live | 3 sesje | 1 000 000 | |
Okno podglądu Gemini 2.5 Flash Native Audio | 1 sesja | 25 000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 sesja | 10 000 | 5 |
Gemini 2.0 Flash Live | 3 sesje | 1 000 000 | |
Modele generowania multimodalnego | |||
Gemini 2.5 Flash Preview TTS | 3 | 10 000 | 15 |
Wersja testowa Gemini 2.5 Pro TTS | |||
Generowanie obrazów w Gemini 2.0 Flash | 10 | 200 000 | 100 |
Imagen 3 | |||
Veo 2 | |||
Inne modele | |||
Gemma 3 i 3n | 30 | 15 000 | 14 400 |
Umieszczanie Gemini | 100 | 30 000 | 1000 |
Wycofane modele | |||
Gemini 1.5 Flash (wersja wycofana) | 15 | 250 000 | 50 |
Gemini 1.5 Flash-8B (wersja wycofana) | 15 | 250 000 | 50 |
Gemini 1.5 Pro (wersja wycofana) |
Poziom 1
Model | RPM | TPM | RPD | Tokeny w kolejce do przetwarzania zbiorczego |
---|---|---|---|---|
Modele tekstowe | ||||
Gemini 2.5 Pro | 150 | 2 000 000 | 1000 | 5 000 000 |
Gemini 2.5 Flash | 1000 | 1 000 000 | 10 000 | 3 000 000 |
Wersja testowa Gemini 2.5 Flash-Lite 17.06 | 4000 | 4 000 000 | ||
Gemini 2.0 Flash | 2000 | 4 000 000 | 10 000 000 | |
Gemini 2.0 Flash-Lite | 4000 | 4 000 000 | 10 000 000 | |
Interfejs Live API | ||||
Gemini 2.5 Flash Live | 50 sesji | 4 000 000 | ||
Okno podglądu Gemini 2.5 Flash Native Audio | 3 sesje | 50 000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 sesja | 25 000 | 50 | |
Gemini 2.0 Flash Live | 50 sesji | 4 000 000 | ||
Modele generowania multimodalnego | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10 000 | 100 | |
Wersja testowa Gemini 2.5 Pro TTS | 10 | 10 000 | 50 | |
Generowanie obrazów w Gemini 2.0 Flash | 1000 | 1 000 000 | 10 000 | |
Imagen 3 | 20 | |||
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | 2 filmy na minutę | 50 filmów dziennie | ||
Inne modele | ||||
Gemma 3 i 3n | 30 | 15 000 | 14 400 | |
Umieszczanie Gemini | 1000 | 100 000 | 10 000 | |
Wycofane modele | ||||
Gemini 1.5 Flash (wersja wycofana) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (wersja wycofana) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (wersja wycofana) | 1000 | 4 000 000 |
Poziom 2
Model | RPM | TPM | RPD | Tokeny w kolejce do przetwarzania zbiorczego |
---|---|---|---|---|
Modele tekstowe | ||||
Gemini 2.5 Pro | 1000 | 5 000 000 | 50 000 | 500 000 000 |
Gemini 2.5 Flash | 2000 | 3 000 000 | 100 000 | 400 000 000 |
Wersja testowa Gemini 2.5 Flash-Lite 17.06 | 10 000 | 10 000 000 | 100 000 | |
Gemini 2.0 Flash | 10 000 | 10 000 000 | 1 000 000 000 | |
Gemini 2.0 Flash-Lite | 20 000 | 10 000 000 | 1 000 000 000 | |
Interfejs Live API | ||||
Gemini 2.5 Flash Live | 1000 sesji | 10 000 000 | ||
Okno podglądu Gemini 2.5 Flash Native Audio | 100 sesji | 1 000 000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 sesja | 25 000 | 50 | |
Gemini 2.0 Flash Live | 1000 sesji | 10 000 000 | ||
Modele generowania multimodalnego | ||||
Gemini 2.5 Flash Preview TTS | 1000 | 100 000 | 10 000 | |
Wersja testowa Gemini 2.5 Pro TTS | 100 | 25 000 | 1000 | |
Generowanie obrazów w Gemini 2.0 Flash | 2000 | 3 000 000 | 100 000 | |
Imagen 3 | 20 | |||
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | 2 filmy na minutę | 50 filmów dziennie | ||
Inne modele | ||||
Gemma 3 i 3n | 30 | 15 000 | 14 400 | |
Umieszczanie Gemini | 5000 | 500 000 | -- | -- |
Wycofane modele | ||||
Gemini 1.5 Flash (wersja wycofana) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (wersja wycofana) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (wersja wycofana) | 1000 | 4 000 000 |
Poziom 3
Model | RPM | TPM | RPD | Tokeny w kolejce do przetwarzania zbiorczego |
---|---|---|---|---|
Modele tekstowe | ||||
Gemini 2.5 Pro | 2000 | 8 000 000 | 1 000 000 000 | |
Gemini 2.5 Flash | 10 000 | 8 000 000 | 1 000 000 000 | |
Wersja testowa Gemini 2.5 Flash-Lite 17.06 | 30 000 | 30 000 000 | ||
Gemini 2.0 Flash | 30 000 | 30 000 000 | 5 000 000 000 | |
Gemini 2.0 Flash-Lite | 30 000 | 30 000 000 | 5 000 000 000 | |
Interfejs Live API | ||||
Gemini 2.5 Flash Live | 1000 sesji | 10 000 000 | ||
Okno podglądu Gemini 2.5 Flash Native Audio | 100 sesji | 1 000 000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 sesja | 25 000 | 50 | |
Gemini 2.0 Flash Live | 1000 sesji | 10 000 000 | ||
Modele generowania multimodalnego | ||||
Gemini 2.5 Flash Preview TTS | 1000 | 1 000 000 | ||
Wersja testowa Gemini 2.5 Pro TTS | 100 | 1 000 000 | ||
Generowanie obrazów w Gemini 2.0 Flash | 5000 | 5 000 000 | ||
Imagen 3 | 20 | |||
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Veo 2 | 2 filmy na minutę | 50 filmów dziennie | ||
Inne modele | ||||
Gemma 3 i 3n | 30 | 15 000 | 14 400 | |
Umieszczanie Gemini | 10 000 | 1 000 000 | -- | -- |
Wycofane modele | ||||
Gemini 1.5 Flash (wersja wycofana) | 2000 | 4 000 000 | ||
Gemini 1.5 Flash-8B (wersja wycofana) | 4000 | 4 000 000 | ||
Gemini 1.5 Pro (wersja wycofana) | 1000 | 4 000 000 |
Określone limity szybkości nie są gwarantowane, a rzeczywista przepustowość może się różnić.
Limity szybkości w trybie wsadowym
Żądania w trybie wsadowym podlegają własnym limitom liczby żądań, które są oddzielne od wywołań interfejsu API w trybie innym niż wsadowy.
- Równoczesne żądania zbiorcze: 100
- Limit rozmiaru pliku wejściowego: 2 GB
- Limit miejsca na pliki: 20 GB
- Tokeny w kolejce według modelu: poniższa tabela zawiera maksymalną liczbę tokenów, które można umieścić w kolejce do przetwarzania wsadowego we wszystkich aktywnych zadaniach wsadowych dla danego modelu.
Jak przejść na wyższy poziom
Interfejs Gemini API korzysta z Cloud Billing w przypadku wszystkich usług rozliczeniowych. Aby przejść z poziomu bezpłatnego na płatny, musisz najpierw włączyć płatności Cloud w swoim projekcie Google Cloud.
Gdy projekt spełni określone kryteria, będzie można go przenieść na wyższy poziom. Aby poprosić o przekształcenie:
- Otwórz stronę kluczy interfejsów API w AI Studio.
- Znajdź projekt, który chcesz uaktualnić, i kliknij „Uaktualnij”. Opcja „Uaktualnij” będzie widoczna tylko w przypadku projektów, które spełniają wymagania dotyczące kolejnego poziomu.
Po szybkiej weryfikacji projekt zostanie uaktualniony do następnego poziomu.
Wysyłanie prośby o zwiększenie limitu częstotliwości
Każda odmiana modelu ma powiązany limit szybkości (żądania na minutę, RPM). Szczegółowe informacje o tych limitach znajdziesz w sekcji Modele Gemini.
Prośba o zwiększenie limitu częstotliwości w przypadku wersji płatnej
Nie możemy zagwarantować zwiększenia limitu, ale dołożymy wszelkich starań, aby rozpatrzyć Twoją prośbę.