Limitet e shpejtësisë rregullojnë numrin e kërkesave që mund t'i bëni Gemini API brenda një afati kohor të caktuar. Këto kufizime ndihmojnë në ruajtjen e përdorimit të drejtë, mbrojtjen nga abuzimi dhe ndihmojnë në ruajtjen e performancës së sistemit për të gjithë përdoruesit.
Shikoni limitet tuaja të normës aktive në AI Studio
Si funksionojnë kufijtë e tarifave
Limitet e normës zakonisht maten në tre dimensione:
- Kërkesa për minutë ( RPM )
- Tokenë për minutë (hyrje) ( TPM )
- Kërkesat në ditë ( RPD )
Përdorimi juaj vlerësohet kundrejt secilit limit dhe tejkalimi i ndonjërit prej tyre do të shkaktojë një gabim në limitin e shpejtësisë. Për shembull, nëse limiti juaj i RPM është 20, bërja e 21 kërkesave brenda një minute do të rezultojë në një gabim, edhe nëse nuk e keni tejkaluar TPM-në tuaj ose limite të tjera.
Limitet e shpejtësisë zbatohen për projekt, jo për çelës API. Kuotat e kërkesave në ditë ( RPD ) rivendosen në mesnatë sipas orës së Paqësorit.
Limitet ndryshojnë në varësi të modelit specifik që përdoret, dhe disa kufizime vlejnë vetëm për modele specifike. Për shembull, Imazhe për minutë, ose IPM, llogaritet vetëm për modelet e afta për të gjeneruar imazhe (Nano Banana), por është konceptualisht i ngjashëm me TPM. Modele të tjera mund të kenë një limit token për ditë (TPD).
Limitet e shpejtësisë janë më të kufizuara për modelet eksperimentale dhe ato paraprake.
Nivelet e përdorimit
Limitet e tarifave janë të lidhura me nivelin e përdorimit të projektit. Ndërsa përdorimi dhe shpenzimet e API-t tuaj rriten, ju do të përmirësoheni automatikisht në një nivel më të lartë me limite të rritura të tarifave.
Kualifikimet për Nivelet 2 dhe 3 bazohen në shpenzimet totale kumulative për shërbimet e Google Cloud (duke përfshirë, por pa u kufizuar në, Gemini API) për llogarinë e faturimit të lidhur me projektin tuaj.
| Shtresa | Kualifikimet |
|---|---|
| Falas | Përdoruesit në vendet e përshtatshme |
| Niveli 1 | Llogari faturimi e paguar plotësisht e lidhur me projektin |
| Niveli 2 | Shpenzime totale: > 250 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
| Niveli 3 | Shpenzime totale: > 1,000 dollarë dhe të paktën 30 ditë që nga pagesa e suksesshme |
Kur kërkoni një përmirësim, sistemi ynë i automatizuar i mbrojtjes nga abuzimi kryen kontrolle shtesë. Ndërsa përmbushja e kritereve të deklaruara të kualifikimit është përgjithësisht e mjaftueshme për miratim, në raste të rralla një kërkesë për përmirësim mund të refuzohet bazuar në faktorë të tjerë të identifikuar gjatë procesit të shqyrtimit.
Ky sistem ndihmon në ruajtjen e sigurisë dhe integritetit të platformës Gemini API për të gjithë përdoruesit.
Kufijtë e normës së API-t Gemini
Limitet e tarifave varen nga një sërë faktorësh (siç është niveli juaj i kuotave) dhe mund të shihen në Google AI Studio. Ndërsa niveli dhe statusi i llogarisë suaj ndryshojnë me kalimin e kohës, limitet tuaja të tarifave do të përditësohen automatikisht.
Shikoni limitet tuaja të normës aktive në AI Studio
Limitet e specifikuara të tarifave nuk janë të garantuara dhe kapaciteti aktual mund të ndryshojë.
Limitet e shpejtësisë së API-t të serisë
Kërkesat e API-t në grup i nënshtrohen kufijve të tyre të shpejtësisë, të ndara nga thirrjet API jo-në grup.
- Kërkesa të njëkohshme në grupe: 100
- Limiti i madhësisë së skedarit të futur: 2 GB
- Limiti i ruajtjes së skedarëve: 20 GB
- Tokenët e vendosur në radhë për model: Tabela e tokenëve të vendosur në radhë në grup rendit numrin maksimal të tokenëve që mund të vendosen në radhë për përpunim në grup në të gjitha punët tuaja aktive në grup për një model të caktuar.
Niveli 1
| Model | Tokenët e vendosur në radhë në grup | |||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3.1 Pro | 5,000,000 | |||
| Pamje paraprake e Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Pamje paraprake e shpejtë e Gemini 3 | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Binjakët 2.5 Flash | 3,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 3,000,000 | |||
| Pamje paraprake e imazhit të flashit Gemini 2.5 | 3,000,000 | |||
| TTS me Flash Gemini 2.5 | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Binjakët 2.0 Flash | 10,000,000 | |||
| Imazh Flash i Gemini 2.0 | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit flash të Gemini 3.1 🍌 | 1,000,000 | |||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 2,000,000 | |||
Niveli 2
| Model | Tokenët e vendosur në radhë në grup | |||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3.1 Pro | 500,000,000 | |||
| Pamje paraprake e Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Pamje paraprake e shpejtë e Gemini 3.1 | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Binjakët 2.5 Flash | 400,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 400,000,000 | |||
| Pamje paraprake e imazhit të flashit Gemini 2.5 | 400,000,000 | |||
| TTS me Flash Gemini 2.5 | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Binjakët 2.0 Flash | 1,000,000,000 | |||
| Imazh Flash i Gemini 2.0 | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit flash të Gemini 3.1 🍌 | 250,000,000 | |||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 270,000,000 | |||
Niveli 3
| Model | Tokenët e vendosur në radhë në grup | |||
|---|---|---|---|---|
| Modelet e nxjerrjes së tekstit | ||||
| Pamje paraprake e Gemini 3.1 Pro | 1,000,000,000 | |||
| Pamje paraprake e Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Pamje paraprake e shpejtë e Gemini 3.1 | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Binjakët 2.5 Flash | 1,000,000,000 | |||
| Pamje paraprake e flashit Gemini 2.5 | 1,000,000,000 | |||
| Pamje paraprake e imazhit të flashit Gemini 2.5 | 1,000,000,000 | |||
| TTS me Flash Gemini 2.5 | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Pamje paraprake e Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Binjakët 2.0 Flash | 5,000,000,000 | |||
| Imazh Flash i Gemini 2.0 | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| Modelet e gjenerimit multimodal | ||||
| Pamje paraprake e imazhit flash të Gemini 3.1 🍌 | 750,000,000 | |||
| Pamje paraprake e imazhit të Gemini 3 Pro 🍌 | 1,000,000,000 | |||
Si të përmirësoheni në nivelin tjetër
Për të kaluar nga niveli Falas në një nivel me pagesë, së pari duhet të konfiguroni faturimin në AI Studio .
Pasi projekti juaj të përmbushë kriteret e specifikuara , ai do të përmirësohet automatikisht në nivelin tjetër. Përmirësimet e nivelit nga Falas në Nivelin 1 zakonisht do të hyjnë në fuqi menjëherë, dhe përmirësimet pasuese të nivelit do të hyjnë në fuqi brenda 10 minutash. Shkoni te faqja e Projekteve në AI Studio për të kontrolluar nivelet tuaja.
Kërkoni një rritje të limitit të tarifës
Çdo variant modeli ka një limit shpejtësie të shoqëruar (kërkesa për minutë, RPM). Për detaje mbi këto limite shpejtësie, shihni faqen Limiti i Shpejtësisë së AI Studio .
Kërkoni rritje të limitit të tarifës së paguar
Ne nuk ofrojmë asnjë garanci për rritjen e limitit tuaj të tarifës, por do të bëjmë çmos për të shqyrtuar kërkesën tuaj.