速率限制用于限制您可以在给定时间范围内向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助维护所有用户的系统性能。
费率上限的运作方式
速率限制是根据以下四个维度衡量的:
- 每分钟请求数 (RPM)
- 每天的请求次数 (RPD)
- 每分钟令牌数 (TPM)
系统会根据每项限制对您的用量进行评估,如果超出其中任一限制,都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求将导致错误,即使您没有超出 TPM 或其他限制也是如此。
速率限制按项目应用,而不是按 API 密钥应用。
限制因所使用的具体模型而异,有些限制仅适用于特定模型。例如,“每分钟图片数”(IPM)仅针对能够生成图片的模型(图 3)计算,但在概念上与 TPM 类似。
当前费率限制
免费层级
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 15 | 1,000,000 | 1500 |
Gemini 2.0 Flash-Lite 预览版 | 30 | 1,000,000 | 1500 |
Gemini 2.0 Pro Experimental 02-05 | 2 | 1,000,000 | 50 |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | 1500 |
Gemini 1.5 Flash | 15 | 1,000,000 | 1500 |
Gemini 1.5 Flash-8B | 15 | 1,000,000 | 1500 |
Gemini 1.5 Pro | 2 | 32000 | 50 |
Imagen 3 | -- | -- | -- |
付费层级 1
型号 | 每千次展示收入 | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 2000 | 4,000,000 | -- |
Gemini 2.0 Flash-Lite 预览版 | 4000 | 4,000,000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1,000,000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | -- |
Gemini 1.5 Flash | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro | 1000 | 4,000,000 | -- |
Imagen 3 | -- | 每分钟 20 张图片 (IPM) | -- |
付费第 2 层级
即将推出!
[*] 我们无法保证指定的速率限制,实际容量可能会有所不同。
使用层
速率限制与项目使用层级(我们即将推出)相关联。随着 API 使用量和支出增加,您可以选择升级到更高层级,以提高费率上限。
层级 | 资格条件 |
---|---|
免费 | 符合条件的国家/地区的用户 |
第 1 层级 | 与项目关联的结算账号 |
第 2 层级 | 总支出:250 美元 + 成功付款后至少 30 天 |
第 3 级 | 尚不可用,即将推出。 |
当您请求升级时,我们的自动滥用行为防范系统会执行额外的检查。虽然通常只要符合规定的资格条件即可获得批准,但在极少数情况下,升级请求可能会因审核过程中发现的其他因素而被拒。
此系统有助于确保 Gemini API 平台对所有用户的安全性和完整性。
申请提高速率限制
每个模型变体都有一个关联的速率限制(每分钟请求数,RPM)。如需详细了解这些速率限制,请参阅 Gemini 模型。
我们无法保证一定会提高您的速率上限,但会尽力审核您的请求,如果能够满足您的容量需求,我们会与您联系。