速率限制

速率限制用于限制您可以在给定时间范围内向 Gemini API 发出的请求数。这些限制有助于确保公平使用、防范滥用行为,并帮助维护所有用户的系统性能。

费率上限的运作方式

速率限制是根据以下四个维度衡量的:

  • 每分钟请求数 (RPM)
  • 每天的请求次数 (RPD)
  • 每分钟令牌数 (TPM)

系统会根据每项限制对您的用量进行评估,如果超出其中任一限制,都会触发速率限制错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求将导致错误,即使您没有超出 TPM 或其他限制也是如此。

速率限制按项目应用,而不是按 API 密钥应用。

限制因所使用的具体模型而异,有些限制仅适用于特定模型。例如,“每分钟图片数”(IPM)仅针对能够生成图片的模型(图 3)计算,但在概念上与 TPM 类似。

当前费率限制

免费层级

型号 每千次展示收入 TPM RPD
Gemini 2.0 Flash 15 1,000,000 1500
Gemini 2.0 Flash-Lite 预览版 30 1,000,000 1500
Gemini 2.0 Pro Experimental 02-05 2 1,000,000 50
Gemini 2.0 Flash Thinking Experimental 01-21 10 4,000,000 1500
Gemini 1.5 Flash 15 1,000,000 1500
Gemini 1.5 Flash-8B 15 1,000,000 1500
Gemini 1.5 Pro 2 32000 50
Imagen 3 -- -- --
型号 每千次展示收入 TPM RPD
Gemini 2.0 Flash 2000 4,000,000 --
Gemini 2.0 Flash-Lite 预览版 4000 4,000,000 --
Gemini 2.0 Pro Experimental 02-05 5 1,000,000 --
Gemini 2.0 Flash Thinking Experimental 01-21 10 4,000,000 --
Gemini 1.5 Flash 2000 4,000,000 --
Gemini 1.5 Flash-8B 4000 4,000,000 --
Gemini 1.5 Pro 1000 4,000,000 --
Imagen 3 -- 每分钟 20 张图片 (IPM) --

即将推出!

[*] 我们无法保证指定的速率限制,实际容量可能会有所不同。

使用层

速率限制与项目使用层级(我们即将推出)相关联。随着 API 使用量和支出增加,您可以选择升级到更高层级,以提高费率上限。

层级 资格条件
免费 符合条件的国家/地区的用户
第 1 层级 与项目关联的结算账号
第 2 层级 总支出:250 美元 + 成功付款后至少 30 天
第 3 级 尚不可用,即将推出。

当您请求升级时,我们的自动滥用行为防范系统会执行额外的检查。虽然通常只要符合规定的资格条件即可获得批准,但在极少数情况下,升级请求可能会因审核过程中发现的其他因素而被拒。

此系统有助于确保 Gemini API 平台对所有用户的安全性和完整性。

申请提高速率限制

每个模型变体都有一个关联的速率限制(每分钟请求数,RPM)。如需详细了解这些速率限制,请参阅 Gemini 模型

申请提高付费层级的速率限制

我们无法保证一定会提高您的速率上限,但会尽力审核您的请求,如果能够满足您的容量需求,我们会与您联系。