レート制限

レート上限は、特定の期間内に Gemini API に送信できるリクエストの数を規制します。これらの上限は、公平な使用を維持し、不正使用を防ぎ、すべてのユーザーのシステム パフォーマンスを維持するのに役立ちます。

レート制限の仕組み

通常、レート制限は次の 3 つのディメンションで測定されます。

  • 1 分あたりのリクエスト数(RPM
  • 1 分あたりのトークン数(入力)(TPM
  • 1 日あたりのリクエスト数(RPD

使用量は各上限に対して評価され、いずれかの上限を超えるとレート制限エラーがトリガーされます。たとえば、RPM 上限が 20 の場合、TPM や他の上限を超えていなくても、1 分以内に 21 回のリクエストを行うとエラーが発生します。

レート上限は API キーごとではなく、プロジェクトごとに適用されます。

1 日あたりのリクエスト数(RPD)の割り当ては、太平洋時間の午前 0 時にリセットされます。

上限は使用する特定のモデルによって異なり、一部の上限は特定のモデルにのみ適用されます。たとえば、1 分あたりの画像数(IPM)は、画像を生成できるモデル(Imagen 3)に対してのみ計算されますが、概念的には TPM と似ています。他のモデルには、1 日あたりのトークン数(TPD)の上限が設定されている場合があります。

試験運用版モデルとプレビュー版モデルでは、レート上限がより厳しく制限されます。

使用量ティア

レート上限は、プロジェクトの使用量階層に関連付けられています。API の使用量と費用が増加すると、レート上限が増加した上位の階層にアップグレードできるようになります。

ティア 2 とティア 3 の条件は、プロジェクトにリンクされた請求先アカウントの Google Cloud サービス(Gemini API を含むがこれに限定されない)の合計累積費用に基づいています。

階層 要件
無料 対象となる国のユーザー
Tier 1 プロジェクトにリンクされている請求先アカウント
Tier 2 合計費用: $250 超、支払いが完了してから 30 日以上経過している
Tier 3 合計費用: $1,000 超、支払い完了から 30 日以上経過している

アップグレードをリクエストすると、自動化された不正使用防止システムによって追加のチェックが実行されます。通常、上記の認定条件を満たしていればアップグレードは承認されますが、審査プロセスで特定された他の要因に基づいて、アップグレード リクエストが拒否されることもまれにあります。

このシステムは、すべてのユーザーに対して Gemini API プラットフォームのセキュリティと完全性を維持するのに役立ちます。

標準 API のレート上限

次の表に、すべての標準 Gemini API 呼び出しのレート上限を示します。

無料枠

モデル RPM TPM RPD
テキスト出力モデル
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live セッション数: 3 1,000,000 *
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 1 回 25,000 5
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 10,000 5
Gemini 2.0 Flash Live セッション数: 3 1,000,000 *
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 3 10,000 15
Gemini 2.0 Flash プレビューの画像生成 10 200,000 100
その他のモデル
Gemma 3 および 3n 30 15,000 14,400
Gemini エンベディング 100 30,000 1,000
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 15 250,000 50
Gemini 1.5 Flash-8B(非推奨) 15 250,000 50

Tier 1

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 セッション 4,000,000 * *
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ セッション数: 3 50,000 50 *
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50 *
Gemini 2.0 Flash Live 50 セッション 4,000,000 * *
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 10 10,000 100 *
Gemini 2.5 Pro プレビュー TTS 10 10,000 50 *
Gemini 2.5 Flash Image のプレビュー 500 500,000 2,000 *
Gemini 2.0 Flash プレビューの画像生成 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
その他のモデル
Gemma 3 および 3n 30 15,000 14,400 *
Gemini エンベディング 3,000 1,000,000 * *
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000 * *
Gemini 1.5 Pro(非推奨) 1,000 4,000,000 * *

Tier 2

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 セッション 10,000,000 * *
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 100 セッション 1,000,000 * *
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50 *
Gemini 2.0 Flash Live 1,000 セッション 10,000,000 * *
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 1,000 100,000 10,000 *
Gemini 2.5 Pro プレビュー TTS 100 25,000 1,000 *
Gemini 2.5 Flash Image のプレビュー 2,000 1,500,000 50,000 *
Gemini 2.0 Flash プレビューの画像生成 2,000 3,000,000 100,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
その他のモデル
Gemma 3 および 3n 30 15,000 14,400 *
Gemini エンベディング 5,000 5,000,000 * *
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000 * *
Gemini 1.5 Pro(非推奨) 1,000 4,000,000 * *

Tier 3

モデル RPM TPM RPD バッチでキューに登録されたトークン
テキスト出力モデル
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 セッション 10,000,000 * *
Gemini 2.5 Flash プレビューのネイティブ音声ダイアログ 100 セッション 1,000,000 * *
Gemini 2.5 Flash Experimental ネイティブ音声思考ダイアログ 1 回 25,000 50 *
Gemini 2.0 Flash Live 1,000 セッション 10,000,000 * *
マルチモーダル生成モデル
Gemini 2.5 Flash プレビュー TTS 1,000 1,000,000 * *
Gemini 2.5 Pro プレビュー TTS 100 1,000,000 * *
Gemini 2.5 Flash Image のプレビュー 5,000 5,000,000 * *
Gemini 2.0 Flash プレビューの画像生成 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
その他のモデル
Gemma 3 および 3n 30 15,000 14,400 *
Gemini エンベディング 10,000 10,000,000 * *
サポートが終了したモデル
Gemini 1.5 Flash(非推奨) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B(非推奨) 4,000 4,000,000 * *
Gemini 1.5 Pro(非推奨) 1,000 4,000,000 * *

指定されたレート上限は保証されず、実際の容量は異なる場合があります。

Batch API のレート制限

Batch API リクエストには、バッチ処理以外の API 呼び出しとは別のレート制限が適用されます。

  • 同時実行バッチ リクエスト: 100
  • 入力ファイルサイズの制限: 2 GB
  • ファイル保存容量の上限: 20 GB
  • モデルあたりのキュー登録済みトークン: 割り当て上限の表の [バッチ キュー登録済みトークン] 列には、特定のモデルのアクティブなすべてのバッチジョブでバッチ処理用にキュー登録できるトークンの最大数が表示されます。標準 API レート制限の表をご覧ください。

次の階層にアップグレードする方法

Gemini API は、すべての課金サービスに Cloud Billing を使用します。無料枠から有料枠に移行するには、まず Google Cloud プロジェクトで Cloud Billing を有効にする必要があります。

プロジェクトが指定された条件を満たすと、次の階層へのアップグレードの対象となります。アップグレードをリクエストする手順は次のとおりです。

  • AI Studio の API キーのページに移動します。
  • アップグレードするプロジェクトを見つけて、[アップグレード] をクリックします。[アップグレード] オプションは、次の階層の条件を満たすプロジェクトにのみ表示されます。

簡単な検証の後、プロジェクトは次の階層にアップグレードされます。

レート制限の引き上げをリクエストする

各モデル バリエーションには、関連付けられたレート制限(1 分あたりのリクエスト数、RPM)があります。これらのレート制限の詳細については、Gemini モデルをご覧ください。

有料階層のレート制限の引き上げをリクエストする

レート上限の引き上げは保証されませんが、リクエストの審査に最善を尽くします。