Gemini モデル

モデル バリエーション

Gemini API には、特定のユースケース用に最適化されたさまざまなモデルが用意されています。利用可能な Gemini のバリエーションの概要は次のとおりです。

モデル バリエーション 入力 出力 最適な用途
Gemini 2.0 Flash
gemini-2.0-flash
音声、画像、動画、テキスト テキスト、画像(近日提供予定)、音声(近日提供予定) 次世代の特徴、速度、マルチモーダル生成によるさまざまなタスク
Gemini 2.0 Flash-Lite プレビュー
gemini-2.0-flash-lite-preview-02-05
音声、画像、動画、テキスト テキスト 費用対効果と低レイテンシを重視して最適化された Gemini 2.0 Flash モデル
Gemini 1.5 Flash
gemini-1.5-flash
音声、画像、動画、テキスト テキスト さまざまなタスクで高速で汎用性の高いパフォーマンスを実現
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
音声、画像、動画、テキスト テキスト 大量の低インテリジェンス タスク
Gemini 1.5 Pro
gemini-1.5-pro
音声、画像、動画、テキスト テキスト より多くのインテリジェンスを必要とする複雑な推論タスク
テキスト エンベディング
text-embedding-004
テキスト テキスト エンベディング テキスト文字列の関連性の測定

各モデルのレート制限は、レート制限ページで確認できます。

Gemini 2.0 Flash

Gemini 2.0 Flash は、優れた速度、ネイティブ ツールの使用、マルチモーダル生成、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と強化された機能を提供します。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

音声(近日提供予定)、画像(近日提供予定)、テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

の機能

構造化出力

サポート対象

キャッシュ保存

近日提供予定

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

検索

サポート対象

画像生成

近日提供予定

ネイティブ ツールの使用

サポート対象

音声の生成

近日提供予定

Multimodal Live API

近日提供予定

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-2.0-flash
  • 安定版: gemini-2.0-flash-001
最終更新日 2025 年 2 月
知識のカットオフ 2024 年 8 月

Gemini 2.0 Flash-Lite プレビュー

費用対効果と低レイテンシを重視して最適化された Gemini 2.0 Flash モデル。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-2.0-flash-lite-preview-02-05
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

の機能

構造化出力

サポート対象

キャッシュ保存

サポート対象外

チューニング

サポート対象外

関数呼び出し

サポート対象外

コードの実行

サポート対象外

検索

サポート対象外

画像生成

サポート対象外

ネイティブ ツールの使用

サポート対象外

音声の生成

サポート対象外

Multimodal Live API

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-2.0-flash-lite-preview-02-05
最終更新日 2025 年 2 月
知識のカットオフ 2024 年 8 月

Gemini 1.5 Flash

Gemini 1.5 Flash は、さまざまなタスクにスケーリングできる、高速で汎用性の高いマルチモーダル モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-latest
  • 最新の安定版: gemini-1.5-flash
  • 安定版:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
最終更新日 2024 年 9 月

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B は、低インテリジェンス タスク向けに設計された小型モデルです。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-flash-8b
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

1,048,576

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

3,600

動画の長さの上限

1 時間

音声の最大長

約 9.5 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-flash-8b-latest
  • 最新の安定版: gemini-1.5-flash-8b
  • 安定版:
    • gemini-1.5-flash-8b-001
最終更新日 2024 年 10 月

Gemini 1.5 Pro

Gemini 1.5 Pro は、幅広い推論タスクに最適化された中規模のマルチモーダル モデルです。1.5 Pro では、2 時間の動画、19 時間の音声、60,000 行のコードを含むコードベース、2,000 ページのテキストなど、大量のデータを一度に処理できます。

Google AI Studio で試す

モデルの詳細

プロパティ 説明
モデルコード models/gemini-1.5-pro
: サポートされるデータタイプ

入力

音声、画像、動画、テキスト

出力

テキスト

トークンの上限[*]

入力トークンの上限

2,097,152

出力トークンの上限

8,192

音声/映像の仕様

プロンプトあたりの画像の最大数

7,200

動画の長さの上限

2 時間

音声の最大長

約 19 時間

の機能

システム指示

サポート対象

JSON モード

サポート対象

JSON スキーマ

サポート対象

調整可能な安全性設定

サポート対象

キャッシュ保存

サポート対象

チューニング

サポート対象外

関数呼び出し

サポート対象

コードの実行

サポート対象

双方向ストリーミング

サポート対象外

バージョン
詳細については、モデル バージョン パターンをご覧ください。
  • 最新: gemini-1.5-pro-latest
  • 最新の安定版: gemini-1.5-pro
  • 安定版:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
最終更新日 2024 年 9 月

テキスト エンベディングとエンベディング

テキスト エンベディング

テキスト エンベディングは、文字列の関連性を測定するために使用され、多くの AI アプリケーションで広く使用されています。

text-embedding-004 は、標準の MTEB エンベディング ベンチマークで、同等のディメンションを持つ既存のモデルよりも優れた検索パフォーマンスを達成し、優れたパフォーマンスを発揮します。

モデルの詳細
プロパティ 説明
モデルコード

Gemini API

models/text-embedding-004

: サポートされるデータタイプ

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2024 年 4 月

埋め込み

エンベディング モデルを使用して、入力テキストのテキスト エンベディングを生成できます。

エンベディング モデルは、最大 2,048 トークンのテキストに対して 768 次元のエンベディングを作成するように最適化されています。

エンベディング モデルの詳細
プロパティ 説明
モデルコード models/embedding-001
: サポートされるデータタイプ

入力

テキスト

出力

テキスト エンベディング

トークンの上限[*]

入力トークンの上限

2,048

出力ディメンションのサイズ

768

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象外
最終更新日 2023 年 12 月

AQA

AQA モデルを使用すると、ドキュメント、コーパス、または一連のパラグラフに対して属性付き質問応答(AQA)関連のタスクを実行できます。AQA モデルは、指定されたソースに基づく質問に対する回答と、回答可能な確率の推定値を返します。

モデルの詳細

プロパティ 説明
モデルコード models/aqa
: サポートされるデータタイプ

入力

テキスト

出力

テキスト

サポートされている言語 英語
トークンの上限[*]

入力トークンの上限

7,168

出力トークンの上限

1,024

レート制限[**] 1 分あたり 1,500 件のリクエスト
された調整可能な安全性設定 サポート対象
最終更新日 2023 年 12 月

これらのモデルのバリエーションの機能については、をご覧ください。

[*] Gemini モデルの場合、1 個のトークンは約 4 文字に相当します。100 個のトークンは、約 60 ~ 80 ワード(英語)です。

モデル バージョン名のパターン

Gemini モデルは、プレビュー版または安定版のいずれかを使用できます。コードでは、次のいずれかのモデル名形式を使用して、使用するモデルとバージョンを指定できます。

  • 最新: 指定した生成とバリエーションのモデルの最先端バージョンを参照します。基盤となるモデルは定期的に更新され、プレビュー バージョンである場合があります。このエイリアスは、探索的テストアプリとプロトタイプでのみ使用してください。

    最新バージョンを指定するには、<model>-<generation>-<variation>-latest というパターンを使用します。例: gemini-1.0-pro-latest

  • 最新の安定版: 指定されたモデルの生成とバリエーション用にリリースされた最新の安定版を参照します。

    最新の安定版を指定するには、<model>-<generation>-<variation> というパターンを使用します。例: gemini-1.0-pro

  • 安定版: 特定の安定版モデルを参照します。安定モデルは変更されません。ほとんどの本番環境アプリでは、特定の安定したモデルを使用する必要があります。

    安定版を指定するには、<model>-<generation>-<variation>-<version> の形式を使用します。例: gemini-1.0-pro-001

  • 試験運用版: 利用規約で定義されているように、プレビュー版で利用可能な試験運用版モデルを指します。つまり、本番環境での使用は想定されていません。Google は、フィードバックの収集、最新アップデートのデベロッパーへの迅速な提供、Google のイノベーションのペースの強調を目的として、試験運用版モデルをリリースしています。試験運用版リリースから得た学びを活かして、モデルの提供対象ユーザーを拡大する予定です。試験運用版モデルは、事前の通知なく別のモデルと置き換えられる可能性があります。試験運用版モデルは、将来的に安定版モデルになるとは限りません。

    試験運用版を指定するには、<model>-<generation>-<variation>-<version> というパターンを使用します。例: gemini-exp-1121

対応言語

Gemini モデルは、次の言語で動作するようにトレーニングされています。

  • アラビア語(ar
  • ベンガル語(bn
  • ブルガリア語(bg
  • 中国語(簡体および繁体)(zh
  • クロアチア語(hr
  • チェコ語(cs
  • デンマーク語(da
  • オランダ語(nl
  • 英語(en
  • エストニア語(et
  • フィンランド語(fi
  • フランス語(fr
  • ドイツ語(de
  • ギリシャ語(el
  • ヘブライ語(iw
  • ヒンディー語(hi
  • ハンガリー語(hu
  • インドネシア語(id
  • イタリア語(it
  • 日本語(ja
  • 韓国語(ko
  • ラトビア語(lv
  • リトアニア語(lt
  • ノルウェー語(no
  • ポーランド語(pl
  • ポルトガル語(pt
  • ルーマニア語(ro
  • ロシア語(ru
  • セルビア語(sr
  • スロバキア語(sk
  • スロベニア語(sl
  • スペイン語(es
  • スワヒリ語(sw
  • スウェーデン語(sv
  • タイ語(th
  • トルコ語(tr
  • ウクライナ語(uk
  • ベトナム語(vi