2.0 Flash
Model multimodal terbaru kami, dengan fitur generasi berikutnya dan kemampuan yang lebih baik
- Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
- Membuat kode, mengekstrak data, menganalisis file, membuat grafik, dan lainnya
- Latensi rendah, performa yang ditingkatkan, dibuat untuk mendukung pengalaman agen
2.0 Flash-Lite
Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah
- Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
- Mengungguli 1.5 Flash di sebagian besar benchmark
- Jendela konteks 1 juta token dan input multimodal, seperti Flash 2.0
1.5 Flash
Model multimodal kami yang paling seimbang dengan performa yang luar biasa untuk sebagian besar tugas
- Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
- Membuat kode, mengekstrak data, mengedit teks, dan lainnya
- Paling cocok untuk tugas yang menyeimbangkan performa dan biaya
Varian model
Gemini API menawarkan berbagai model yang dioptimalkan untuk kasus penggunaan tertentu. Berikut ringkasan singkat tentang varian Gemini yang tersedia:
Varian model | Input | Output | Dioptimalkan untuk |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash |
Audio, gambar, video, dan teks | Teks, gambar (segera hadir), dan audio (segera hadir) | Fitur, kecepatan, dan pembuatan multimodal generasi berikutnya untuk berbagai tugas |
Pratinjau Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05 |
Audio, gambar, video, dan teks | Teks | Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah |
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, gambar, video, dan teks | Teks | Performa yang cepat dan serbaguna di berbagai tugas |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Audio, gambar, video, dan teks | Teks | Tugas dengan volume tinggi dan kecerdasan yang lebih rendah |
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, gambar, video, dan teks | Teks | Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan |
Penyematan Teks
text-embedding-004 |
Teks | Embedding teks | Mengukur keterkaitan string teks |
Anda dapat melihat batas kapasitas untuk setiap model di halaman batas kapasitas.
Gemini 2.0 Flash
Gemini 2.0 Flash menghadirkan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang unggul, penggunaan alat native, pembuatan multimodal, dan jendela konteks 1 juta token.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/gemini-2.0-flash |
Jenis data yang didukung |
Input Audio, gambar, video, dan teks Output Audio (segera hadir), gambar (segera hadir), dan teks |
[*] | Batas token
Batas token input 1.048.576 Batas token output 8.192 |
Kemampuan |
Output terstruktur Didukung Menyimpan ke cache Segera hadir Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Penelusuran Didukung Pembuatan gambar Segera hadir Penggunaan alat native Didukung Pembuatan audio Segera hadir Multimodal Live API Segera hadir |
Versions |
|
Pembaruan terbaru | Februari 2025 |
Pemotongan pengetahuan | Agustus 2024 |
Pratinjau Gemini 2.0 Flash-Lite
Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/gemini-2.0-flash-lite-preview-02-05 |
Jenis data yang didukung |
Input Audio, gambar, video, dan teks Output Teks |
[*] | Batas token
Batas token input 1.048.576 Batas token output 8.192 |
Kemampuan |
Output terstruktur Didukung Menyimpan ke cache Tidak didukung Penyesuaian Tidak didukung Panggilan fungsi Tidak didukung Eksekusi kode Tidak didukung Penelusuran Tidak didukung Pembuatan gambar Tidak didukung Penggunaan alat native Tidak didukung Pembuatan audio Tidak didukung Multimodal Live API Tidak didukung |
Versions |
|
Pembaruan terbaru | Februari 2025 |
Pemotongan pengetahuan | Agustus 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash adalah model multimodal yang cepat dan serbaguna untuk penskalaan di berbagai tugas.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/gemini-1.5-flash |
Jenis data yang didukung |
Input Audio, gambar, video, dan teks Output Teks |
[*] | Batas token
Batas token input 1.048.576 Batas token output 8.192 |
Spesifikasi audio/visual |
Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam |
Kemampuan |
Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung Streaming dua arah Tidak didukung |
Versions |
|
Pembaruan terbaru | September 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B adalah model kecil yang dirancang untuk tugas kecerdasan yang lebih rendah.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/gemini-1.5-flash-8b |
Jenis data yang didukung |
Input Audio, gambar, video, dan teks Output Teks |
[*] | Batas token
Batas token input 1.048.576 Batas token output 8.192 |
Spesifikasi audio/visual |
Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam |
Kemampuan |
Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung Streaming dua arah Tidak didukung |
Versions |
|
Pembaruan terbaru | Oktober 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro adalah model multimodal berukuran sedang yang dioptimalkan untuk berbagai tugas penalaran. 1.5 Pro dapat memproses data dalam jumlah besar sekaligus, termasuk video berdurasi 2 jam, audio berdurasi 19 jam, codebase dengan 60.000 baris kode, atau 2.000 halaman teks.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/gemini-1.5-pro |
Jenis data yang didukung |
Input Audio, gambar, video, dan teks Output Teks |
[*] | Batas token
Batas token input 2.097.152 Batas token output 8.192 |
Spesifikasi audio/visual |
Jumlah maksimum gambar per perintah 7.200 Durasi video maksimum 2 jam Durasi audio maksimum Sekitar 19 jam |
Kemampuan |
Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Streaming dua arah Tidak didukung |
Versions |
|
Pembaruan terbaru | September 2024 |
Penyematan Teks dan Embedding
Penyematan Teks
Embedding teks digunakan untuk mengukur keterkaitan string dan banyak digunakan di banyak aplikasi AI.
text-embedding-004
mencapai performa pengambilan yang lebih kuat dan mengungguli model yang ada
dengan dimensi yang sebanding, pada benchmark penyematan MTEB standar.
Detail model
Properti | Deskripsi |
---|---|
Kode model |
Gemini API
|
Jenis data yang didukung |
Input Teks Output Embedding teks |
[*] | Batas token
Batas token input 2.048 Ukuran dimensi output 768 |
[**] | Batas kapasitas1.500 permintaan per menit |
Setelan keamanan yang dapat disesuaikan | Tidak didukung |
Pembaruan terbaru | April 2024 |
Embedding
Anda dapat menggunakan model Embedding untuk menghasilkan embedding teks untuk teks input.
Model Embedding dioptimalkan untuk membuat embedding dengan 768 dimensi untuk teks hingga 2.048 token.
Menyematkan detail model
Properti | Deskripsi |
---|---|
Kode model |
models/embedding-001
|
Jenis data yang didukung |
Input Teks Output Embedding teks |
[*] | Batas token
Batas token input 2.048 Ukuran dimensi output 768 |
[**] | Batas kapasitas1.500 permintaan per menit |
Setelan keamanan yang dapat disesuaikan | Tidak didukung |
Pembaruan terbaru | Desember 2023 |
AQA
Anda dapat menggunakan model AQA untuk melakukan tugas terkait Pembahasan Pertanyaan dengan Atribusi (AQA) pada dokumen, korpus, atau serangkaian bagian. Model AQA menampilkan jawaban atas pertanyaan yang didasarkan pada sumber yang diberikan, beserta estimasi probabilitas yang dapat dijawab.
Detail model
Properti | Deskripsi |
---|---|
Kode model | models/aqa |
Jenis data yang didukung |
Input Teks Output Teks |
Bahasa yang didukung | Inggris |
[*] | Batas token
Batas token input 7.168 Batas token output 1.024 |
[**] | Batas kapasitas1.500 permintaan per menit |
Setelan keamanan yang dapat disesuaikan | Didukung |
Pembaruan terbaru | Desember 2023 |
Lihat contoh untuk mempelajari kemampuan variasi model ini.
[*] Token setara dengan sekitar 4 karakter untuk model Gemini. 100 token adalah sekitar 60-80 kata bahasa Inggris.
Pola nama versi model
Model Gemini tersedia dalam versi pratinjau atau stabil. Dalam kode, Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin Anda gunakan.
Terbaru: Menunjuk ke versi model terbaru untuk pembuatan dan variasi tertentu. Model yang mendasarinya diperbarui secara rutin dan mungkin merupakan versi pratinjau. Hanya aplikasi dan prototipe pengujian eksplorasi yang harus menggunakan alias ini.
Untuk menentukan versi terbaru, gunakan pola berikut:
<model>-<generation>-<variation>-latest
. Misalnya,gemini-1.0-pro-latest
.Stabil terbaru: Menunjuk ke versi stabil terbaru yang dirilis untuk variasi dan pembuatan model yang ditentukan.
Untuk menentukan versi stabil terbaru, gunakan pola berikut:
<model>-<generation>-<variation>
. Misalnya,gemini-1.0-pro
.Stabil: Menunjuk ke model stabil tertentu. Model stabil tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.
Untuk menentukan versi stabil, gunakan pola berikut:
<model>-<generation>-<variation>-<version>
. Misalnya,gemini-1.0-pro-001
.Eksperimental: Menunjuk ke model eksperimental yang tersedia di Pratinjau, seperti yang ditentukan dalam Persyaratan, yang berarti model ini tidak untuk penggunaan produksi. Kami merilis model eksperimental untuk mengumpulkan masukan, memberikan update terbaru kepada developer dengan cepat, dan menyoroti kecepatan inovasi yang terjadi di Google. Hal-hal yang kami pelajari dari peluncuran eksperimental akan menjadi dasar kami dalam merilis model secara lebih luas. Model eksperimental dapat diganti dengan model lain tanpa pemberitahuan sebelumnya. Kami tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.
Untuk menentukan versi eksperimental, gunakan pola berikut:
<model>-<generation>-<variation>-<version>
. Misalnya,gemini-exp-1121
.
Bahasa yang tersedia
Model Gemini dilatih untuk berfungsi dengan bahasa berikut:
- Arab (
ar
) - Bengali (
bn
) - Bulgaria (
bg
) - China (aksara sederhana dan tradisional) (
zh
) - Kroasia (
hr
) - Ceko (
cs
) - Denmark (
da
) - Belanda (
nl
) - Inggris (
en
) - Estonia (
et
) - Finlandia (
fi
) - Prancis (
fr
) - Jerman (
de
) - Yunani (
el
) - Ibrani (
iw
) - Hindi (
hi
) - Hungaria (
hu
) - Indonesia (
id
) - Italia (
it
) - Jepang (
ja
) - Korea (
ko
) - Latvia (
lv
) - Lituania (
lt
) - Norwegia (
no
) - Polandia (
pl
) - Portugis (
pt
) - Rumania (
ro
) - Rusia (
ru
) - Serbia (
sr
) - Slovakia (
sk
) - Slovenia (
sl
) - Spanyol (
es
) - Swahili (
sw
) - Swedia (
sv
) - Thai (
th
) - Turki (
tr
) - Ukraina (
uk
) - Vietnam (
vi
)