Memperkenalkan Gemini Embedding 2, model embedding multimodal pertama kami.

Batas kapasitas

Batas laju mengatur jumlah permintaan yang dapat Anda ajukan ke Gemini API dalam jangka waktu tertentu. Batasan ini membantu mempertahankan penggunaan yang adil, melindungi dari penyalahgunaan, dan membantu mempertahankan performa sistem untuk semua pengguna.

Melihat batas frekuensi aktif di AI Studio

Cara kerja batas laju

Batas kecepatan biasanya diukur di tiga dimensi:

Permintaan per menit (RPM)
Token per menit (input) (TPM)
Permintaan per hari (RPD)

Penggunaan Anda dievaluasi terhadap setiap batas, dan jika salah satu batas terlampaui, error batas frekuensi akan dipicu. Misalnya, jika batas RPM Anda adalah 20, membuat 21 permintaan dalam satu menit akan menghasilkan error, meskipun Anda belum melampaui batas TPM atau batas lainnya.

Batas frekuensi diterapkan per project, bukan per kunci API. Kuota permintaan per hari (RPD) direset pada tengah malam waktu Pasifik.

Batas bervariasi bergantung pada model spesifik yang digunakan, dan beberapa batas hanya berlaku untuk model tertentu. Misalnya, Gambar per menit (IPM) hanya dihitung untuk model yang mampu membuat gambar (Nano Banana), tetapi secara konseptual mirip dengan TPM. Model lain mungkin memiliki batas token per hari (TPD).

Batas penggunaan lebih ketat untuk model eksperimental dan pratinjau.

Tingkat penggunaan

Pembatasan kapasitas terikat dengan tingkat penggunaan project. Seiring meningkatnya penggunaan dan pembelanjaan API, Anda akan otomatis diupgrade ke tingkat yang lebih tinggi dengan batas frekuensi yang lebih tinggi.

Kualifikasi untuk Tingkat 2 dan 3 didasarkan pada total pembelanjaan kumulatif untuk layanan Google Cloud (termasuk, tetapi tidak terbatas pada, Gemini API) untuk akun penagihan yang ditautkan ke project Anda.

Tingkat penggunaan	Kualifikasi
Gratis	Pendaftaran (Akun Google)
Tingkat 1	Mengaktifkan akun penagihan
Tingkat 2	Membayar $100 ke akun penagihan, dan setidaknya 3 hari sejak pembayaran pertama yang berhasil
Tingkat 3	Membayar $1.000 ke akun penagihan, dan setidaknya 30 hari sejak pembayaran pertama yang berhasil

Meskipun memenuhi kriteria kelayakan yang dinyatakan umumnya sudah cukup untuk mendapatkan persetujuan, dalam kasus yang jarang terjadi, permintaan upgrade dapat ditolak berdasarkan faktor lain yang diidentifikasi selama proses peninjauan.

Sistem ini membantu menjaga keamanan dan integritas platform Gemini API bagi semua pengguna.

Batas kapasitas Gemini API

Batas kapasitas bergantung pada berbagai faktor (seperti tingkat kuota Anda) dan dapat dilihat di Google AI Studio. Seiring waktu, tingkat dan status akun Anda berubah, batas laju Anda akan diperbarui secara otomatis.

Melihat batas frekuensi aktif di AI Studio

Batas frekuensi yang ditentukan tidak dijamin dan kapasitas sebenarnya dapat bervariasi.

Batas kapasitas Batch API

Permintaan Batch API tunduk pada batas kapasitasnya sendiri, terpisah dari panggilan API non-batch.

Permintaan batch serentak: 100
Batas ukuran file input: 2 GB
Batas penyimpanan file: 20 GB
Token dalam antrean per model: Tabel Token dalam antrean batch mencantumkan jumlah maksimum token yang dapat dimasukkan dalam antrean untuk pemrosesan batch di semua tugas batch aktif Anda untuk model tertentu.

Tingkat 1

Model	Token yang dimasukkan dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro	5.000.000
Pratinjau Gemini 3.1 Flash-Lite	10.000.000
Pratinjau Gemini 3 Flash	3.000.000
Gemini 2.5 Pro	5.000.000
Gemini 2.5 Pro TTS	25.000
Gemini 2.5 Flash	3.000.000
Pratinjau Gemini 2.5 Flash	3.000.000
Pratinjau Gambar Gemini 2.5 Flash	3.000.000
Gemini 2.5 Flash TTS	100.000
Gemini 2.5 Flash-Lite	10.000.000
Pratinjau Gemini 2.5 Flash-Lite	10.000.000
Gemini 2.0 Flash	10.000.000
Gambar Gemini 2.0 Flash	3.000.000
Gemini 2.0 Flash-Lite	10.000.000
Model pembuatan multi-modal
Pratinjau Gambar Gemini 3.1 Flash 🍌	1.000.000
Pratinjau Gambar Gemini 3 Pro 🍌	2.000.000
Model embedding
Penyematan Gemini	500.000

Tingkat 2

Model	Token yang dimasukkan dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro	500.000.000
Pratinjau Gemini 3.1 Flash-Lite	500.000.000
Pratinjau Gemini 3.1 Flash	400.000.000
Gemini 2.5 Pro	500.000.000
Gemini 2.5 Pro TTS	100.000
Gemini 2.5 Flash	400.000.000
Pratinjau Gemini 2.5 Flash	400.000.000
Pratinjau Gambar Gemini 2.5 Flash	400.000.000
Gemini 2.5 Flash TTS	100.000
Gemini 2.5 Flash-Lite	500.000.000
Pratinjau Gemini 2.5 Flash-Lite	500.000.000
Gemini 2.0 Flash	1.000.000.000
Gambar Gemini 2.0 Flash	400.000.000
Gemini 2.0 Flash-Lite	1.000.000.000
Model pembuatan multi-modal
Pratinjau Gambar Gemini 3.1 Flash 🍌	250.000.000
Pratinjau Gambar Gemini 3 Pro 🍌	270.000.000
Model embedding
Penyematan Gemini	5.000.000

Tingkat 3

Model	Token yang dimasukkan dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro	1.000.000.000
Pratinjau Gemini 3.1 Flash-Lite	1.000.000.000
Pratinjau Gemini 3.1 Flash	1.000.000.000
Gemini 2.5 Pro	1.000.000.000
Gemini 2.5 Pro TTS	1.000.000
Gemini 2.5 Flash	1.000.000.000
Pratinjau Gemini 2.5 Flash	1.000.000.000
Pratinjau Gambar Gemini 2.5 Flash	1.000.000.000
Gemini 2.5 Flash TTS	4.000.000
Gemini 2.5 Flash-Lite	1.000.000.000
Pratinjau Gemini 2.5 Flash-Lite	1.000.000.000
Gemini 2.0 Flash	5.000.000.000
Gambar Gemini 2.0 Flash	1.000.000.000
Gemini 2.0 Flash-Lite	5.000.000.000
Model pembuatan multi-modal
Pratinjau Gambar Gemini 3.1 Flash 🍌	750.000.000
Pratinjau Gambar Gemini 3 Pro 🍌	1.000.000.000
Model embedding
Penyematan Gemini	10.000.000

Cara mengupgrade ke tingkat berikutnya

Untuk bertransisi dari Paket gratis ke paket berbayar, Anda harus menyiapkan penagihan di AI Studio terlebih dahulu.

Setelah proyek Anda memenuhi kriteria yang ditentukan, proyek tersebut akan diupgrade secara otomatis ke tingkat berikutnya. Upgrade paket dari Gratis ke Paket 1 biasanya akan langsung diterapkan, dan upgrade paket berikutnya akan diterapkan dalam waktu 10 menit. Buka halaman Project di AI Studio untuk memeriksa tingkat Anda.

Meminta peningkatan batas rasio

Setiap variasi model memiliki batas frekuensi panggilan yang terkait (permintaan per menit, RPM). Untuk mengetahui detail tentang batas frekuensi tersebut, lihat halaman Batas Frekuensi AI Studio.

Meminta peningkatan batas rasio tingkat berbayar

Kami tidak memberikan jaminan tentang peningkatan batas kecepatan, tetapi kami akan berupaya sebaik mungkin untuk meninjau permintaan Anda.