การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราการใช้งานที่ใช้งานอยู่ใน AI Studio
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
 - โทเค็นต่อนาที (อินพุต) (TPM)
 - คำขอต่อวัน (RPD)
 
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API
โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างใช้ได้กับบางโมเดลเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
| ระดับ | คุณสมบัติ | 
|---|---|
| ฟรี | ผู้ใช้ในประเทศที่มีสิทธิ์ | 
| ระดับ 1 | บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ | 
| ระดับ 2 | การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ | 
| ระดับ 3 | การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ | 
เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตรา API มาตรฐาน
ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด
รุ่นฟรี
| รุ่น | RPM | TPM | RPD | 
|---|---|---|---|
| โมเดลข้อความออก | |||
| Gemini 2.5 Pro | 2 | 125,000 | 50 | 
| Gemini 2.5 Flash | 10 | 250,000 | 250 | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 10 | 250,000 | 250 | 
| Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 | 
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 15 | 250,000 | 1,000 | 
| Gemini 2.0 Flash | 15 | 1,000,000 | 200 | 
| Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 | 
| Live API | |||
| Gemini 2.5 Flash Live | * | 1,000,000 | * | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ | * | 500,000 | * | 
| Gemini 2.0 Flash Live | * | 1,000,000 | * | 
| โมเดลการสร้างแบบหลายโมดัล | |||
| TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3 | 10,000 | 15 | 
| การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 10 | 200,000 | 100 | 
| รุ่นอื่นๆ | |||
| Gemma 3 และ 3n | 30 | 15,000 | 14,400 | 
| การฝัง Gemini | 100 | 30,000 | 1,000 | 
| Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) | 10 | 250,000 | 250 | 
| โมเดลที่เลิกใช้งาน | |||
| Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 15 | 250,000 | 50 | 
| Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 15 | 250,000 | 50 | 
ระดับ 1
| รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม | 
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 | 
| Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 1,000,000 | 10,000 | 3,000,000 | 
| Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 | 
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 4,000 | 4,000,000 | * | 10,000,000 | 
| Gemini 2.0 Flash | 2,000 | 4,000,000 | * | 10,000,000 | 
| Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 | 
| Live API | ||||
| Gemini 2.5 Flash Live | 50 เซสชัน | 4,000,000 | * | * | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ | * | 1,000,000 | * | * | 
| Gemini 2.0 Flash Live | 50 เซสชัน | 4,000,000 | * | * | 
| โมเดลการสร้างแบบหลายโมดัล | ||||
| TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 10 | 10,000 | 100 | * | 
| TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 10 | 10,000 | 50 | * | 
| รูปภาพ Gemini 2.5 Flash | 500 | 500,000 | 2,000 | * | 
| การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 1,000,000 | 10,000 | * | 
| Imagen 4 Standard/Fast | 10 | * | 70 | * | 
| Imagen 4 Ultra | 5 | * | 30 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 2 | * | 10 | * | 
| Veo 3.1 Fast | 2 | * | 10 | * | 
| Veo 3 | 2 | * | 10 | * | 
| Veo 3 Fast | 2 | * | 10 | * | 
| Veo 2 | 2 | * | 50 | * | 
| รุ่นอื่นๆ | ||||
| Gemma 3 และ 3n | 30 | 15,000 | 14,400 | * | 
| การฝัง Gemini | 3,000 | 1,000,000 | * | * | 
| Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) | 300 | 1,000,000 | 10,000 | * | 
| Gemini 2.5 Computer Use Preview | 150 | 2,000,000 | 10,000 | * | 
| โมเดลที่เลิกใช้งาน | ||||
| Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | * | * | 
| Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | * | * | 
| Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 | * | * | 
ระดับ 2
| รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม | 
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 | 
| Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 2,000 | 3,000,000 | 100,000 | 400,000,000 | 
| Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 | 
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000 | 10,000,000 | * | 500,000,000 | 
| Gemini 2.0 Flash | 10,000 | 10,000,000 | * | 1,000,000,000 | 
| Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | * | 1,000,000,000 | 
| Live API | ||||
| Gemini 2.5 Flash Live | 1,000 เซสชัน | 10,000,000 | * | * | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ | * | 10,000,000 | * | * | 
| Gemini 2.0 Flash Live | 1,000 เซสชัน | 10,000,000 | * | * | 
| โมเดลการสร้างแบบหลายโมดัล | ||||
| TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 100,000 | 10,000 | * | 
| TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 100 | 25,000 | 1,000 | * | 
| รูปภาพ Gemini 2.5 Flash | 2,000 | 1,500,000 | 50,000 | * | 
| การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 2,000 | 3,000,000 | 100,000 | * | 
| Imagen 4 Standard/Fast | 15 | * | 1000 | * | 
| Imagen 4 Ultra | 10 | * | 400 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 4 | * | 50 | * | 
| Veo 3.1 Fast | 4 | * | 50 | * | 
| Veo 3 | 4 | * | 50 | * | 
| Veo 3 Fast | 4 | * | 50 | * | 
| Veo 2 | 2 | * | 50 | * | 
| รุ่นอื่นๆ | ||||
| Gemma 3 และ 3n | 30 | 15,000 | 14,400 | * | 
| การฝัง Gemini | 5,000 | 5,000,000 | * | * | 
| Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) | 400 | 3,000,000 | 100,000 | * | 
| Gemini 2.5 Computer Use Preview | 1,000 | 5,000,000 | 50,000 | * | 
| โมเดลที่เลิกใช้งาน | ||||
| Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | * | * | 
| Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | * | * | 
| Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 | * | * | 
ระดับ 3
| รุ่น | RPM | TPM | RPD | โทเค็นที่จัดคิวแบบกลุ่ม | 
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 2.5 Pro | 2,000 | 8,000,000 | * | 1,000,000,000 | 
| Gemini 2.5 Flash | 10,000 | 8,000,000 | * | 1,000,000,000 | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 10,000 | 8,000,000 | * | 1,000,000,000 | 
| Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | * | 1,000,000,000 | 
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 30,000 | 30,000,000 | * | 1,000,000,000 | 
| Gemini 2.0 Flash | 30,000 | 30,000,000 | * | 5,000,000,000 | 
| Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | * | 5,000,000,000 | 
| Live API | ||||
| Gemini 2.5 Flash Live | 1,000 เซสชัน | 10,000,000 | * | * | 
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ | * | 10,000,000 | * | * | 
| Gemini 2.0 Flash Live | 1,000 เซสชัน | 10,000,000 | * | * | 
| โมเดลการสร้างแบบหลายโมดัล | ||||
| TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000 | 1,000,000 | * | * | 
| TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) | 100 | 1,000,000 | * | * | 
| รูปภาพ Gemini 2.5 Flash | 5,000 | 5,000,000 | * | * | 
| การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) | 5,000 | 5,000,000 | * | * | 
| Imagen 4 Standard/Fast | 20 | * | 15,000 | * | 
| Imagen 4 Ultra | 15 | * | 5,000 | * | 
| Imagen 3 | 20 | * | * | * | 
| Veo 3.1 | 10 | * | 500 | * | 
| Veo 3.1 Fast | 10 | * | 500 | * | 
| Veo 3 | 10 | * | 500 | * | 
| Veo 3 Fast | 10 | * | 500 | * | 
| Veo 2 | 2 | * | 50 | * | 
| รุ่นอื่นๆ | ||||
| Gemma 3 และ 3n | 30 | 15,000 | 14,400 | * | 
| การฝัง Gemini | 10,000 | 10,000,000 | * | * | 
| Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) | 600 | 8,000,000 | * | *1,000,000,000* | 
| Gemini 2.5 Computer Use Preview | 2,000 | 8,000,000 | * | * | 
| โมเดลที่เลิกใช้งาน | ||||
| Gemini 1.5 Flash (เลิกใช้งานแล้ว) | 2,000 | 4,000,000 | * | * | 
| Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) | 4,000 | 4,000,000 | * | * | 
| Gemini 1.5 Pro (เลิกใช้งานแล้ว) | 1,000 | 4,000,000 | * | * | 
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราของ Batch API
คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
 - ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
 - ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
 - โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบกลุ่มในตาราง ขีดจํากัดอัตราจะแสดงจํานวนโทเค็นสูงสุดที่จัดคิวได้ สําหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสําหรับโมเดลที่กําหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน
 
วิธีอัปเกรดเป็นระดับถัดไป
Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน
เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้
- ไปที่หน้าคีย์ API ใน AI Studio
 - ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะในโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์สำหรับระดับถัดไป
 
หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดของอัตราการใช้งานดังกล่าวได้ที่โมเดล Gemini
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ