รูปแบบของ Gemini

ตัวแปรของโมเดล

Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้

ตัวแปรของโมเดล อินพุต เอาต์พุต เพิ่มประสิทธิภาพสำหรับ
Gemini 2.0 Flash
gemini-2.0-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ รูปภาพ (เร็วๆ นี้) และเสียง (เร็วๆ นี้) ฟีเจอร์ ความเร็ว และการสร้างแบบมัลติโมเดลรุ่นถัดไปสำหรับงานที่มีความหลากหลาย
ตัวอย่าง Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ
Gemini 1.5 Flash
gemini-1.5-flash
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานจำนวนมากและงานที่มีระดับปัญญาต่ำ
Gemini 1.5 Pro
gemini-1.5-pro
เสียง รูปภาพ วิดีโอ และข้อความ ข้อความ งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น
การฝังข้อความ
text-embedding-004
ข้อความ ข้อความที่ฝัง การวัดความเกี่ยวข้องของสตริงข้อความ

คุณดูขีดจำกัดอัตราสำหรับแต่ละรูปแบบได้ในหน้าขีดจำกัดอัตรา

Gemini 2.0 Flash

Gemini 2.0 Flash มาพร้อมฟีเจอร์และความสามารถรุ่นถัดไปที่ปรับปรุงประสิทธิภาพให้ดียิ่งขึ้น ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว การสร้างแบบหลายโมดัล และหน้าต่างบริบทขนาด 1 ล้านโทเค็น

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-2.0-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

เสียง (เร็วๆ นี้) รูปภาพ (เร็วๆ นี้) และข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

เร็วๆ นี้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

ค้นหา

สิ่งที่ทำได้

การสร้างรูปภาพ

เร็วๆ นี้

การใช้เครื่องมือเนทีฟ

สิ่งที่ทำได้

การสร้างเสียง

เร็วๆ นี้

Multimodal Live API

เร็วๆ นี้

Versions
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-2.0-flash
  • ทำงานได้อย่างเสถียร: gemini-2.0-flash-001
การอัปเดตล่าสุด กุมภาพันธ์ 2025
Knowledge cutoff สิงหาคม 2024

เวอร์ชันตัวอย่าง Gemini 2.0 Flash-Lite

โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-2.0-flash-lite-preview-02-05
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ความสามารถของ

เอาต์พุตที่มีโครงสร้าง

สิ่งที่ทำได้

การแคช

สิ่งที่ทำไม่ได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำไม่ได้

การเรียกใช้โค้ด

สิ่งที่ทำไม่ได้

ค้นหา

สิ่งที่ทำไม่ได้

การสร้างรูปภาพ

สิ่งที่ทำไม่ได้

การใช้เครื่องมือเนทีฟ

สิ่งที่ทำไม่ได้

การสร้างเสียง

สิ่งที่ทำไม่ได้

Multimodal Live API

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-2.0-flash-lite-preview-02-05
การอัปเดตล่าสุด กุมภาพันธ์ 2025
Knowledge cutoff สิงหาคม 2024

Gemini 1.5 Flash

Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดกับงานที่หลากหลาย

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
การอัปเดตล่าสุด กันยายน 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-flash-8b
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

1,048,576

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

3,600

ความยาววิดีโอสูงสุด

1 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 9.5 ชั่วโมง

ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-flash-8b-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-flash-8b
  • เวอร์ชันเสถียร
    • gemini-1.5-flash-8b-001
การอัปเดตล่าสุด ตุลาคม 2024

Gemini 1.5 Pro

Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า

ลองใช้ใน Google AI Studio

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/gemini-1.5-pro
ประเภทข้อมูลที่รองรับ

อินพุต

เสียง รูปภาพ วิดีโอ และข้อความ

เอาต์พุต

ข้อความ

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,097,152

ขีดจํากัดโทเค็นเอาต์พุต

8,192

ข้อกำหนดเฉพาะด้านเสียง/ภาพ

จำนวนรูปภาพสูงสุดต่อพรอมต์

7,200

ความยาววิดีโอสูงสุด

2 ชั่วโมง

ความยาวเสียงสูงสุด

ประมาณ 19 ชั่วโมง

ความสามารถของ

วิธีการของระบบ

สิ่งที่ทำได้

โหมด JSON

สิ่งที่ทำได้

สคีมา JSON

สิ่งที่ทำได้

การตั้งค่าความปลอดภัยที่ปรับได้

สิ่งที่ทำได้

การแคช

สิ่งที่ทำได้

การปรับแต่ง

สิ่งที่ทำไม่ได้

การเรียกฟังก์ชัน

สิ่งที่ทำได้

การเรียกใช้โค้ด

สิ่งที่ทำได้

การสตรีมแบบ 2 ทิศทาง

สิ่งที่ทำไม่ได้

Versions
อ่านรายละเอียดเพิ่มเติมเกี่ยวกับรูปแบบเวอร์ชันโมเดล
  • ล่าสุด: gemini-1.5-pro-latest
  • เวอร์ชันล่าสุดที่เสถียร: gemini-1.5-pro
  • เวอร์ชันเสถียร
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
การอัปเดตล่าสุด กันยายน 2024

การฝังข้อความและการฝัง

การฝังข้อความ

การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย

text-embedding-004 มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่ ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB

รายละเอียดรุ่น
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น

Gemini API

models/text-embedding-004

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด เมษายน 2024

การฝัง

คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความที่ป้อน

โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ

รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/embedding-001
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความที่ฝัง

ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

2,048

ขนาดมิติข้อมูลเอาต์พุต

768

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง สิ่งที่ทำไม่ได้
การอัปเดตล่าสุด ธันวาคม 2023

AQA

คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งที่มาที่ระบุ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้

รายละเอียดรุ่น

พร็อพเพอร์ตี้ คำอธิบาย
รหัสรุ่น models/aqa
ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

ข้อความ

ภาษาที่รองรับ อังกฤษ
ขีดจํากัดโทเค็น[*]

ขีดจํากัดของโทเค็นอินพุต

7,168

ขีดจํากัดโทเค็นเอาต์พุต

1,024

Rate limits[**] คำขอ 1,500 รายการต่อนาที
การตั้งค่าความปลอดภัยที่ปรับได้และ สิ่งที่ทำได้
การอัปเดตล่าสุด ธันวาคม 2023

ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้

[*] โทเค็นจะเท่ากับอักขระประมาณ 4 ตัวสำหรับโมเดล Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ

รูปแบบชื่อเวอร์ชันโมเดล

โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้

  • ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้

    หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-latest เช่น gemini-1.0-pro-latest

  • เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ

    หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation> เช่น gemini-1.0-pro

  • เสถียร: ชี้ไปยังรุ่นที่เสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง

    หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-1.0-pro-001

  • ทดลอง: ชี้ไปยังโมเดลทดลองที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่ใช่เวอร์ชันที่ใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ช่วยให้นักพัฒนาแอปได้รับอัปเดตล่าสุดอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการสร้างสรรค์นวัตกรรมที่เกิดขึ้นที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จด้วย คุณสามารถเปลี่ยนโมเดลทดลองเป็นโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลเวอร์ชันทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต

    หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้ <model>-<generation>-<variation>-<version> เช่น gemini-exp-1121

ภาษาที่พร้อมให้บริการ

โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้

  • อาหรับ (ar)
  • เบงกอล (bn)
  • บัลแกเรีย (bg)
  • จีนตัวย่อและตัวเต็ม (zh)
  • โครเอเชีย (hr)
  • เช็ก (cs)
  • เดนมาร์ก (da)
  • ดัตช์ (nl)
  • อังกฤษ (en)
  • เอสโตเนีย (et)
  • ฟินแลนด์ (fi)
  • ฝรั่งเศส (fr)
  • เยอรมัน (de)
  • กรีก (el)
  • ฮีบรู (iw)
  • ฮินดี (hi)
  • ฮังการี (hu)
  • อินโดนีเซีย (id)
  • อิตาลี (it)
  • ญี่ปุ่น (ja)
  • เกาหลี (ko)
  • ลัตเวีย (lv)
  • ลิทัวเนีย (lt)
  • นอร์เวย์ (no)
  • โปแลนด์ (pl)
  • โปรตุเกส (pt)
  • โรมาเนีย (ro)
  • รัสเซีย (ru)
  • เซอร์เบีย (sr)
  • สโลวัก (sk)
  • สโลวีเนีย (sl)
  • สเปน (es)
  • สวาฮิลี (sw)
  • สวีเดน (sv)
  • ไทย (th)
  • ตุรกี (tr)
  • ยูเครน (uk)
  • เวียดนาม (vi)