2.0 Flash
โมเดลสื่อหลายรูปแบบใหม่ล่าสุดของเราที่มีฟีเจอร์และความสามารถรุ่นถัดไป
- ป้อนเสียง รูปภาพ วิดีโอ และข้อความ แล้วรับคำตอบที่เป็นข้อความ
- สร้างโค้ด ดึงข้อมูล วิเคราะห์ไฟล์ สร้างกราฟ และอื่นๆ
- เวลาในการตอบสนองต่ำ ประสิทธิภาพที่ดีขึ้น สร้างขึ้นเพื่อมอบประสบการณ์การใช้งานที่มีประสิทธิภาพ
ตัวแปรของโมเดล
Gemini API มีรูปแบบต่างๆ ที่เพิ่มประสิทธิภาพสำหรับกรณีการใช้งานที่เฉพาะเจาะจง ภาพรวมคร่าวๆ ของตัวแปร Gemini ที่มีให้บริการมีดังนี้
ตัวแปรของโมเดล | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ รูปภาพ (เร็วๆ นี้) และเสียง (เร็วๆ นี้) | ฟีเจอร์ ความเร็ว และการสร้างแบบมัลติโมเดลรุ่นถัดไปสำหรับงานที่มีความหลากหลาย |
ตัวอย่าง Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05 |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ |
Gemini 1.5 Flash
gemini-1.5-flash |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | ประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานจำนวนมากและงานที่มีระดับปัญญาต่ำ |
Gemini 1.5 Pro
gemini-1.5-pro |
เสียง รูปภาพ วิดีโอ และข้อความ | ข้อความ | งานที่มีเหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น |
การฝังข้อความ
text-embedding-004 |
ข้อความ | ข้อความที่ฝัง | การวัดความเกี่ยวข้องของสตริงข้อความ |
คุณดูขีดจำกัดอัตราสำหรับแต่ละรูปแบบได้ในหน้าขีดจำกัดอัตรา
Gemini 2.0 Flash
Gemini 2.0 Flash มาพร้อมฟีเจอร์และความสามารถรุ่นถัดไปที่ปรับปรุงประสิทธิภาพให้ดียิ่งขึ้น ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว การสร้างแบบหลายโมดัล และหน้าต่างบริบทขนาด 1 ล้านโทเค็น
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-2.0-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต เสียง (เร็วๆ นี้) รูปภาพ (เร็วๆ นี้) และข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช เร็วๆ นี้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ ค้นหา สิ่งที่ทำได้ การสร้างรูปภาพ เร็วๆ นี้ การใช้เครื่องมือเนทีฟ สิ่งที่ทำได้ การสร้างเสียง เร็วๆ นี้ Multimodal Live API เร็วๆ นี้ |
Versions |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2025 |
Knowledge cutoff | สิงหาคม 2024 |
เวอร์ชันตัวอย่าง Gemini 2.0 Flash-Lite
โมเดล Gemini 2.0 Flash ที่เพิ่มประสิทธิภาพเพื่อประหยัดต้นทุนและเวลาในการตอบสนองต่ำ
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-2.0-flash-lite-preview-02-05 |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ความสามารถของ |
เอาต์พุตที่มีโครงสร้าง สิ่งที่ทำได้ การแคช สิ่งที่ทำไม่ได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำไม่ได้ การเรียกใช้โค้ด สิ่งที่ทำไม่ได้ ค้นหา สิ่งที่ทำไม่ได้ การสร้างรูปภาพ สิ่งที่ทำไม่ได้ การใช้เครื่องมือเนทีฟ สิ่งที่ทำไม่ได้ การสร้างเสียง สิ่งที่ทำไม่ได้ Multimodal Live API สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กุมภาพันธ์ 2025 |
Knowledge cutoff | สิงหาคม 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash เป็นโมเดลสื่อหลากรูปแบบที่รวดเร็วและอเนกประสงค์สำหรับการปรับขนาดกับงานที่หลากหลาย
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B เป็นโมเดลขนาดเล็กที่ออกแบบมาสำหรับงานที่ต้องใช้ปัญญาน้อย
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-flash-8b |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 1,048,576 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 3,600 ความยาววิดีโอสูงสุด 1 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 9.5 ชั่วโมง |
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | ตุลาคม 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro เป็นโมเดลสื่อหลากรูปแบบขนาดกลางที่ได้รับการเพิ่มประสิทธิภาพสำหรับงานการให้เหตุผลที่หลากหลาย 1.5 Pro สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันได้ ซึ่งรวมถึงวิดีโอความยาว 2 ชั่วโมง เสียงความยาว 19 ชั่วโมง ฐานโค้ดที่มีโค้ด 60,000 บรรทัด หรือข้อความ 2,000 หน้า
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/gemini-1.5-pro |
ประเภทข้อมูลที่รองรับ |
อินพุต เสียง รูปภาพ วิดีโอ และข้อความ เอาต์พุต ข้อความ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,097,152 ขีดจํากัดโทเค็นเอาต์พุต 8,192 |
ข้อกำหนดเฉพาะด้านเสียง/ภาพ |
จำนวนรูปภาพสูงสุดต่อพรอมต์ 7,200 ความยาววิดีโอสูงสุด 2 ชั่วโมง ความยาวเสียงสูงสุด ประมาณ 19 ชั่วโมง |
ความสามารถของ |
วิธีการของระบบ สิ่งที่ทำได้ โหมด JSON สิ่งที่ทำได้ สคีมา JSON สิ่งที่ทำได้ การตั้งค่าความปลอดภัยที่ปรับได้ สิ่งที่ทำได้ การแคช สิ่งที่ทำได้ การปรับแต่ง สิ่งที่ทำไม่ได้ การเรียกฟังก์ชัน สิ่งที่ทำได้ การเรียกใช้โค้ด สิ่งที่ทำได้ การสตรีมแบบ 2 ทิศทาง สิ่งที่ทำไม่ได้ |
Versions |
|
การอัปเดตล่าสุด | กันยายน 2024 |
การฝังข้อความและการฝัง
การฝังข้อความ
การฝังข้อความใช้วัดความเกี่ยวข้องของสตริง และใช้ในแอปพลิเคชัน AI หลายรายการอย่างแพร่หลาย
text-embedding-004
มีประสิทธิภาพการดึงข้อมูลดีขึ้นและมีประสิทธิภาพมากกว่าโมเดลที่มีอยู่
ด้วยมิติข้อมูลที่เปรียบเทียบได้ ในเกณฑ์มาตรฐานการฝัง MTEB
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
Gemini API
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | เมษายน 2024 |
การฝัง
คุณสามารถใช้โมเดลการฝังเพื่อสร้างการฝังข้อความสําหรับข้อความที่ป้อน
โมเดลการฝังได้รับการเพิ่มประสิทธิภาพเพื่อสร้างการฝังที่มีมิติข้อมูล 768 รายการสําหรับข้อความที่มีโทเค็นได้สูงสุด 2,048 รายการ
รายละเอียดการฝังโมเดล
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น |
models/embedding-001
|
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความที่ฝัง |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 2,048 ขนาดมิติข้อมูลเอาต์พุต 768 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้ซึ่ง | สิ่งที่ทำไม่ได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
AQA
คุณสามารถใช้โมเดล AQA เพื่อทํางานที่เกี่ยวข้องกับการตอบคําถามพร้อมระบุแหล่งที่มา (AQA) ในเอกสาร เอกสารชุด หรือชุดข้อความ โมเดล AQA จะแสดงคำตอบสำหรับคำถามที่อิงตามแหล่งที่มาที่ระบุ พร้อมกับประมาณความน่าจะเป็นที่ตอบได้
รายละเอียดรุ่น
พร็อพเพอร์ตี้ | คำอธิบาย |
---|---|
รหัสรุ่น | models/aqa |
ประเภทข้อมูลที่รองรับ |
อินพุต ข้อความ เอาต์พุต ข้อความ |
ภาษาที่รองรับ | อังกฤษ |
[*] | ขีดจํากัดโทเค็น
ขีดจํากัดของโทเค็นอินพุต 7,168 ขีดจํากัดโทเค็นเอาต์พุต 1,024 |
[**] | Rate limitsคำขอ 1,500 รายการต่อนาที |
การตั้งค่าความปลอดภัยที่ปรับได้และ | สิ่งที่ทำได้ |
การอัปเดตล่าสุด | ธันวาคม 2023 |
ดูตัวอย่างเพื่อสำรวจความสามารถของรูปแบบเหล่านี้
[*] โทเค็นจะเท่ากับอักขระประมาณ 4 ตัวสำหรับโมเดล Gemini โทเค็น 100 รายการจะเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ
รูปแบบชื่อเวอร์ชันโมเดล
โมเดล Gemini มีให้บริการในเวอร์ชันตัวอย่างหรือเสถียร ในโค้ด คุณสามารถใช้รูปแบบชื่อโมเดลรูปแบบใดรูปแบบหนึ่งต่อไปนี้เพื่อระบุโมเดลและเวอร์ชันที่ต้องการใช้
ล่าสุด: ชี้ไปยังเวอร์ชันล่าสุดของโมเดลสำหรับรุ่นและตัวแปรที่ระบุ โมเดลพื้นฐานจะอัปเดตเป็นประจำและอาจเป็นเวอร์ชันตัวอย่าง เฉพาะแอปและโปรโตไทป์การทดสอบเพื่อสำรวจเท่านั้นที่ควรใช้อีเมลแทนนี้
หากต้องการระบุเวอร์ชันล่าสุด ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-latest
เช่นgemini-1.0-pro-latest
เสถียรล่าสุด: ชี้ไปยังเวอร์ชันเสถียรล่าสุดที่เผยแพร่สำหรับรุ่นและรูปแบบที่ระบุ
หากต้องการระบุเวอร์ชันล่าสุดที่มีความเสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>
เช่นgemini-1.0-pro
เสถียร: ชี้ไปยังรุ่นที่เสถียรที่เฉพาะเจาะจง โมเดลที่เสถียรจะไม่เปลี่ยนแปลง แอปเวอร์ชันที่ใช้งานจริงส่วนใหญ่ควรใช้รูปแบบที่เสถียรที่เฉพาะเจาะจง
หากต้องการระบุเวอร์ชันที่เสถียร ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-1.0-pro-001
ทดลอง: ชี้ไปยังโมเดลทดลองที่มีให้ใช้งานในเวอร์ชันตัวอย่าง ตามที่ระบุไว้ในข้อกําหนด ซึ่งหมายความว่าไม่ใช่เวอร์ชันที่ใช้งานจริง เราเผยแพร่โมเดลเวอร์ชันทดลองเพื่อรวบรวมความคิดเห็น ช่วยให้นักพัฒนาแอปได้รับอัปเดตล่าสุดอย่างรวดเร็ว และเน้นย้ำถึงความเร็วในการสร้างสรรค์นวัตกรรมที่เกิดขึ้นที่ Google สิ่งที่เราได้เรียนรู้จากการเปิดตัวเวอร์ชันทดลองจะช่วยให้เราเปิดตัวโมเดลในวงกว้างได้อย่างประสบความสำเร็จด้วย คุณสามารถเปลี่ยนโมเดลทดลองเป็นโมเดลอื่นได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า เราไม่รับประกันว่าโมเดลเวอร์ชันทดลองจะกลายเป็นโมเดลที่เสถียรในอนาคต
หากต้องการระบุเวอร์ชันทดลอง ให้ใช้รูปแบบต่อไปนี้
<model>-<generation>-<variation>-<version>
เช่นgemini-exp-1121
ภาษาที่พร้อมให้บริการ
โมเดล Gemini ได้รับการฝึกให้ทำงานร่วมกับภาษาต่อไปนี้
- อาหรับ (
ar
) - เบงกอล (
bn
) - บัลแกเรีย (
bg
) - จีนตัวย่อและตัวเต็ม (
zh
) - โครเอเชีย (
hr
) - เช็ก (
cs
) - เดนมาร์ก (
da
) - ดัตช์ (
nl
) - อังกฤษ (
en
) - เอสโตเนีย (
et
) - ฟินแลนด์ (
fi
) - ฝรั่งเศส (
fr
) - เยอรมัน (
de
) - กรีก (
el
) - ฮีบรู (
iw
) - ฮินดี (
hi
) - ฮังการี (
hu
) - อินโดนีเซีย (
id
) - อิตาลี (
it
) - ญี่ปุ่น (
ja
) - เกาหลี (
ko
) - ลัตเวีย (
lv
) - ลิทัวเนีย (
lt
) - นอร์เวย์ (
no
) - โปแลนด์ (
pl
) - โปรตุเกส (
pt
) - โรมาเนีย (
ro
) - รัสเซีย (
ru
) - เซอร์เบีย (
sr
) - สโลวัก (
sk
) - สโลวีเนีย (
sl
) - สเปน (
es
) - สวาฮิลี (
sw
) - สวีเดน (
sv
) - ไทย (
th
) - ตุรกี (
tr
) - ยูเครน (
uk
) - เวียดนาม (
vi
)