Gemma Open Models
กลุ่มผลิตภัณฑ์โมเดลแบบเปิดที่ทันสมัยและน้ำหนักเบาซึ่งพัฒนาขึ้นจากงานวิจัยและเทคโนโลยีเดียวกับที่ใช้สร้างโมเดล Gemini
ลองใช้ Gemma 2
Gemma 2 ออกแบบมาใหม่เพื่อประสิทธิภาพที่เหนือชั้นและประสิทธิภาพที่ไม่มีใครเทียบได้ โดยเพิ่มประสิทธิภาพเพื่อให้การอนุมานรวดเร็วทันใจบนฮาร์ดแวร์หลากหลาย
5 นัด
MMLU
เกณฑ์ MMLU เป็นการทดสอบที่วัดความกว้างของความรู้และความสามารถในการแก้ปัญหาที่โมเดลภาษาขนาดใหญ่ได้รับระหว่างการฝึกล่วงหน้า
25 ภาพ
ARC-C
การเปรียบเทียบ ARC-c คือชุดข้อมูลย่อยที่มุ่งเน้นมากขึ้นของชุดข้อมูล ARC-e ซึ่งมีเฉพาะคำถามที่ตอบไม่ถูกต้องโดยอัลกอริทึมทั่วไป (แบบฐานการดึงข้อมูลและแบบคำที่พบร่วมกัน)
5 นัด
GSM8K
การทดสอบ GSM8K จะทดสอบความสามารถของโมเดลภาษาในการแก้ปัญหาคณิตศาสตร์ระดับประถมศึกษาซึ่งมักต้องใช้การหาเหตุผลหลายขั้นตอน
3-5-shot
AGIEval
การเปรียบเทียบ AGIEval จะทดสอบความฉลาดทั่วไปของโมเดลภาษาโดยใช้คำถามที่มาจากข้อสอบในชีวิตจริงซึ่งออกแบบมาเพื่อประเมินความสามารถทางปัญญาของมนุษย์
3 ช็อต, COT
BBH
การเปรียบเทียบ BBH (BIG-Bench Hard) จะมุ่งเน้นที่งานที่ถือว่าเกินความสามารถของโมเดลภาษาในปัจจุบัน เพื่อทดสอบขีดจำกัดของโมเดลในโดเมนการอนุมานและทำความเข้าใจที่หลากหลาย
3 ช็อต, F1
วาง
DROP เป็นการทดสอบการอ่านเพื่อความเข้าใจที่ต้องใช้การแยกแยะเหตุผลในย่อหน้า
5 นัด
Winogrande
การทดสอบ Winogrande จะทดสอบความสามารถของโมเดลภาษาในการแก้ปัญหาแบบเติมคำในช่องว่างที่คลุมเครือด้วยตัวเลือกแบบ 2 ทางเลือก ซึ่งต้องใช้การหาเหตุผลแบบสามัญสำนึกทั่วไป
10 ช็อต
HellaSwag
เกณฑ์ HellaSwag ท้าทายความสามารถของโมเดลภาษาในการเข้าใจและใช้เหตุผลเชิงตรรกะทั่วไปโดยการเลือกตอนจบที่สมเหตุสมผลที่สุดสำหรับเรื่องราว
4 ช็อต
MATH
MATH จะประเมินความสามารถของโมเดลภาษาในการแก้ปัญหาโจทย์คณิตศาสตร์ที่ซับซ้อน ซึ่งต้องใช้การหาเหตุผล การแก้ปัญหาแบบหลายขั้นตอน และความเข้าใจในแนวคิดทางคณิตศาสตร์
0 ช็อต
ARC-e
การเปรียบเทียบ ARC-e จะทดสอบทักษะการตอบคำถามขั้นสูงของโมเดลภาษาด้วยคำถามแบบหลายตัวเลือกเกี่ยวกับวิทยาศาสตร์ระดับประถมศึกษาที่แท้จริง
0 ช็อต
PIQA
การเปรียบเทียบ PIQA จะทดสอบความสามารถของโมเดลภาษาในการทำความเข้าใจและใช้ความรู้ทั่วไปเกี่ยวกับร่างกายโดยการตอบคำถามเกี่ยวกับการโต้ตอบทางกายภาพในชีวิตประจำวัน
0 ช็อต
SIQA
เกณฑ์ SIQA จะประเมินความเข้าใจของโมเดลภาษาเกี่ยวกับการโต้ตอบทางสังคมและสามัญสำนึกทางสังคมโดยการถามคำถามเกี่ยวกับการกระทำของผู้คนและผลกระทบทางสังคม
0 ช็อต
Boolq
การเปรียบเทียบ BoolQ จะทดสอบความสามารถของโมเดลภาษาในการตอบคำถามแบบใช่/ไม่ใช่ที่เกิดขึ้นตามปกติ ซึ่งทดสอบความสามารถของโมเดลในการทํางานอนุมานภาษาธรรมชาติในชีวิตจริง
5 นัด
TriviaQA
เกณฑ์เปรียบเทียบของ TriviaQA จะทดสอบทักษะการอ่านเพื่อความเข้าใจด้วยชุดข้อมูล 3 รายการ ได้แก่ คำถาม คำตอบ และหลักฐาน
5 นัด
NQ
การเปรียบเทียบ NQ (คำถามที่เป็นภาษาธรรมชาติ) จะทดสอบความสามารถของโมเดลภาษาในการค้นหาและทำความเข้าใจคำตอบภายในบทความ Wikipedia ทั้งหมด โดยจำลองสถานการณ์การตอบคำถามในชีวิตจริง
pass@1
HumanEval
การทดสอบประสิทธิภาพ HumanEval จะทดสอบความสามารถในการสร้างโค้ดของโมเดลภาษาโดยประเมินว่าโซลูชันของโมเดลผ่านการทดสอบหน่วยฟังก์ชันสำหรับปัญหาการเขียนโปรแกรมหรือไม่
3 ช็อต
MBPP
การทดสอบ MBPP จะทดสอบความสามารถของโมเดลภาษาในการแก้ปัญหาการเขียนโปรแกรม Python พื้นฐาน โดยมุ่งเน้นที่แนวคิดการเขียนโปรแกรมพื้นฐานและการใช้ไลบรารีมาตรฐาน
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
LLAMA 3
8B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
Gemma 1
2.5 พันล้าน
Gemma 2
2.6 พันล้าน
Mistral
7B
Gemma 1
7B
Gemma 2
9B
Gemma 2
2.7 พันล้าน
*นี่คือการเปรียบเทียบสำหรับโมเดลที่ผ่านการฝึกล่วงหน้า โปรดดูรายละเอียดเกี่ยวกับประสิทธิภาพด้วยวิธีการอื่นๆ ในรายงานทางเทคนิค
โมเดลการวิจัย
พบกับกลุ่มผลิตภัณฑ์โมเดล Gemma ที่ขยายการให้บริการ







สำรวจ Gemmaverse
ระบบนิเวศอันกว้างใหญ่ของโมเดลและเครื่องมือ Gemma ที่ชุมชนสร้างขึ้น ซึ่งพร้อมที่จะขับเคลื่อนและสร้างแรงบันดาลใจให้กับนวัตกรรมของคุณ
สร้าง
เริ่มสร้างด้วย Gemma
ทำให้โมเดลใช้งานได้
เลือกเป้าหมายการติดตั้งใช้งาน
อุปกรณ์เคลื่อนที่
ติดตั้งใช้งานในอุปกรณ์ด้วย Google AI Edge
ติดตั้งใช้งานในอุปกรณ์โดยตรงเพื่อให้ฟังก์ชันการทำงานแบบออฟไลน์ที่มีเวลาในการตอบสนองต่ำ เหมาะสําหรับแอปพลิเคชันที่ต้องมีความตอบสนองและความเป็นส่วนตัวแบบเรียลไทม์ เช่น แอปบนอุปกรณ์เคลื่อนที่ อุปกรณ์ IoT และระบบฝัง
เว็บ
ผสานรวมเข้ากับเว็บแอปพลิเคชันได้อย่างราบรื่น
เพิ่มประสิทธิภาพเว็บไซต์และเว็บเซอร์วิสด้วยความสามารถขั้นสูงของ AI ซึ่งเปิดใช้ฟีเจอร์แบบอินเทอร์แอกทีฟ เนื้อหาที่ปรับเปลี่ยนในแบบของคุณ และการทำงานอัตโนมัติที่ชาญฉลาด
ระบบคลาวด์
ปรับขนาดได้อย่างง่ายดายด้วยโครงสร้างพื้นฐานระบบคลาวด์
ใช้ประโยชน์จากความยืดหยุ่นและความสามารถในการปรับขนาดของคลาวด์เพื่อจัดการกับการใช้งานขนาดใหญ่ ภาระงานที่หนักหน่วง และแอปพลิเคชัน AI ที่ซับซ้อน