2.5 Pro
النموذج الأكثر تطوّرًا لدينا، يتميّز بأعلى دقة في الرد وأداء متطوّر
- إدخال الصوت والصور والفيديوهات والنصوص والحصول على ردود نصية
- حلّ المشاكل الصعبة وتحليل قواعد البيانات الكبيرة وغير ذلك
- الأفضل للترميز المعقّد والاستدلال والفهم المتعدّد الوسائط
خيارات النموذج
توفّر واجهة برمجة التطبيقات Gemini نماذج مختلفة محسَّنة لحالات استخدام محدّدة. في ما يلي نظرة عامة موجزة على إصدارات Gemini المتاحة:
صيغة النموذج | المدخلات | الناتج | محسَّن لـ |
---|---|---|---|
Gemini 2.5 Pro
gemini-2.5-pro |
الصوت والصور والفيديوهات والنصوص وملفات PDF | نص | قدرات محسّنة على التفكير والاستدلال، وفهم متعدد الوسائط، ومهارات ترميز متقدّمة، وغير ذلك |
Gemini 2.5 Flash
gemini-2.5-flash |
الصوت والصور والفيديوهات والنصوص | نص | التفكير التكيّفي والفعالية من حيث التكلفة |
معاينة Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17 |
النصوص والصور والفيديوهات والملفات الصوتية | نص | النموذج الأكثر فعالية من حيث التكلفة والذي يتيح معدل نقل بيانات عاليًا |
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog |
الصوت والفيديوهات والنصوص | النص والصوت، بالتناوب | مخرجات صوتية عالية الجودة وطبيعية للمحادثات، مع أو بدون التفكير |
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts |
نص | الصوت | إنشاء صوت من نص مع تأخير منخفض وقابل للتحكّم فيه، وبصوت متحدث واحد أو عدة متحدثين |
إصدار تجريبي من ميزة "تحويل النص إلى كلام" في Gemini 2.5 Pro
gemini-2.5-pro-preview-tts |
نص | الصوت | إنشاء صوت من نص مع تأخير منخفض وقابل للتحكّم فيه، وبصوت متحدث واحد أو عدة متحدثين |
Gemini 2.0 Flash
gemini-2.0-flash |
الصوت والصور والفيديوهات والنصوص | نص | ميزات الجيل التالي والسرعة والبث في الوقت الفعلي |
معاينة ميزة إنشاء الصور في Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation |
الصوت والصور والفيديوهات والنصوص | النصوص والصور | إنشاء الصور وتعديلها عبر المحادثة |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
الصوت والصور والفيديوهات والنصوص | نص | الفعالية من حيث التكلفة ووقت الاستجابة المنخفض |
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | نص | أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
الصوت والصور والفيديوهات والنصوص | نص | مهام ذات حجم كبير وذكاء اصطناعي أقل |
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | نص | مهام الاستدلال المعقّدة التي تتطلّب ذكاءً أكبر |
Gemini Embedding
gemini-embedding-exp |
نص | تضمينات النص | قياس مدى الصلة بين السلاسل النصية |
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06 |
نص | الصور | أحدث نموذج لإنشاء الصور |
Imagen 3
imagen-3.0-generate-002 |
نص | الصور | نموذج إنشاء صور عالية الجودة |
Veo 2
veo-2.0-generate-001 |
النصوص والصور | فيديو | إنشاء فيديوهات عالية الجودة |
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview |
الصوت والفيديو والنص | النص والصوت | تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
الصوت والفيديو والنص | النص والصوت | تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض |
يمكنك الاطّلاع على حدود المعدّل لكل نموذج في صفحة حدود المعدّل.
Gemini 2.5 Pro
Gemini 2.5 Pro هو نموذجنا الأكثر تطورًا، وهو قادر على الاستدلال بشأن المسائل المعقدة في الترميز والرياضيات والعلوم والتكنولوجيا والهندسة والرياضيات (STEM)، بالإضافة إلى تحليل مجموعات البيانات وقواعد الرموز البرمجية والمستندات الكبيرة باستخدام السياق الطويل.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | gemini-2.5-pro |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديو والنص وملفات PDF الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 65,536 |
إمكانات |
النتائج المنظَّمة متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح تحديد المصادر في "بحث Google" متاح إنشاء الصور غير متاح إنشاء الصوت غير متاح Live API غير متاح التفكير متاح |
إصدارات |
|
آخر تعديل | يونيو 2025 |
تاريخ آخر تحديث للبيانات | يناير 2025 |
Gemini 2.5 Flash
هذا النموذج هو الأفضل من حيث السعر والأداء، وهو يقدّم إمكانات شاملة. 2.5 Flash هو الخيار الأفضل للمهام التي تتطلّب التفكير ومعالجة البيانات على نطاق واسع، والمهام التي تتطلّب وقت استجابة منخفضًا، والمهام التي تتطلّب كميات كبيرة من البيانات، وحالات الاستخدام التي تتطلّب وكيلًا.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.5-flash |
أنواع البيانات المتوافقة |
المدخلات النصوص والصور والفيديوهات والمقاطع الصوتية الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 65,536 |
إمكانات |
إنشاء الصوت غير متاح التخزين المؤقت متاح تنفيذ الرمز متاح استدعاء الدوال متاح إنشاء الصور غير متاح تحديد المصادر في "بحث Google" متاح النتائج المنظَّمة متاح التفكير متاح التعديل غير متاح |
إصدارات |
|
آخر تعديل | يونيو 2025 |
تاريخ آخر تحديث للبيانات | يناير 2025 |
معاينة Gemini 2.5 Flash-Lite
نموذج Gemini 2.5 Flash محسّن لتحقيق فعالية التكلفة وتقليل وقت الاستجابة.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.5-flash-lite-preview-06-17 |
أنواع البيانات المتوافقة |
المدخلات النصوص والصور والفيديوهات والمقاطع الصوتية الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,000,000 الحد الأقصى لعدد الرموز المميزة في المخرجات 64,000 |
إمكانات |
النتائج المنظَّمة متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح سياق عنوان URL متاح تحديد المصادر في "بحث Google" متاح إنشاء الصور غير متاح إنشاء الصوت غير متاح Live API غير متاح التفكير متاح |
إصدارات |
|
آخر تعديل | يونيو 2025 |
تاريخ آخر تحديث للبيانات | يناير 2025 |
ميزة إنشاء الصوت مضمَّنة في 2.5 Flash من Gemini
نماذج الحوار الصوتي الأصلية، مع التفكير وبدونه، متاحة من خلال Live API. تقدّم هذه النماذج تجارب محادثة تفاعلية وغير منظَّمة، مع إمكانية تحديد الأسلوب والتحكّم في المحادثة.
تجربة الصوت الأصلي في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.5-flash-preview-native-audio-dialog &models/gemini-2.5-flash-exp-native-audio-thinking-dialog |
أنواع البيانات المتوافقة |
المدخلات الصوت والفيديو والنص الناتج الصوت والنص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 128,000 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,000 |
إمكانات |
إنشاء الصوت متاح التخزين المؤقت غير متاح تنفيذ الرمز غير متاح استدعاء الدوال متاح إنشاء الصور غير متاح تحديد المصادر في "بحث Google" متاح النتائج المنظَّمة غير متاح التفكير متاح التعديل غير متاح |
إصدارات |
|
آخر تعديل | مايو 2025 |
تاريخ آخر تحديث للبيانات | يناير 2025 |
معاينة ميزة "تحويل النص إلى كلام" في Gemini 2.5 Flash
Gemini 2.5 Flash Preview TTS هو نموذج تحويل النص إلى كلام فعال من حيث التكلفة والأداء، ويوفّر مستوى عاليًا من التحكّم والشفافية في مهام سير العمل المنظَّمة، مثل إنشاء ملفات بودكاست وكتب صوتية وتقديم الدعم للعملاء وغير ذلك. تكون حدود الطلبات في Gemini 2.5 Flash أكثر تقييدًا لأنّه نموذج تجريبي/إصدار حصري.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.5-flash-preview-tts |
أنواع البيانات المتوافقة |
المدخلات نص الناتج الصوت |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 8,000 الحد الأقصى لعدد الرموز المميزة في المخرجات 16,000 |
إمكانات |
النتائج المنظَّمة غير متاح التخزين المؤقت غير متاح التعديل غير متاح استدعاء الدوال غير متاح تنفيذ الرمز غير متاح بحث غير متاح إنشاء الصوت متاح Live API غير متاح التفكير غير متاح |
إصدارات |
|
آخر تعديل | مايو 2025 |
معاينة ميزة "تحويل النص إلى كلام" في Gemini 2.5 Pro
Gemini 2.5 Pro Preview TTS هو نموذجنا الأكثر فعالية لتحويل النص إلى كلام، ويوفّر مستوى عاليًا من التحكّم والشفافية في مهام سير العمل المنظَّمة، مثل إنشاء حلقات البودكاست والكتب الصوتية ودعم العملاء وغير ذلك. تكون حدود طلبات Gemini 2.5 Pro أكثر تقييدًا لأنّه نموذج تجريبي / نموذج معاينة.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.5-pro-preview-tts |
أنواع البيانات المتوافقة |
المدخلات نص الناتج الصوت |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 8,000 الحد الأقصى لعدد الرموز المميزة في المخرجات 16,000 |
إمكانات |
النتائج المنظَّمة غير متاح التخزين المؤقت غير متاح التعديل غير متاح استدعاء الدوال غير متاح تنفيذ الرمز غير متاح بحث غير متاح إنشاء الصوت متاح Live API غير متاح التفكير غير متاح |
إصدارات |
|
آخر تعديل | مايو 2025 |
Gemini 2.0 Flash
يوفّر Gemini 2.0 Flash ميزات من الجيل التالي وقدرات محسّنة، بما في ذلك سرعة فائقة، وإمكانية استخدام الأدوات الأصلية، وقدرة استيعاب مليون رمز مميّز.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.0-flash |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
إمكانات |
النتائج المنظَّمة متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح بحث متاح إنشاء الصور غير متاح إنشاء الصوت غير متاح Live API متاح التفكير تجريبي |
إصدارات |
|
آخر تعديل | فبراير 2025 |
تاريخ آخر تحديث للبيانات | أغسطس 2024 |
إنشاء الصور باستخدام الإصدار التجريبي من 2.0 Flash في Gemini
توفّر ميزة "إنشاء الصور في الإصدار التجريبي من Gemini 2.0 Flash" ميزات محسّنة لإنشاء الصور، بما في ذلك إنشاء الصور وتعديلها بشكل حواري.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.0-flash-preview-image-generation |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج النصوص والصور |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 32,000 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
إمكانات |
النتائج المنظَّمة متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال غير متاح تنفيذ الرمز غير متاح بحث غير متاح إنشاء الصور متاح إنشاء الصوت غير متاح Live API غير متاح التفكير غير متاح |
إصدارات |
لا تتوفّر حاليًا ميزة إنشاء الصور باستخدام gemini-2.0-flash-preview في عدد من البلدان في أوروبا والشرق الأوسط وأفريقيا |
آخر تعديل | مايو 2025 |
تاريخ آخر تحديث للبيانات | أغسطس 2024 |
Gemini 2.0 Flash-Lite
نموذج Gemini 2.0 Flash محسّن من أجل الكفاءة من حيث التكلفة ووقت الاستجابة المنخفض.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.0-flash-lite |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
إمكانات |
النتائج المنظَّمة متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز غير متاح بحث غير متاح إنشاء الصور غير متاح إنشاء الصوت غير متاح Live API غير متاح |
إصدارات |
|
آخر تعديل | فبراير 2025 |
تاريخ آخر تحديث للبيانات | أغسطس 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط ومتعدد الاستخدامات لأداء مجموعة متنوعة من المهام بكفاءة.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
مواصفات الصوت والفيديو |
الحدّ الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لطول الفيديو ساعة واحدة الحد الأقصى لطول الصوت حوالي 9.5 ساعات |
إمكانات |
تعليمات النظام متاح وضع JSON متاح مخطط JSON متاح إعدادات الأمان القابلة للتعديل متاح التخزين المؤقت متاح التعديل متاح استدعاء الدوال متاح تنفيذ الرمز متاح Live API غير متاح |
إصدارات |
|
آخر تعديل | سبتمبر 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B هو نموذج صغير مصمّم للمهام التي تتطلّب ذكاءً اصطناعيًا أقل.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-1.5-flash-8b |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
مواصفات الصوت والفيديو |
الحدّ الأقصى لعدد الصور لكل طلب 3,600 الحدّ الأقصى لطول الفيديو ساعة واحدة الحد الأقصى لطول الصوت حوالي 9.5 ساعات |
إمكانات |
تعليمات النظام متاح وضع JSON متاح مخطط JSON متاح إعدادات الأمان القابلة للتعديل متاح التخزين المؤقت متاح التعديل متاح استدعاء الدوال متاح تنفيذ الرمز متاح Live API غير متاح |
إصدارات |
|
آخر تعديل | أكتوبر 2024 |
Gemini 1.5 Pro
جرِّب الإصدار التجريبي من Gemini 2.5 Pro، وهو نموذج Gemini الأكثر تطورًا حتى الآن.
Gemini 1.5 Pro هو نموذج متعدّد الوسائط متوسط الحجم ومحسَّن لأداء مجموعة كبيرة من مهام الاستدلال. يمكن لنموذج 1.5 Pro معالجة كميات كبيرة من البيانات في آنٍ واحد، بما في ذلك فيديوهات مدتها ساعتان أو مقاطع صوتية مدتها 19 ساعة أو قواعد رموز برمجية تضم 60,000 سطر من الرموز البرمجية أو نصوص تصل إلى 2,000 صفحة.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
المدخلات الصوت والصور والفيديوهات والنصوص الناتج نص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 2,097,152 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
مواصفات الصوت والفيديو |
الحدّ الأقصى لعدد الصور لكل طلب 7,200 الحدّ الأقصى لطول الفيديو ساعتان الحد الأقصى لطول الصوت حوالي 19 ساعة |
إمكانات |
تعليمات النظام متاح وضع JSON متاح مخطط JSON متاح إعدادات الأمان القابلة للتعديل متاح التخزين المؤقت متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح Live API غير متاح |
إصدارات |
|
آخر تعديل | سبتمبر 2024 |
Imagen 4
Imagen 4 هو أحدث نموذج لإنشاء الصور، وهو قادر على إنشاء صور غنية بالتفاصيل والإضاءة، كما أنّه يقدّم أداءً أفضل بكثير في عرض النصوص، ويوفّر دقة أعلى من النماذج السابقة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص الناتج الصور |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 480 رمزًا مميزًا (نص) الصور الناتجة 1 (فائق) |
آخر تعديل | يونيو 2025 |
Imagen 3
Imagen 3 هو نموذج تحويل النص إلى صور الأكثر تطورًا لدينا، وهو قادر على إنشاء صور بأدق التفاصيل وأكثرها واقعية، وبإضاءة أفضل، وبعدد أقل من التشويشات مقارنةً بنماذجنا السابقة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص الناتج الصور |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة لا ينطبق الصور الناتجة ما يصل إلى 4 |
آخر تعديل | فبراير 2025 |
Veo 2
Veo 2 هو نموذجنا العالي الجودة لتحويل النصوص والصور إلى فيديوهات، وهو قادر على إنشاء فيديوهات مفصّلة، مع مراعاة الدقة الفنية في طلباتك.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص وصورة الناتج فيديو |
الحدود |
إدخال النص لا ينطبق إدخال الصورة أي درجة دقة ونسبة عرض إلى ارتفاع للصورة بحجم ملف يصل إلى 20 ميغابايت فيديو الإخراج ما يصل إلى 2 |
آخر تعديل | أبريل 2025 |
Gemini 2.5 Flash Live
يعمل نموذج Gemini 2.5 Flash Live مع Live API لتفعيل تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض مع Gemini. يمكن للنموذج معالجة النصوص والملفات الصوتية والفيديوهات، ويمكنه تقديم مخرجات نصية وصوتية.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-live-2.5-flash-preview |
أنواع البيانات المتوافقة |
المدخلات الصوت والفيديو والنص الناتج النص والصوت |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
إمكانات |
النتائج المنظَّمة متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح بحث متاح إنشاء الصور غير متاح إنشاء الصوت متاح التفكير غير متاح |
إصدارات |
|
آخر تعديل | يونيو 2025 |
تاريخ آخر تحديث للبيانات | يناير 2025 |
Gemini 2.0 Flash Live
يعمل نموذج Gemini 2.0 Flash Live مع Live API لتفعيل تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض مع Gemini. يمكن للنموذج معالجة النصوص والملفات الصوتية والفيديوهات، ويمكنه تقديم مخرجات نصية وصوتية.
تجربة الأداة في Google AI Studio
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/gemini-2.0-flash-live-001 |
أنواع البيانات المتوافقة |
المدخلات الصوت والفيديو والنص الناتج النص والصوت |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 1,048,576 الحد الأقصى لعدد الرموز المميزة في المخرجات 8,192 |
إمكانات |
النتائج المنظَّمة متاح التعديل غير متاح استدعاء الدوال متاح تنفيذ الرمز متاح بحث متاح إنشاء الصور غير متاح إنشاء الصوت متاح التفكير غير متاح |
إصدارات |
|
آخر تعديل | أبريل 2025 |
تاريخ آخر تحديث للبيانات | أغسطس 2024 |
تضمين Gemini (ميزة تجريبية)
يحقّق نموذج Gemini embedding
أداءً متفوّقًا
في العديد من الجوانب الرئيسية، بما في ذلك الرمز البرمجي واللغات المتعددة والاسترجاع.
تكون حدود معدّل الطلبات في Gemini Embedding أكثر صرامة لأنّه نموذج تجريبي.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 8,192 حجم سمة الإخراج Elastic، تتوافق مع: 3072 أو 1536 أو 768 |
آخر تعديل | مارس 2025 |
تضمين النص والتضمين
تضمين النص
جرِّب نموذج تضمين Gemini التجريبي الجديد الذي يحقّق أداءً متقدّمًا.
تُستخدم تضمينات النصوص لقياس مدى صلة السلاسل النصية ببعضها، وهي تُستخدَم على نطاق واسع في العديد من تطبيقات الذكاء الاصطناعي.
يحقّق نموذج text-embedding-004
أداء استرجاع أقوى ويتفوّق على النماذج الحالية
بأبعاد مماثلة، وذلك استنادًا إلى مقاييس التضمين المعيارية MTEB.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال نص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 2,048 حجم سمة الإخراج 768 |
[**] | حدود المعدّل1,500 طلب في الدقيقة |
إعدادات الأمان القابلة للتعديل | غير متاح |
آخر تعديل | أبريل 2024 |
التضمين
يمكنك استخدام نموذج Embedding لإنشاء تضمينات نصية للنص المُدخَل.
تم تحسين نموذج Embedding لإنشاء تضمينات بـ 768 سمة للنصوص التي تصل إلى 2,048 رمزًا مميزًا.
تفاصيل نموذج التضمين
الموقع | الوصف |
---|---|
رمز النموذج |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال نص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 2,048 حجم سمة الإخراج 768 |
[**] | حدود المعدّل1,500 طلب في الدقيقة |
إعدادات الأمان القابلة للتعديل | غير متاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
AQA
يمكنك استخدام نموذج AQA لتنفيذ مهام ذات صلة بميزة الإجابة عن الأسئلة مع ذكر المصدر (AQA) في مستند أو مجموعة مستندات أو مجموعة من الفقرات. يعرض نموذج AQA إجابات عن الأسئلة استنادًا إلى المصادر المقدَّمة، بالإضافة إلى تقدير احتمالية الإجابة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز النموذج | models/aqa |
أنواع البيانات المتوافقة |
الإدخال نص الناتج نص |
اللغة المتاحة | الإنجليزية |
[*] | حدود الرموز المميزة
حد الرموز المميزة المدخلة 7,168 الحد الأقصى لعدد الرموز المميزة في المخرجات 1,024 |
[**] | حدود المعدّل1,500 طلب في الدقيقة |
إعدادات الأمان القابلة للتعديل | متاح |
آخر تعديل | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة لاستكشاف إمكانات هذه الأنواع المختلفة من النماذج.
[*] الرمز المميز يعادل حوالي 4 أحرف في نماذج Gemini. 100 رمز مميز تعادل حوالي 60 إلى 80 كلمة إنجليزية.
أنماط أسماء إصدارات النماذج
تتوفّر نماذج Gemini بإصدارات ثابتة أو معاينة أو تجريبية. في الرمز البرمجي، يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار اللذين تريد استخدامهما.
أحدث إصدار ثابت
تشير هذه السمة إلى أحدث إصدار ثابت تم إطلاقه لطراز الجهاز المحدّد والجيل والنوع.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
. مثلاً: gemini-2.0-flash
إسطبل
تشير إلى نموذج ثابت معيّن. لا تتغيّر النماذج الثابتة عادةً. يجب أن تستخدم معظم تطبيقات الإنتاج نموذجًا ثابتًا محدّدًا.
لتحديد إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،
gemini-2.0-flash-001
.
معاينة
تشير إلى نموذج معاينة قد لا يكون مناسبًا للاستخدام في مرحلة الإنتاج، وقد يتضمّن حدودًا أكثر صرامة على عدد الطلبات في الدقيقة، ولكن قد تكون الفوترة مفعّلة فيه.
لتحديد إصدار معاينة، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،
gemini-2.5-pro-preview-06-05
.
تجريبية
يشير إلى نموذج تجريبي قد لا يكون مناسبًا للاستخدام في مرحلة الإنتاج ويتضمّن حدودًا أكثر صرامة بشأن عدد الطلبات. نطرح نماذج تجريبية لجمع الملاحظات وإتاحة آخر التحديثات للمطوّرين بسرعة.
لتحديد إصدار تجريبي، استخدِم النمط التالي:
<model>-<generation>-<variation>-<version>
. على سبيل المثال،
gemini-2.0-pro-exp-02-05
.
نماذج تجريبية
بالإضافة إلى النماذج الثابتة، يوفّر Gemini API نماذج تجريبية قد لا تكون مناسبة للاستخدام في مرحلة الإنتاج وتتضمّن حدودًا أكثر صرامة بشأن عدد الطلبات في الدقيقة.
نطرح نماذج تجريبية لجمع الملاحظات، وإتاحة أحدث التحديثات للمطوّرين بسرعة، وإبراز وتيرة الابتكار في Google. وبفضل ما نتعلّمه من الإصدارات التجريبية، يمكننا تحديد كيفية طرح النماذج على نطاق أوسع. يمكن استبدال نموذج تجريبي بآخر بدون إشعار مسبق. لا نضمن أن يصبح النموذج التجريبي نموذجًا ثابتًا في المستقبل.
النماذج التجريبية السابقة
عند توفّر إصدارات جديدة أو إصدارات ثابتة، نزيل النماذج التجريبية ونستبدلها. يمكنك العثور على النماذج التجريبية السابقة التي طرحناها في القسم التالي مع الإصدار البديل:
رمز الطراز | النموذج الأساسي | الإصدار البديل |
---|---|---|
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation |
Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro | gemini-2.5-pro-preview-06-05 |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro | gemini-2.5-pro-preview-05-06 |
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
اللغات المتاحة
تم تدريب نماذج Gemini على العمل مع اللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدنماركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - الهنغارية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللاتفية (
lv
) - اللتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)