طُرز Gemini

خيارات النموذج

توفّر واجهة برمجة التطبيقات Gemini نماذج مختلفة محسَّنة لحالات استخدام محدّدة. في ما يلي نظرة عامة موجزة على إصدارات Gemini المتاحة:

صيغة النموذج المدخلات الناتج محسَّن لـ
‫Gemini 2.5 Pro
gemini-2.5-pro
الصوت والصور والفيديوهات والنصوص وملفات PDF نص قدرات محسّنة على التفكير والاستدلال، وفهم متعدد الوسائط، ومهارات ترميز متقدّمة، وغير ذلك
‫Gemini 2.5 Flash
gemini-2.5-flash
الصوت والصور والفيديوهات والنصوص نص التفكير التكيّفي والفعالية من حيث التكلفة
معاينة Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite-preview-06-17
النصوص والصور والفيديوهات والملفات الصوتية نص النموذج الأكثر فعالية من حيث التكلفة والذي يتيح معدل نقل بيانات عاليًا
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
الصوت والفيديوهات والنصوص النص والصوت، بالتناوب مخرجات صوتية عالية الجودة وطبيعية للمحادثات، مع أو بدون التفكير
‫Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts
نص الصوت إنشاء صوت من نص مع تأخير منخفض وقابل للتحكّم فيه، وبصوت متحدث واحد أو عدة متحدثين
إصدار تجريبي من ميزة "تحويل النص إلى كلام" في Gemini 2.5 Pro
gemini-2.5-pro-preview-tts
نص الصوت إنشاء صوت من نص مع تأخير منخفض وقابل للتحكّم فيه، وبصوت متحدث واحد أو عدة متحدثين
‫Gemini 2.0 Flash
gemini-2.0-flash
الصوت والصور والفيديوهات والنصوص نص ميزات الجيل التالي والسرعة والبث في الوقت الفعلي
معاينة ميزة إنشاء الصور في Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation
الصوت والصور والفيديوهات والنصوص النصوص والصور إنشاء الصور وتعديلها عبر المحادثة
‫Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
الصوت والصور والفيديوهات والنصوص نص الفعالية من حيث التكلفة ووقت الاستجابة المنخفض
‫Gemini 1.5 Flash
gemini-1.5-flash
الصوت والصور والفيديوهات والنصوص نص أداء سريع ومتعدد الاستخدامات في مجموعة متنوعة من المهام
‫Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
الصوت والصور والفيديوهات والنصوص نص مهام ذات حجم كبير وذكاء اصطناعي أقل
‫Gemini 1.5 Pro
gemini-1.5-pro
الصوت والصور والفيديوهات والنصوص نص مهام الاستدلال المعقّدة التي تتطلّب ذكاءً أكبر
Gemini Embedding
gemini-embedding-exp
نص تضمينات النص قياس مدى الصلة بين السلاسل النصية
Imagen 4
imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06
نص الصور أحدث نموذج لإنشاء الصور
Imagen 3
imagen-3.0-generate-002
نص الصور نموذج إنشاء صور عالية الجودة
Veo 2
veo-2.0-generate-001
النصوص والصور فيديو إنشاء فيديوهات عالية الجودة
‫Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
الصوت والفيديو والنص النص والصوت تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض
‫Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
الصوت والفيديو والنص النص والصوت تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض

يمكنك الاطّلاع على حدود المعدّل لكل نموذج في صفحة حدود المعدّل.

Gemini 2.5 Pro

‫Gemini 2.5 Pro هو نموذجنا الأكثر تطورًا، وهو قادر على الاستدلال بشأن المسائل المعقدة في الترميز والرياضيات والعلوم والتكنولوجيا والهندسة والرياضيات (STEM)، بالإضافة إلى تحليل مجموعات البيانات وقواعد الرموز البرمجية والمستندات الكبيرة باستخدام السياق الطويل.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج gemini-2.5-pro
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديو والنص وملفات PDF

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

65,536

إمكانات

النتائج المنظَّمة

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

تحديد المصادر في "بحث Google"

متاح

إنشاء الصور

غير متاح

إنشاء الصوت

غير متاح

Live API

غير متاح

التفكير

متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • Stable: gemini-2.5-pro
  • Preview: gemini-2.5-pro-preview-06-05
  • Preview: gemini-2.5-pro-preview-05-06
آخر تعديل يونيو 2025
تاريخ آخر تحديث للبيانات يناير 2025

‫Gemini 2.5 Flash

هذا النموذج هو الأفضل من حيث السعر والأداء، وهو يقدّم إمكانات شاملة. ‫2.5 Flash هو الخيار الأفضل للمهام التي تتطلّب التفكير ومعالجة البيانات على نطاق واسع، والمهام التي تتطلّب وقت استجابة منخفضًا، والمهام التي تتطلّب كميات كبيرة من البيانات، وحالات الاستخدام التي تتطلّب وكيلًا.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.5-flash
أنواع البيانات المتوافقة

المدخلات

النصوص والصور والفيديوهات والمقاطع الصوتية

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

65,536

إمكانات

إنشاء الصوت

غير متاح

التخزين المؤقت

متاح

تنفيذ الرمز

متاح

استدعاء الدوال

متاح

إنشاء الصور

غير متاح

تحديد المصادر في "بحث Google"

متاح

النتائج المنظَّمة

متاح

التفكير

متاح

التعديل

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • إصدار ثابت: gemini-2.5-flash
  • معاينة: gemini-2.5-flash-preview-05-20
آخر تعديل يونيو 2025
تاريخ آخر تحديث للبيانات يناير 2025

معاينة Gemini 2.5 Flash-Lite

نموذج Gemini 2.5 Flash محسّن لتحقيق فعالية التكلفة وتقليل وقت الاستجابة.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.5-flash-lite-preview-06-17
أنواع البيانات المتوافقة

المدخلات

النصوص والصور والفيديوهات والمقاطع الصوتية

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,000,000

الحد الأقصى لعدد الرموز المميزة في المخرجات

64,000

إمكانات

النتائج المنظَّمة

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

سياق عنوان URL

متاح

تحديد المصادر في "بحث Google"

متاح

إنشاء الصور

غير متاح

إنشاء الصوت

غير متاح

Live API

غير متاح

التفكير

متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • معاينة: gemini-2.5-flash-lite-preview-06-17
آخر تعديل يونيو 2025
تاريخ آخر تحديث للبيانات يناير 2025

ميزة إنشاء الصوت مضمَّنة في ‎2.5 Flash من Gemini

نماذج الحوار الصوتي الأصلية، مع التفكير وبدونه، متاحة من خلال Live API. تقدّم هذه النماذج تجارب محادثة تفاعلية وغير منظَّمة، مع إمكانية تحديد الأسلوب والتحكّم في المحادثة.

تجربة الصوت الأصلي في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.5-flash-preview-native-audio-dialog &
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
أنواع البيانات المتوافقة

المدخلات

الصوت والفيديو والنص

الناتج

الصوت والنص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

128,000

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,000

إمكانات

إنشاء الصوت

متاح

التخزين المؤقت

غير متاح

تنفيذ الرمز

غير متاح

استدعاء الدوال

متاح

إنشاء الصور

غير متاح

تحديد المصادر في "بحث Google"

متاح

النتائج المنظَّمة

غير متاح

التفكير

متاح

التعديل

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • معاينة: gemini-2.5-flash-preview-05-20
  • تجريبي: gemini-2.5-flash-exp-native-audio-thinking-dialog
آخر تعديل مايو 2025
تاريخ آخر تحديث للبيانات يناير 2025

معاينة ميزة "تحويل النص إلى كلام" في Gemini 2.5 Flash

‫Gemini 2.5 Flash Preview TTS هو نموذج تحويل النص إلى كلام فعال من حيث التكلفة والأداء، ويوفّر مستوى عاليًا من التحكّم والشفافية في مهام سير العمل المنظَّمة، مثل إنشاء ملفات بودكاست وكتب صوتية وتقديم الدعم للعملاء وغير ذلك. تكون حدود الطلبات في Gemini 2.5 Flash أكثر تقييدًا لأنّه نموذج تجريبي/إصدار حصري.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.5-flash-preview-tts
أنواع البيانات المتوافقة

المدخلات

نص

الناتج

الصوت

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

8,000

الحد الأقصى لعدد الرموز المميزة في المخرجات

16,000

إمكانات

النتائج المنظَّمة

غير متاح

التخزين المؤقت

غير متاح

التعديل

غير متاح

استدعاء الدوال

غير متاح

تنفيذ الرمز

غير متاح

بحث

غير متاح

إنشاء الصوت

متاح

Live API

غير متاح

التفكير

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • gemini-2.5-flash-preview-tts
آخر تعديل مايو 2025

معاينة ميزة "تحويل النص إلى كلام" في Gemini 2.5 Pro

‫Gemini 2.5 Pro Preview TTS هو نموذجنا الأكثر فعالية لتحويل النص إلى كلام، ويوفّر مستوى عاليًا من التحكّم والشفافية في مهام سير العمل المنظَّمة، مثل إنشاء حلقات البودكاست والكتب الصوتية ودعم العملاء وغير ذلك. تكون حدود طلبات Gemini 2.5 Pro أكثر تقييدًا لأنّه نموذج تجريبي / نموذج معاينة.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.5-pro-preview-tts
أنواع البيانات المتوافقة

المدخلات

نص

الناتج

الصوت

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

8,000

الحد الأقصى لعدد الرموز المميزة في المخرجات

16,000

إمكانات

النتائج المنظَّمة

غير متاح

التخزين المؤقت

غير متاح

التعديل

غير متاح

استدعاء الدوال

غير متاح

تنفيذ الرمز

غير متاح

بحث

غير متاح

إنشاء الصوت

متاح

Live API

غير متاح

التفكير

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • gemini-2.5-pro-preview-tts
آخر تعديل مايو 2025

‫Gemini 2.0 Flash

يوفّر ‎Gemini 2.0 Flash ميزات من الجيل التالي وقدرات محسّنة، بما في ذلك سرعة فائقة، وإمكانية استخدام الأدوات الأصلية، وقدرة استيعاب مليون رمز مميّز.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.0-flash
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

إمكانات

النتائج المنظَّمة

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

بحث

متاح

إنشاء الصور

غير متاح

إنشاء الصوت

غير متاح

Live API

متاح

التفكير

تجريبي

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • الأحدث: gemini-2.0-flash
  • إصدار ثابت: gemini-2.0-flash-001
  • تجريبي: gemini-2.0-flash-exp
آخر تعديل فبراير 2025
تاريخ آخر تحديث للبيانات أغسطس 2024

إنشاء الصور باستخدام الإصدار التجريبي من ‎2.0 Flash في Gemini

توفّر ميزة "إنشاء الصور في الإصدار التجريبي من Gemini 2.0 Flash" ميزات محسّنة لإنشاء الصور، بما في ذلك إنشاء الصور وتعديلها بشكل حواري.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.0-flash-preview-image-generation
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

النصوص والصور

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

32,000

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

إمكانات

النتائج المنظَّمة

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

غير متاح

تنفيذ الرمز

غير متاح

بحث

غير متاح

إنشاء الصور

متاح

إنشاء الصوت

غير متاح

Live API

غير متاح

التفكير

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • معاينة: gemini-2.0-flash-preview-image-generation
  • لا تتوفّر حاليًا ميزة إنشاء الصور باستخدام gemini-2.0-flash-preview في عدد من البلدان في أوروبا والشرق الأوسط وأفريقيا

آخر تعديل مايو 2025
تاريخ آخر تحديث للبيانات أغسطس 2024

‫Gemini 2.0 Flash-Lite

نموذج Gemini 2.0 Flash محسّن من أجل الكفاءة من حيث التكلفة ووقت الاستجابة المنخفض.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.0-flash-lite
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

إمكانات

النتائج المنظَّمة

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

غير متاح

بحث

غير متاح

إنشاء الصور

غير متاح

إنشاء الصوت

غير متاح

Live API

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • الأحدث: gemini-2.0-flash-lite
  • إصدار ثابت: gemini-2.0-flash-lite-001
آخر تعديل فبراير 2025
تاريخ آخر تحديث للبيانات أغسطس 2024

‫Gemini 1.5 Flash

‫Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط ومتعدد الاستخدامات لأداء مجموعة متنوعة من المهام بكفاءة.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-1.5-flash
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

مواصفات الصوت والفيديو

الحدّ الأقصى لعدد الصور لكل طلب

3,600

الحدّ الأقصى لطول الفيديو

ساعة واحدة

الحد الأقصى لطول الصوت

حوالي 9.5 ساعات

إمكانات

تعليمات النظام

متاح

وضع JSON

متاح

مخطط JSON

متاح

إعدادات الأمان القابلة للتعديل

متاح

التخزين المؤقت

متاح

التعديل

متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

Live API

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • الأحدث: gemini-1.5-flash-latest
  • الإصدار الثابت الأخير: gemini-1.5-flash
  • ثابت:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
آخر تعديل سبتمبر 2024

‫Gemini 1.5 Flash-8B

‫Gemini 1.5 Flash-8B هو نموذج صغير مصمّم للمهام التي تتطلّب ذكاءً اصطناعيًا أقل.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-1.5-flash-8b
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

مواصفات الصوت والفيديو

الحدّ الأقصى لعدد الصور لكل طلب

3,600

الحدّ الأقصى لطول الفيديو

ساعة واحدة

الحد الأقصى لطول الصوت

حوالي 9.5 ساعات

إمكانات

تعليمات النظام

متاح

وضع JSON

متاح

مخطط JSON

متاح

إعدادات الأمان القابلة للتعديل

متاح

التخزين المؤقت

متاح

التعديل

متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

Live API

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • الأحدث: gemini-1.5-flash-8b-latest
  • الإصدار الثابت الأخير: gemini-1.5-flash-8b
  • ثابت:
    • gemini-1.5-flash-8b-001
آخر تعديل أكتوبر 2024

Gemini 1.5 Pro

جرِّب الإصدار التجريبي من Gemini 2.5 Pro، وهو نموذج Gemini الأكثر تطورًا حتى الآن.

‫Gemini 1.5 Pro هو نموذج متعدّد الوسائط متوسط الحجم ومحسَّن لأداء مجموعة كبيرة من مهام الاستدلال. يمكن لنموذج ‎1.5 Pro معالجة كميات كبيرة من البيانات في آنٍ واحد، بما في ذلك فيديوهات مدتها ساعتان أو مقاطع صوتية مدتها 19 ساعة أو قواعد رموز برمجية تضم 60,000 سطر من الرموز البرمجية أو نصوص تصل إلى 2,000 صفحة.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-1.5-pro
أنواع البيانات المتوافقة

المدخلات

الصوت والصور والفيديوهات والنصوص

الناتج

نص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

2,097,152

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

مواصفات الصوت والفيديو

الحدّ الأقصى لعدد الصور لكل طلب

7,200

الحدّ الأقصى لطول الفيديو

ساعتان

الحد الأقصى لطول الصوت

حوالي 19 ساعة

إمكانات

تعليمات النظام

متاح

وضع JSON

متاح

مخطط JSON

متاح

إعدادات الأمان القابلة للتعديل

متاح

التخزين المؤقت

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

Live API

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • الأحدث: gemini-1.5-pro-latest
  • الإصدار الثابت الأخير: gemini-1.5-pro
  • ثابت:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
آخر تعديل سبتمبر 2024

Imagen 4

‫Imagen 4 هو أحدث نموذج لإنشاء الصور، وهو قادر على إنشاء صور غنية بالتفاصيل والإضاءة، كما أنّه يقدّم أداءً أفضل بكثير في عرض النصوص، ويوفّر دقة أعلى من النماذج السابقة.

تفاصيل الطراز
الموقع الوصف
رمز النموذج

Gemini API

imagen-4.0-generate-preview-06-06
imagen-4.0-ultra-generate-preview-06-06

أنواع البيانات المتوافقة

الإدخال

نص

الناتج

الصور

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

‫480 رمزًا مميزًا (نص)

الصور الناتجة

‫1 (فائق)
من 1 إلى 4 (عادي)

آخر تعديل يونيو 2025

Imagen 3

‫Imagen 3 هو نموذج تحويل النص إلى صور الأكثر تطورًا لدينا، وهو قادر على إنشاء صور بأدق التفاصيل وأكثرها واقعية، وبإضاءة أفضل، وبعدد أقل من التشويشات مقارنةً بنماذجنا السابقة.

تفاصيل الطراز
الموقع الوصف
رمز النموذج

Gemini API

imagen-3.0-generate-002

أنواع البيانات المتوافقة

الإدخال

نص

الناتج

الصور

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

لا ينطبق

الصور الناتجة

ما يصل إلى 4

آخر تعديل فبراير 2025

Veo 2

‫Veo 2 هو نموذجنا العالي الجودة لتحويل النصوص والصور إلى فيديوهات، وهو قادر على إنشاء فيديوهات مفصّلة، مع مراعاة الدقة الفنية في طلباتك.

تفاصيل الطراز
الموقع الوصف
رمز النموذج

Gemini API

veo-2.0-generate-001

أنواع البيانات المتوافقة

الإدخال

نص وصورة

الناتج

فيديو

الحدود

إدخال النص

لا ينطبق

إدخال الصورة

أي درجة دقة ونسبة عرض إلى ارتفاع للصورة بحجم ملف يصل إلى 20 ميغابايت

فيديو الإخراج

ما يصل إلى 2

آخر تعديل أبريل 2025

‫Gemini 2.5 Flash Live

يعمل نموذج Gemini 2.5 Flash Live مع Live API لتفعيل تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض مع Gemini. يمكن للنموذج معالجة النصوص والملفات الصوتية والفيديوهات، ويمكنه تقديم مخرجات نصية وصوتية.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-live-2.5-flash-preview
أنواع البيانات المتوافقة

المدخلات

الصوت والفيديو والنص

الناتج

النص والصوت

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

إمكانات

النتائج المنظَّمة

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

بحث

متاح

إنشاء الصور

غير متاح

إنشاء الصوت

متاح

التفكير

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • معاينة: gemini-live-2.5-flash-preview
آخر تعديل يونيو 2025
تاريخ آخر تحديث للبيانات يناير 2025

‫Gemini 2.0 Flash Live

يعمل نموذج Gemini 2.0 Flash Live مع Live API لتفعيل تفاعلات صوتية ومرئية ثنائية الاتجاه بزمن استجابة منخفض مع Gemini. يمكن للنموذج معالجة النصوص والملفات الصوتية والفيديوهات، ويمكنه تقديم مخرجات نصية وصوتية.

تجربة الأداة في Google AI Studio

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/gemini-2.0-flash-live-001
أنواع البيانات المتوافقة

المدخلات

الصوت والفيديو والنص

الناتج

النص والصوت

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

1,048,576

الحد الأقصى لعدد الرموز المميزة في المخرجات

8,192

إمكانات

النتائج المنظَّمة

متاح

التعديل

غير متاح

استدعاء الدوال

متاح

تنفيذ الرمز

متاح

بحث

متاح

إنشاء الصور

غير متاح

إنشاء الصوت

متاح

التفكير

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدار النموذج لمزيد من التفاصيل.
  • معاينة: gemini-2.0-flash-live-001
آخر تعديل أبريل 2025
تاريخ آخر تحديث للبيانات أغسطس 2024

تضمين Gemini (ميزة تجريبية)

يحقّق نموذج Gemini embedding أداءً متفوّقًا في العديد من الجوانب الرئيسية، بما في ذلك الرمز البرمجي واللغات المتعددة والاسترجاع. تكون حدود معدّل الطلبات في Gemini Embedding أكثر صرامة لأنّه نموذج تجريبي.

تفاصيل الطراز
الموقع الوصف
رمز النموذج

Gemini API

gemini-embedding-exp-03-07

أنواع البيانات المتوافقة

الإدخال

نص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

8,192

حجم سمة الإخراج

Elastic، تتوافق مع: 3072 أو 1536 أو 768

آخر تعديل مارس 2025

تضمين النص والتضمين

تضمين النص

جرِّب نموذج تضمين Gemini التجريبي الجديد الذي يحقّق أداءً متقدّمًا.

تُستخدم تضمينات النصوص لقياس مدى صلة السلاسل النصية ببعضها، وهي تُستخدَم على نطاق واسع في العديد من تطبيقات الذكاء الاصطناعي.

يحقّق نموذج text-embedding-004 أداء استرجاع أقوى ويتفوّق على النماذج الحالية بأبعاد مماثلة، وذلك استنادًا إلى مقاييس التضمين المعيارية MTEB.

تفاصيل الطراز
الموقع الوصف
رمز النموذج

Gemini API

models/text-embedding-004

أنواع البيانات المتوافقة

الإدخال

نص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

2,048

حجم سمة الإخراج

768

حدود المعدّل[**] ‫1,500 طلب في الدقيقة
إعدادات الأمان القابلة للتعديل غير متاح
آخر تعديل أبريل 2024

التضمين

يمكنك استخدام نموذج Embedding لإنشاء تضمينات نصية للنص المُدخَل.

تم تحسين نموذج Embedding لإنشاء تضمينات بـ 768 سمة للنصوص التي تصل إلى 2,048 رمزًا مميزًا.

تفاصيل نموذج التضمين
الموقع الوصف
رمز النموذج models/embedding-001
أنواع البيانات المتوافقة

الإدخال

نص

الناتج

تضمينات النص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

2,048

حجم سمة الإخراج

768

حدود المعدّل[**] ‫1,500 طلب في الدقيقة
إعدادات الأمان القابلة للتعديل غير متاح
آخر تعديل كانون الأول (ديسمبر) 2023

AQA

يمكنك استخدام نموذج AQA لتنفيذ مهام ذات صلة بميزة الإجابة عن الأسئلة مع ذكر المصدر (AQA) في مستند أو مجموعة مستندات أو مجموعة من الفقرات. يعرض نموذج AQA إجابات عن الأسئلة استنادًا إلى المصادر المقدَّمة، بالإضافة إلى تقدير احتمالية الإجابة.

تفاصيل الطراز

الموقع الوصف
رمز النموذج models/aqa
أنواع البيانات المتوافقة

الإدخال

نص

الناتج

نص

اللغة المتاحة الإنجليزية
حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

7,168

الحد الأقصى لعدد الرموز المميزة في المخرجات

1,024

حدود المعدّل[**] ‫1,500 طلب في الدقيقة
إعدادات الأمان القابلة للتعديل متاح
آخر تعديل كانون الأول (ديسمبر) 2023

اطّلِع على الأمثلة لاستكشاف إمكانات هذه الأنواع المختلفة من النماذج.

[*] الرمز المميز يعادل حوالي 4 أحرف في نماذج Gemini. ‫100 رمز مميز تعادل حوالي 60 إلى 80 كلمة إنجليزية.

أنماط أسماء إصدارات النماذج

تتوفّر نماذج Gemini بإصدارات ثابتة أو معاينة أو تجريبية. في الرمز البرمجي، يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار اللذين تريد استخدامهما.

أحدث إصدار ثابت

تشير هذه السمة إلى أحدث إصدار ثابت تم إطلاقه لطراز الجهاز المحدّد والجيل والنوع.

لتحديد أحدث إصدار ثابت، استخدِم النمط التالي: <model>-<generation>-<variation>. مثلاً: gemini-2.0-flash

إسطبل

تشير إلى نموذج ثابت معيّن. لا تتغيّر النماذج الثابتة عادةً. يجب أن تستخدم معظم تطبيقات الإنتاج نموذجًا ثابتًا محدّدًا.

لتحديد إصدار ثابت، استخدِم النمط التالي: <model>-<generation>-<variation>-<version>. على سبيل المثال، gemini-2.0-flash-001.

معاينة

تشير إلى نموذج معاينة قد لا يكون مناسبًا للاستخدام في مرحلة الإنتاج، وقد يتضمّن حدودًا أكثر صرامة على عدد الطلبات في الدقيقة، ولكن قد تكون الفوترة مفعّلة فيه.

لتحديد إصدار معاينة، استخدِم النمط التالي: <model>-<generation>-<variation>-<version>. على سبيل المثال، gemini-2.5-pro-preview-06-05.

تجريبية

يشير إلى نموذج تجريبي قد لا يكون مناسبًا للاستخدام في مرحلة الإنتاج ويتضمّن حدودًا أكثر صرامة بشأن عدد الطلبات. نطرح نماذج تجريبية لجمع الملاحظات وإتاحة آخر التحديثات للمطوّرين بسرعة.

لتحديد إصدار تجريبي، استخدِم النمط التالي: <model>-<generation>-<variation>-<version>. على سبيل المثال، gemini-2.0-pro-exp-02-05.

نماذج تجريبية

بالإضافة إلى النماذج الثابتة، يوفّر Gemini API نماذج تجريبية قد لا تكون مناسبة للاستخدام في مرحلة الإنتاج وتتضمّن حدودًا أكثر صرامة بشأن عدد الطلبات في الدقيقة.

نطرح نماذج تجريبية لجمع الملاحظات، وإتاحة أحدث التحديثات للمطوّرين بسرعة، وإبراز وتيرة الابتكار في Google. وبفضل ما نتعلّمه من الإصدارات التجريبية، يمكننا تحديد كيفية طرح النماذج على نطاق أوسع. يمكن استبدال نموذج تجريبي بآخر بدون إشعار مسبق. لا نضمن أن يصبح النموذج التجريبي نموذجًا ثابتًا في المستقبل.

النماذج التجريبية السابقة

عند توفّر إصدارات جديدة أو إصدارات ثابتة، نزيل النماذج التجريبية ونستبدلها. يمكنك العثور على النماذج التجريبية السابقة التي طرحناها في القسم التالي مع الإصدار البديل:

رمز الطراز النموذج الأساسي الإصدار البديل
gemini-2.5-flash-preview-04-17 ‫Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation ‫Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro-preview-06-05
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro-preview-05-06
gemini-2.0-flash-thinking-exp-01-21 ‫Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 ‫Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp ‫Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 ‫Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 ‫Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 ‫Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 ‫Gemini 1.5 Flash-8B gemini-1.5-flash-8b

اللغات المتاحة

تم تدريب نماذج Gemini على العمل مع اللغات التالية:

  • العربية (ar)
  • البنغالية (bn)
  • البلغارية (bg)
  • الصينية المبسّطة والتقليدية (zh)
  • الكرواتية (hr)
  • التشيكية (cs)
  • الدنماركية (da)
  • الهولندية (nl)
  • الإنجليزية (en)
  • الإستونية (et)
  • الفنلندية (fi)
  • الفرنسية (fr)
  • الألمانية (de)
  • اليونانية (el)
  • العبرية (iw)
  • الهندية (hi)
  • الهنغارية (hu)
  • الإندونيسية (id)
  • الإيطالية (it)
  • اليابانية (ja)
  • الكورية (ko)
  • اللاتفية (lv)
  • اللتوانية (lt)
  • النرويجية (no)
  • البولندية (pl)
  • البرتغالية (pt)
  • الرومانية (ro)
  • الروسية (ru)
  • الصربية (sr)
  • السلوفاكية (sk)
  • السلوفينية (sl)
  • الإسبانية (es)
  • السواحلية (sw)
  • السويدية (sv)
  • التايلاندية (th)
  • التركية (tr)
  • الأوكرانية (uk)
  • الفيتنامية (vi)