مدل های جوزا

انواع مدل

Gemini API مدل های مختلفی را ارائه می دهد که برای موارد استفاده خاص بهینه شده اند. در اینجا یک مرور مختصر از انواع Gemini موجود است:

نوع مدل ورودی(های) خروجی بهینه شده برای
فلش جمینی 2.0
gemini-2.0-flash
صدا، تصاویر، ویدئوها و متن متن، تصاویر (به زودی) و صدا (به زودی) ویژگی‌های نسل بعدی، سرعت و تولید چندوجهی برای انواع مختلفی از وظایف
پیش نمایش Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05
صدا، تصاویر، ویدئوها و متن متن یک مدل فلش Gemini 2.0 بهینه شده برای کارایی هزینه و تأخیر کم
فلش جمینی 1.5
gemini-1.5-flash
صدا، تصاویر، ویدئوها و متن متن عملکرد سریع و همه کاره در انواع مختلف وظایف
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
صدا، تصاویر، ویدئوها و متن متن وظایف با حجم بالا و هوش کمتر
جمینی 1.5 پرو
gemini-1.5-pro
صدا، تصاویر، ویدئوها و متن متن وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
جاسازی متن
text-embedding-004
متن جاسازی متن اندازه گیری ارتباط رشته های متنی

می توانید محدودیت های نرخ را برای هر مدل در صفحه محدودیت نرخ مشاهده کنید.

فلش جمینی 2.0

Gemini 2.0 Flash ویژگی‌های نسل بعدی و قابلیت‌های بهبودیافته را ارائه می‌کند، از جمله سرعت برتر، استفاده از ابزار بومی، تولید چندوجهی و پنجره زمینه توکن 1M.

در Google AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-2.0-flash
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

صوتی (به زودی)، تصاویر (به زودی) و متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

قابلیت های

خروجی های ساخت یافته

پشتیبانی می شود

ذخیره سازی

به زودی

تنظیم

پشتیبانی نمی شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

جستجو کنید

پشتیبانی می شود

تولید تصویر

به زودی

استفاده از ابزار بومی

پشتیبانی می شود

تولید صدا

به زودی

Multimodal Live API

به زودی

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-2.0-flash
  • پایدار: gemini-2.0-flash-001
آخرین به روز رسانی فوریه 2025
برش دانش آگوست 2024

پیش نمایش Gemini 2.0 Flash-Lite

یک مدل فلش Gemini 2.0 بهینه شده برای کارایی هزینه و تأخیر کم.

در Google AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-2.0-flash-lite-preview-02-05
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

قابلیت های

خروجی های ساخت یافته

پشتیبانی می شود

ذخیره سازی

پشتیبانی نمی شود

تنظیم

پشتیبانی نمی شود

فراخوانی تابع

پشتیبانی نمی شود

اجرای کد

پشتیبانی نمی شود

جستجو کنید

پشتیبانی نمی شود

تولید تصویر

پشتیبانی نمی شود

استفاده از ابزار بومی

پشتیبانی نمی شود

تولید صدا

پشتیبانی نمی شود

Multimodal Live API

پشتیبانی نمی شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-2.0-flash-lite-preview-02-05
آخرین به روز رسانی فوریه 2025
برش دانش آگوست 2024

فلش جمینی 1.5

Gemini 1.5 Flash یک مدل چندوجهی سریع و همه کاره برای مقیاس‌بندی وظایف مختلف است.

در Google AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-flash
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

3600

حداکثر طول ویدیو

1 ساعت

حداکثر طول صدا

تقریبا 9.5 ساعت

قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی می شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

جریان دو طرفه

پشتیبانی نمی شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-flash-latest
  • آخرین استبل: gemini-1.5-flash
  • پایدار:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
آخرین به روز رسانی سپتامبر 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B یک مدل کوچک است که برای کارهای با هوش کمتر طراحی شده است.

در Google AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-flash-8b
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

3600

حداکثر طول ویدیو

1 ساعت

حداکثر طول صدا

تقریبا 9.5 ساعت

قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی می شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

جریان دو طرفه

پشتیبانی نمی شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-flash-8b-latest
  • آخرین استبل: gemini-1.5-flash-8b
  • پایدار:
    • gemini-1.5-flash-8b-001
آخرین به روز رسانی اکتبر 2024

جمینی 1.5 پرو

Gemini 1.5 Pro یک مدل چندوجهی با اندازه متوسط ​​است که برای طیف وسیعی از وظایف استدلالی بهینه شده است. 1.5 Pro می تواند حجم زیادی از داده ها را همزمان پردازش کند، از جمله 2 ساعت ویدیو، 19 ساعت صدا، پایگاه های کد با 60000 خط کد یا 2000 صفحه متن.

در Google AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-pro
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,097,152

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

7200

حداکثر طول ویدیو

2 ساعت

حداکثر طول صدا

تقریبا 19 ساعت

قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی نمی شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

جریان دو طرفه

پشتیبانی نمی شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-pro-latest
  • آخرین استبل: gemini-1.5-pro
  • پایدار:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
آخرین به روز رسانی سپتامبر 2024

جاسازی و جاسازی متن

جاسازی متن

جاسازی متن برای اندازه گیری ارتباط رشته ها استفاده می شود و به طور گسترده در بسیاری از برنامه های کاربردی هوش مصنوعی استفاده می شود.

text-embedding-004 عملکرد بازیابی قوی‌تری را به دست می‌آورد و از مدل‌های موجود با ابعاد قابل مقایسه در معیارهای استاندارد تعبیه‌سازی MTEB بهتر عمل می‌کند .

جزئیات مدل
اموال توضیحات
کد مدل

Gemini API

models/text-embedding-004

انواع داده های پشتیبانی شده

ورودی

متن

خروجی

جاسازی متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,048

اندازه ابعاد خروجی

768

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی نمی شود
آخرین به روز رسانی آوریل 2024

جاسازی

می توانید از مدل Embedding برای ایجاد جاسازی متن برای متن ورودی استفاده کنید.

مدل Embedding برای ایجاد جاسازی با 768 بعد برای متن تا 2048 توکن بهینه شده است.

تعبیه جزئیات مدل
اموال توضیحات
کد مدل models/embedding-001
انواع داده های پشتیبانی شده

ورودی

متن

خروجی

جاسازی متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,048

اندازه ابعاد خروجی

768

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی نمی شود
آخرین به روز رسانی دسامبر 2023

AQA

می توانید از مدل AQA برای انجام وظایف مرتبط با پرسش و پاسخ نسبت داده شده (AQA) در یک سند، مجموعه یا مجموعه ای از متن ها استفاده کنید. مدل AQA به سوالاتی که در منابع ارائه شده پایه گذاری شده اند، به همراه تخمین احتمال پاسخگو پاسخ می دهد.

جزئیات مدل

اموال توضیحات
کد مدل models/aqa
انواع داده های پشتیبانی شده

ورودی

متن

خروجی

متن

زبان پشتیبانی شده انگلیسی
محدودیت های رمز [*]

محدودیت رمز ورودی

7,168

محدودیت نشانه خروجی

1024

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی می شود
آخرین به روز رسانی دسامبر 2023

برای کشف قابلیت‌های این مدل‌ها به مثال‌ها مراجعه کنید.

[*] یک نشانه برای مدل های Gemini معادل حدود 4 کاراکتر است. 100 توکن حدود 60-80 کلمه انگلیسی است.

الگوهای نام نسخه مدل

مدل‌های Gemini در نسخه‌های پیش‌نمایش یا پایدار موجود هستند. در کد خود می توانید از یکی از فرمت های نام مدل زیر استفاده کنید تا مشخص کنید از کدام مدل و نسخه می خواهید استفاده کنید.

  • آخرین: به نسخه پیشرفته مدل برای یک نسل و تنوع مشخص اشاره می کند. مدل اصلی به طور منظم به روز می شود و ممکن است یک نسخه پیش نمایش باشد. فقط برنامه های آزمایش اکتشافی و نمونه های اولیه باید از این نام مستعار استفاده کنند.

    برای تعیین آخرین نسخه، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-latest . به عنوان مثال، gemini-1.0-pro-latest .

  • آخرین نسخه پایدار: به آخرین نسخه پایدار منتشر شده برای نسل و تنوع مدل مشخص شده اشاره می کند.

    برای تعیین آخرین نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation> . به عنوان مثال، gemini-1.0-pro .

  • پایدار: به یک مدل پایدار خاص اشاره می کند. مدل های پایدار تغییر نمی کنند. اکثر برنامه های تولیدی باید از یک مدل پایدار خاص استفاده کنند.

    برای تعیین یک نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-<version> . به عنوان مثال، gemini-1.0-pro-001 .

  • آزمایشی: به یک مدل آزمایشی موجود در Preview اشاره می کند، همانطور که در شرایط تعریف شده است، به این معنی که برای استفاده تولیدی نیست. ما مدل‌های آزمایشی را منتشر می‌کنیم تا بازخورد جمع‌آوری کنیم، آخرین به‌روزرسانی‌های خود را به سرعت در اختیار توسعه‌دهندگان قرار دهیم، و سرعت نوآوری‌هایی که در Google اتفاق می‌افتد را برجسته کنیم. آنچه از راه‌اندازی‌های آزمایشی می‌آموزیم نشان می‌دهد که چگونه مدل‌ها را به طور گسترده‌تری عرضه می‌کنیم. یک مدل آزمایشی را می توان بدون اطلاع قبلی با مدل دیگری تعویض کرد. ما تضمین نمی کنیم که یک مدل آزمایشی در آینده به یک مدل پایدار تبدیل شود.

    برای تعیین یک نسخه آزمایشی، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-<version> . به عنوان مثال، gemini-exp-1121 .

زبان های موجود

مدل های Gemini برای کار با زبان های زیر آموزش دیده اند:

  • عربی ( ar )
  • بنگالی ( bn )
  • بلغاری ( bg )
  • چینی ساده و سنتی ( zh )
  • کرواتی ( hr )
  • چک ( cs )
  • دانمارکی ( da )
  • هلندی ( nl )
  • انگلیسی ( en )
  • استونیایی ( et )
  • فنلاندی ( fi )
  • فرانسوی ( fr )
  • آلمانی ( de )
  • یونانی ( el )
  • عبری ( iw )
  • هندی ( hi )
  • مجارستانی ( hu )
  • اندونزیایی ( id )
  • ایتالیایی ( it )
  • ژاپنی ( ja )
  • کره ای ( ko )
  • لتونی ( lv )
  • لیتوانیایی ( lt )
  • نروژی ( no )
  • لهستانی ( pl )
  • پرتغالی ( pt )
  • رومانیایی ( ro )
  • روسی ( ru )
  • صربی ( sr )
  • اسلواکی ( sk )
  • اسلوونیایی ( sl )
  • اسپانیایی ( es )
  • سواحیلی ( sw )
  • سوئدی ( sv )
  • تایلندی ( th )
  • ترکی ( tr )
  • اوکراینی ( uk )
  • ویتنامی ( vi )