מודלים של Gemini

וריאנטים של מודלים

ב-Gemini API יש מודלים שונים שעברו אופטימיזציה לתרחישים ספציפיים של שימוש. לפניכם סקירה כללית קצרה של הווריאנטים של Gemini שזמינים:

וריאנט של מודל מקורות קלט פלט אופטימיזציה עבור
Gemini 2.0 Flash
gemini-2.0-flash
אודיו, תמונות, סרטונים וטקסט טקסט, תמונות (בקרוב) ואודיו (בקרוב) תכונות, מהירות ויצירה של מודלים גנרטיביים במגוון מודלים לדור הבא, למגוון רחב של משימות
תצוגה מקדימה של Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05
אודיו, תמונות, סרטונים וטקסט טקסט מודל Gemini 2.0 Flash שעובר אופטימיזציה להפחתת עלויות ולזמן אחזור קצר
Gemini 1.5 Flash
gemini-1.5-flash
אודיו, תמונות, סרטונים וטקסט טקסט ביצועים מהירים ומגוונים במגוון משימות
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
אודיו, תמונות, סרטונים וטקסט טקסט משימות בנפח גבוה וברמת אינטליגנציה נמוכה יותר
Gemini 1.5 Pro
gemini-1.5-pro
אודיו, תמונות, סרטונים וטקסט טקסט משימות מורכבות של חשיבה שמחייבות יותר אינטליגנציה
הטמעת טקסט
text-embedding-004
טקסט הטמעת טקסט מדידת הקשר בין מחרוזות טקסט

אפשר לראות את מגבלות הקצב של כל מודל בדף של מגבלות הקצב.

Gemini 2.0 Flash

ב-Gemini 2.0 Flash יש תכונות דור שני ויכולות משופרות, כולל מהירות גבוהה יותר, שימוש בכלים מקומיים, יצירת מודלים מסוגים שונים וחלון הקשר של מיליון טוקנים.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-2.0-flash
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

אודיו (בקרוב), תמונות (בקרוב) וטקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

היכולות של

פלטים מובְנים

נתמך

אחסון במטמון

בקרוב

כוונון

לא נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

חיפוש

נתמך

יצירת תמונות

בקרוב

שימוש בכלים מקומיים

נתמך

יצירת אודיו

בקרוב

Multimodal Live API

בקרוב

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-2.0-flash
  • יציבה: gemini-2.0-flash-001
העדכון האחרון פברואר 2025
סף ידע אוגוסט 2024

גרסת טרום-השקה (Preview) של Gemini 2.0 Flash-Lite

מודל Gemini 2.0 Flash שעובר אופטימיזציה ליעילות בעלויות ולזמן אחזור קצר.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-2.0-flash-lite-preview-02-05
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

היכולות של

פלטים מובְנים

נתמך

אחסון במטמון

לא נתמך

כוונון

לא נתמך

קריאה לפונקציה

לא נתמך

ביצוע קוד

לא נתמך

חיפוש

לא נתמך

יצירת תמונות

לא נתמך

שימוש בכלים מקומיים

לא נתמך

יצירת אודיו

לא נתמך

Multimodal Live API

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-2.0-flash-lite-preview-02-05
העדכון האחרון פברואר 2025
סף ידע אוגוסט 2024

Gemini 1.5 Flash

Gemini 1.5 Flash הוא מודל מהיר ומגוון שמשתמש במספר מודלים כדי להתאים את עצמו למגוון משימות.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash
  • יציבה:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
העדכון האחרון ספטמבר 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B הוא מודל קטן שמיועד למשימות עם רמה נמוכה יותר של בינה.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-flash-8b
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

1,048,576

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

3,600

אורך הסרטון המקסימלי

שעה אחת

אורך האודיו המקסימלי

כ-9.5 שעות

היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-flash-8b-latest
  • הגרסה היציבה האחרונה: gemini-1.5-flash-8b
  • יציבה:
    • gemini-1.5-flash-8b-001
העדכון האחרון אוקטובר 2024

Gemini 1.5 Pro

Gemini 1.5 Pro הוא מודל רב-מודלי בגודל בינוני שעובר אופטימיזציה למגוון רחב של משימות של הסקת מסקנות. 1.5 Pro יכול לעבד כמויות גדולות של נתונים בו-זמנית, כולל שעתיים של וידאו, 19 שעות של אודיו, בסיסים של קוד עם 60,000 שורות קוד או 2,000 דפי טקסט.

לניסיון ב-Google AI Studio

פרטי דגם

נכס תיאור
קוד הדגם models/gemini-1.5-pro
סוגי הנתונים הנתמכים

נתונים

אודיו, תמונות, סרטונים וטקסט

פלט

טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,097,152

מגבלה על אסימוני פלט

8,192

מפרטים של אודיו/וידאו

מספר התמונות המקסימלי לכל הנחיה

7,200

אורך הסרטון המקסימלי

שעתיים

אורך האודיו המקסימלי

כ-19 שעות

היכולות של

הוראות למערכת

נתמך

מצב JSON

נתמך

סכימת JSON

נתמך

הגדרות בטיחות שניתן לשנות

נתמך

אחסון במטמון

נתמך

כוונון

לא נתמך

קריאה לפונקציה

נתמך

ביצוע קוד

נתמך

סטרימינג דו-כיווני

לא נתמך

Versions
למידע נוסף, אפשר לקרוא את המאמר בנושא תבניות של גרסאות מודלים.
  • החדש ביותר: gemini-1.5-pro-latest
  • הגרסה היציבה האחרונה: gemini-1.5-pro
  • יציבה:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
העדכון האחרון ספטמבר 2024

הטמעת טקסט והטמעה

הטמעת טקסט

הטמעות טקסט משמשות למדידת הקשר בין מחרוזות, והן נפוצות מאוד באפליקציות רבות של AI.

text-embedding-004 משיג ביצועי אחזור טובים יותר ומנצח מודלים קיימים עם מאפיינים דומים, במבחני ההטמעה הרגילים של MTEB.

פרטי דגם
נכס תיאור
קוד הדגם

Gemini API

models/text-embedding-004

סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון אפריל 2024

הטמעה

אפשר להשתמש במודל הטמעת הטקסט כדי ליצור טקסטים מוטמעים לטקסט הקלט.

מודל הטמעת הטקסט עבר אופטימיזציה ליצירת הטמעות עם 768 מאפיינים לטקסט של עד 2,048 אסימונים.

הטמעת פרטי המודל
נכס תיאור
קוד הדגם models/embedding-001
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

הטמעת טקסט

מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

2,048

גודל המאפיין בפלט

768

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות לא נתמך
העדכון האחרון דצמבר 2023

AQA

אפשר להשתמש במודל AQA כדי לבצע משימות שקשורות למענה לשאלות עם שיוך (AQA) במסמך, בקורפוס או בקבוצת קטעים. המודל של AQA מחזיר תשובות לשאלות שמבוססות על מקורות שסופקו, יחד עם הערכה של הסבירות שהתשובה נכונה.

פרטי דגם

נכס תיאור
קוד הדגם models/aqa
סוגי הנתונים הנתמכים

קלט

טקסט

פלט

טקסט

שפה נתמכת אנגלית
מגבלות על אסימונים[*]

מגבלה על אסימוני קלט

7,168

מגבלה על אסימוני פלט

1,024

הגבלות קצב[**] 1,500 בקשות לדקה
הגדרות בטיחות שניתן לשנות נתמך
העדכון האחרון דצמבר 2023

בדוגמאות תוכלו לראות את היכולות של הווריאציות האלה של המודלים.

[*] אסימון שווה לכ-4 תווים במודלים של Gemini. 100 אסימונים הם בערך 60-80 מילים באנגלית.

דפוסים של שמות של גרסאות של מודלים

המודלים של Gemini זמינים בגרסת טרום-השקה או בגרסת יציבה. בקוד, אפשר להשתמש באחד מהפורמטים הבאים של שם הדגם כדי לציין את הדגם והגרסה שבהם רוצים להשתמש.

  • Latest: מפנה לגרסה העדכנית ביותר של המודל לדור ולוריאנט מסוימים. המודל הבסיסי מתעדכן באופן קבוע, ויכול להיות שהוא יהיה בגרסה טרום-השקה. יש להשתמש בכתובת האימייל החלופית הזו רק באפליקציות ובאב טיפוס לבדיקה exploratorie.

    כדי לציין את הגרסה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-latest. לדוגמה, gemini-1.0-pro-latest.

  • הגרסה היציבה האחרונה: מפנה לגרסה היציבה האחרונה שפורסמה לדור ולגרסה של המודל שצוינו.

    כדי לציין את הגרסה היציבה האחרונה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>. לדוגמה, gemini-1.0-pro.

  • יציב: מפנה למודל יציב ספציפי. מודלים יציבים לא משתנים. ברוב האפליקציות בסביבת הייצור צריך להשתמש בדגם יציב ספציפי.

    כדי לציין גרסה יציבה, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-1.0-pro-001.

  • ניסיוני: מציין מודל ניסיוני שזמין בתצוגה המקדימה, כפי שמוגדר בתנאים, כלומר הוא לא מיועד לשימוש בסביבת הייצור. אנחנו משחררים מודלים ניסיוניים כדי לקבל משוב, להעביר במהירות את העדכונים האחרונים למפתחים ולהדגיש את קצב החדשנות ב-Google. המידע שאנחנו אוספים מהשקות ניסיוניות עוזר לנו להבין איך להשיק את המודלים האלה בהיקף נרחב יותר. אפשר להחליף מודל ניסיוני במודל אחר ללא הודעה מוקדמת. אנחנו לא מתחייבים שמודל ניסיוני יהפוך למודל יציב בעתיד.

    כדי לציין גרסה ניסיונית, משתמשים בתבנית הבאה: <model>-<generation>-<variation>-<version>. לדוגמה, gemini-exp-1121.

השפות הזמינות

מודלים של Gemini מאומנים לעבוד עם השפות הבאות:

  • ערבית (ar)
  • בנגלית (bn)
  • בולגרית (bg)
  • סינית פשוטה ומסורתית (zh)
  • קרואטית (hr)
  • צ'כית (cs)
  • דנית (da)
  • הולנדית (nl)
  • אנגלית (en)
  • אסטונית (et)
  • פינית (fi)
  • צרפתית (fr)
  • גרמנית (de)
  • יוונית (el)
  • עברית (iw)
  • הינדי (hi)
  • הונגרית (hu)
  • אינדונזית (id)
  • איטלקית (it)
  • יפנית (ja)
  • קוריאנית (ko)
  • לטבית (lv)
  • ליטאית (lt)
  • נורווגית (no)
  • פולנית (pl)
  • פורטוגזית (pt)
  • רומנית (ro)
  • רוסית (ru)
  • סרבית (sr)
  • סלובקית (sk)
  • סלובנית (sl)
  • ספרדית (es)
  • סווהילי (sw)
  • שוודית (sv)
  • תאילנדית (th)
  • טורקית (tr)
  • אוקראינית (uk)
  • וייטנאמית (vi)