Gemini मॉडल

मॉडल के वैरिएंट

Gemini API, अलग-अलग मॉडल उपलब्ध कराता है. ये मॉडल, इस्तेमाल के खास उदाहरणों के लिए ऑप्टिमाइज़ किए जाते हैं. Gemini के उपलब्ध वैरिएंट के बारे में खास जानकारी यहां दी गई है:

मॉडल का वैरिएंट इनपुट आउटपुट इनके लिए ऑप्टिमाइज़ किया गया
Gemini 2.0 Flash
gemini-2.0-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट, इमेज (जल्द आ रही हैं), और ऑडियो (जल्द आ रहा है) अलग-अलग तरह के टास्क के लिए, अगली पीढ़ी की सुविधाएं, तेज़ी, और अलग-अलग मोड में जनरेट करने की सुविधा
Gemini 2.0 Flash-Lite की झलक
gemini-2.0-flash-lite-preview-02-05
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट Gemini 2.0 Flash मॉडल, जिसे कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है
Gemini 1.5 Flash
gemini-1.5-flash
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ज़्यादा संख्या में और कम बुद्धिमत्ता वाले टास्क
Gemini 1.5 Pro
gemini-1.5-pro
ऑडियो, इमेज, वीडियो, और टेक्स्ट टेक्स्ट ऐसे जटिल काम जिनमें ज़्यादा बुद्धिमत्ता की ज़रूरत होती है
टेक्स्ट एम्बेड करना
text-embedding-004
टेक्स्ट टेक्स्ट एम्बेड करना टेक्स्ट स्ट्रिंग की आपस में मिलती-जुलती होने की डिग्री का आकलन करना

किराया तय करने की सीमाओं वाले पेज पर, हर मॉडल के लिए किराया तय करने की सीमाएं देखी जा सकती हैं.

Gemini 2.0 Flash

Gemini 2.0 Flash, अगली पीढ़ी की सुविधाओं और बेहतर सुविधाओं के साथ काम करता है. जैसे, बेहतर स्पीड, नेटिव टूल का इस्तेमाल, मल्टी-मोडल जनरेशन, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-2.0-flash
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

ऑडियो (जल्द ही उपलब्ध होगा), इमेज (जल्द ही उपलब्ध होगी), और टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

की सुविधाएं

स्ट्रक्चर्ड आउटपुट

काम करता है

कैश मेमोरी में सेव होना

जल्द आ रहा है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉल करना

काम करता है

कोड चलाना

काम करता है

खोजें

काम करता है

इमेज जनरेट करना

जल्द आ रहा है

नेटिव टूल का इस्तेमाल करना

काम करता है

ऑडियो जनरेट करना

जल्द आ रहा है

मल्टीमोडल लाइव एपीआई

जल्द आ रहा है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-2.0-flash
  • स्थिर: gemini-2.0-flash-001
का नया अपडेट फ़रवरी 2025
नॉलेज कटऑफ़ अगस्त 2024

Gemini 2.0 Flash-Lite की झलक

Gemini 2.0 Flash मॉडल, जिसे कम लागत और कम इंतज़ार के लिए ऑप्टिमाइज़ किया गया है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-2.0-flash-lite-preview-02-05
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

की सुविधाएं

स्ट्रक्चर्ड आउटपुट

काम करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉल करना

काम नहीं करता है

कोड चलाना

काम नहीं करता है

खोजें

काम नहीं करता है

इमेज जनरेट करना

काम नहीं करता है

नेटिव टूल का इस्तेमाल करना

काम नहीं करता है

ऑडियो जनरेट करना

काम नहीं करता है

मल्टीमोडल लाइव एपीआई

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-2.0-flash-lite-preview-02-05
का नया अपडेट फ़रवरी 2025
नॉलेज कटऑफ़ अगस्त 2024

Gemini 1.5 Flash

Gemini 1.5 Flash, अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर मल्टीमॉडल मॉडल है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा अवधि

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉल करना

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-flash-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-flash
  • स्थिर:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
का नया अपडेट सितंबर 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B एक छोटा मॉडल है, जिसे कम बुद्धिमत्ता वाले टास्क के लिए डिज़ाइन किया गया है.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-flash-8b
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

3,600

वीडियो की ज़्यादा से ज़्यादा अवधि

1 घंटा

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 9.5 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम करता है

फ़ंक्शन कॉल करना

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-flash-8b-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-flash-8b
  • स्थिर:
    • gemini-1.5-flash-8b-001
का नया अपडेट अक्टूबर 2024

Gemini 1.5 Pro

Gemini 1.5 Pro, एक मिड-साइज़ वाला मल्टीमोडल मॉडल है. इसे कई तरह के तर्क वाले टास्क के लिए ऑप्टिमाइज़ किया गया है. 1.5 Pro, एक साथ बहुत ज़्यादा डेटा प्रोसेस कर सकता है. जैसे, दो घंटे का वीडियो, 19 घंटे का ऑडियो, 60 हज़ार लाइनों वाला कोडबेस या 2,000 पेजों का टेक्स्ट.

Google AI Studio में आज़माएं

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/gemini-1.5-pro
के साथ काम करने वाले डेटा टाइप

इनपुट

ऑडियो, इमेज, वीडियो, और टेक्स्ट

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,097,152

आउटपुट टोकन की सीमा

8,192

ऑडियो/विज़ुअल की खास जानकारी

हर प्रॉम्प्ट के लिए इमेज की ज़्यादा से ज़्यादा संख्या

7,200

वीडियो की ज़्यादा से ज़्यादा अवधि

2 घंटे

ऑडियो की ज़्यादा से ज़्यादा अवधि

करीब 19 घंटे

की सुविधाएं

सिस्टम से जुड़े निर्देश

काम करता है

JSON मोड

काम करता है

JSON स्कीमा

काम करता है

सुरक्षा सेटिंग में बदलाव करना

काम करता है

कैश मेमोरी में सेव होना

काम करता है

ट्यून करना

काम नहीं करता है

फ़ंक्शन कॉल करना

काम करता है

कोड चलाना

काम करता है

दोतरफ़ा स्ट्रीमिंग

काम नहीं करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • नया: gemini-1.5-pro-latest
  • सबसे नया स्टेबल वर्शन: gemini-1.5-pro
  • स्थिर:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
का नया अपडेट सितंबर 2024

टेक्स्ट एम्बेड करना और एम्बेड करना

टेक्स्ट एम्बेड करना

टेक्स्ट एम्बेड का इस्तेमाल, स्ट्रिंग के बीच के संबंध को मेज़र करने के लिए किया जाता है. साथ ही, इनका इस्तेमाल कई एआई ऐप्लिकेशन में भी किया जाता है.

text-embedding-004, स्टैंडर्ड MTEB एम्बेडिंग मानदंडों पर, तुलना किए जा सकने वाले डाइमेंशन के साथ बेहतर तरीके से जानकारी को वापस लाता है और मौजूदा मॉडल की तुलना में बेहतर परफ़ॉर्म करता है.

मॉडल का विवरण
प्रॉपर्टी ब्यौरा
मॉडल कोड

Gemini API

models/text-embedding-004

के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट अप्रैल 2024

एम्बेड करना

इनपुट टेक्स्ट के लिए, टेक्स्ट एम्बेड जनरेट करने के लिए, एम्बेड मॉडल का इस्तेमाल किया जा सकता है.

एम्बेडिंग मॉडल को 2,048 टोकन तक के टेक्स्ट के लिए, 768 डाइमेंशन वाले एम्बेड बनाने के लिए ऑप्टिमाइज़ किया गया है.

मॉडल की जानकारी एम्बेड करना
प्रॉपर्टी ब्यौरा
मॉडल कोड models/embedding-001
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट एम्बेड करना

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

2,048

आउटपुट डाइमेंशन का साइज़

768

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम नहीं करता है
का नया अपडेट दिसंबर 2023

AQA

किसी दस्तावेज़, कॉर्पस या पैसेज के सेट पर, एट्रिब्यूट किए गए सवाल-जवाब (AQA) से जुड़े टास्क करने के लिए, AQA मॉडल का इस्तेमाल किया जा सकता है. AQA मॉडल, दिए गए सोर्स के आधार पर सवालों के जवाब देता है. साथ ही, जवाब मिलने की संभावना का अनुमान भी लगाता है.

मॉडल का विवरण

प्रॉपर्टी ब्यौरा
मॉडल कोड models/aqa
के साथ काम करने वाले डेटा टाइप

इनपुट

टेक्स्ट

आउटपुट

टेक्स्ट

इस्तेमाल की जा सकने वाली भाषा अंग्रेज़ी
टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

7,168

आउटपुट टोकन की सीमा

1,024

रेट की सीमाएं[**] हर मिनट 1,500 अनुरोध
सुरक्षा से जुड़ी सेटिंग में बदलाव किया जा सकता है काम करता है
का नया अपडेट दिसंबर 2023

मॉडल के इन वैरिएशन की सुविधाओं के बारे में जानने के लिए, उदाहरण देखें.

[*] Gemini मॉडल के लिए, एक टोकन चार वर्णों के बराबर होता है. 100 टोकन, अंग्रेज़ी के करीब 60 से 80 शब्दों के बराबर होते हैं.

मॉडल के वर्शन के नाम के पैटर्न

Gemini मॉडल, झलक या स्टैबल वर्शन में उपलब्ध हैं. कोड में, मॉडल के नाम के इनमें से किसी एक फ़ॉर्मैट का इस्तेमाल करके यह बताया जा सकता है कि आपको किस मॉडल और वर्शन का इस्तेमाल करना है.

  • नया वर्शन: यह किसी खास जनरेशन और वैरिएशन के लिए, मॉडल के सबसे नए वर्शन की जानकारी देता है. मॉडल को नियमित तौर पर अपडेट किया जाता है. यह झलक वाला वर्शन हो सकता है. सिर्फ़ एक्सप्लोरेटिव टेस्टिंग ऐप्लिकेशन और प्रोटोटाइप के लिए, इस उपनाम का इस्तेमाल किया जाना चाहिए.

    सबसे नए वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-latest. उदाहरण के लिए, gemini-1.0-pro-latest.

  • सबसे नया स्टेबल वर्शन: यह किसी मॉडल जनरेशन और वैरिएशन के लिए रिलीज़ किए गए सबसे नए स्टेबल वर्शन की जानकारी देता है.

    सबसे नए स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>. उदाहरण के लिए, gemini-1.0-pro.

  • स्टैबल: किसी खास स्टैबल मॉडल की जानकारी देता है. स्टेबल मॉडल में बदलाव नहीं होता. ज़्यादातर प्रोडक्शन ऐप्लिकेशन को किसी खास स्टेबल मॉडल का इस्तेमाल करना चाहिए.

    स्टेबल वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-1.0-pro-001.

  • एक्सपेरिमेंट के तौर पर उपलब्ध: शर्तों में बताए गए मुताबिक, यह झलक में उपलब्ध एक्सपेरिमेंटल मॉडल की जानकारी देता है. इसका मतलब है कि इसे प्रोडक्शन में इस्तेमाल नहीं किया जा सकता. हम एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल रिलीज़ करते हैं, ताकि हमें सुझाव, राय या शिकायत मिल सके. साथ ही, डेवलपर को हमारे नए अपडेट जल्दी मिल सकें और Google में हो रहे इनोवेशन के बारे में जानकारी मिल सके. एक्सपेरिमेंट के तौर पर लॉन्च करने से, हमें यह जानकारी मिलती है कि इन्हें सभी लोगों के लिए कैसे उपलब्ध कराया जा सकता है. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल को, पहले से सूचना दिए बिना किसी दूसरे मॉडल से बदला जा सकता है. हम इस बात की गारंटी नहीं देते कि एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल, आने वाले समय में स्थिर मॉडल बन जाएगा.

    एक्सपेरिमेंट के लिए बने वर्शन की जानकारी देने के लिए, इस पैटर्न का इस्तेमाल करें: <model>-<generation>-<variation>-<version>. उदाहरण के लिए, gemini-exp-1121.

उपलब्ध भाषाएं

Gemini मॉडल को इन भाषाओं के साथ काम करने के लिए ट्रेन किया गया है:

  • ऐरेबिक (ar)
  • बांग्ला (bn)
  • बुल्गेरियन (bg)
  • चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh)
  • क्रोएशियन (hr)
  • चेक (cs)
  • डेनिश (da)
  • डच (nl)
  • अंग्रेज़ी (en)
  • एस्टोनियन (et)
  • फ़िनिश (fi)
  • फ़्रेंच (fr)
  • जर्मन (de)
  • ग्रीक (el)
  • हिब्रू (iw)
  • हिन्दी (hi)
  • हंगेरियन (hu)
  • इंडोनेशियन (id)
  • इटैलियन (it)
  • जैपनीज़ (ja)
  • कोरियन (ko)
  • लैटवियन (lv)
  • लिथुएनियन (lt)
  • नॉर्वीजन (no)
  • पोलिश (pl)
  • पॉर्चुगीज़ (pt)
  • रोमेनियन (ro)
  • रशियन (ru)
  • सर्बियाई (sr)
  • स्लोवाक (sk)
  • स्लोवेनियन (sl)
  • स्पैनिश (es)
  • स्वाहिली (sw)
  • स्वीडिश (sv)
  • थाई (th)
  • तुर्किश (tr)
  • यूक्रेनियन (uk)
  • वियतनामीज़ (vi)