मॉडल एंडपॉइंट की मदद से, प्रोग्राम के हिसाब से उपलब्ध मॉडल की सूची बनाई जा सकती है. साथ ही, ज़्यादा मेटाडेटा भी पाया जा सकता है. जैसे, काम करने वाली सुविधा और कॉन्टेक्स्ट विंडो का साइज़. ज़्यादा जानने के लिए, मॉडल गाइड पढ़ें.
तरीका: models.get
यह किसी खास Model
के बारे में जानकारी देता है. जैसे, वर्शन नंबर, टोकन की सीमाएं, पैरामीटर, और अन्य मेटाडेटा. मॉडल के बारे में ज़्यादा जानकारी के लिए, Gemini मॉडल की गाइड देखें.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=models /*}
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल के संसाधन का नाम.
यह नाम, models.list
तरीके से मिले मॉडल के नाम से मेल खाना चाहिए.
फ़ॉर्मैट: models/{model}
यह models/{model}
के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
शुरू करें
शेल
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में Model
का एक इंस्टेंस शामिल किया जाता है.
तरीका: models.list
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
Gemini API के ज़रिए उपलब्ध Model
s की सूची दिखाता है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /models
क्वेरी पैरामीटर
pageSize
integer
हर पेज पर, ज़्यादा से ज़्यादा Models
आइटम दिखाए जा सकते हैं.
अगर इसे तय नहीं किया गया है, तो हर पेज पर 50 मॉडल दिखेंगे. इस तरीके से, हर पेज पर ज़्यादा से ज़्यादा 1,000 मॉडल दिखते हैं. भले ही, आपने pageSize की ज़्यादा वैल्यू पास की हो.
pageToken
string
यह एक पेज टोकन है, जो पिछले models.list
कॉल से मिला था.
अगले पेज को वापस पाने के लिए, एक अनुरोध से मिले pageToken
को अगले अनुरोध के लिए आर्ग्युमेंट के तौर पर दें.
पेज नंबर के हिसाब से नतीजे दिखाने के दौरान, models.list
को दिए गए अन्य सभी पैरामीटर, पेज टोकन देने वाले कॉल से मेल खाने चाहिए.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
शुरू करें
शेल
जवाब का मुख्य भाग
ListModel
से मिला जवाब, जिसमें मॉडल की पेज के हिसाब से बांटी गई सूची होती है.
अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.
models[]
object (Model
)
लौटाए गए मॉडल.
nextPageToken
string
यह एक टोकन है. इसका इस्तेमाल अगले पेज को वापस पाने के लिए, pageToken
के तौर पर किया जा सकता है.
अगर इस फ़ील्ड को शामिल नहीं किया जाता है, तो इसका मतलब है कि कोई और पेज नहीं है.
JSON के काेड में दिखाना |
---|
{
"models": [
{
object ( |
REST रिसॉर्स: models
संसाधन: मॉडल
जनरेटिव लैंग्वेज मॉडल के बारे में जानकारी.
name
string
ज़रूरी है. Model
के संसाधन का नाम. अनुमति वाली सभी वैल्यू के लिए, मॉडल के वैरिएंट देखें.
फ़ॉर्मैट: models/{model}
, जिसमें {model}
के नाम रखने का तरीका यह है:
- "{baseModelId}-{version}"
उदाहरण:
models/gemini-1.5-flash-001
baseModelId
string
ज़रूरी है. बेस मॉडल का नाम. इसे जनरेशन के अनुरोध में पास करें.
उदाहरण:
gemini-1.5-flash
version
string
ज़रूरी है. मॉडल का वर्शन नंबर.
यह मेजर वर्शन (1.0
या 1.5
) दिखाता है
displayName
string
मॉडल का ऐसा नाम जिसे आसानी से पढ़ा जा सकता है. उदाहरण के लिए, "Gemini 1.5 Flash".
नाम में ज़्यादा से ज़्यादा 128 वर्ण हो सकते हैं. साथ ही, इसमें UTF-8 फ़ॉर्मैट वाले कोई भी वर्ण शामिल किए जा सकते हैं.
description
string
मॉडल के बारे में कम शब्दों में जानकारी.
inputTokenLimit
integer
इस मॉडल के लिए, ज़्यादा से ज़्यादा इतने इनपुट टोकन इस्तेमाल किए जा सकते हैं.
outputTokenLimit
integer
इस मॉडल के लिए, आउटपुट टोकन की ज़्यादा से ज़्यादा संख्या उपलब्ध है.
supportedGenerationMethods[]
string
मॉडल के साथ काम करने वाले जनरेशन के तरीके.
एपीआई के तरीके के नाम, पास्कल केस स्ट्रिंग के तौर पर तय किए जाते हैं. जैसे, generateMessage
और generateContent
.
thinking
boolean
मॉडल में सोचने की क्षमता है या नहीं.
temperature
number
इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,maxTemperature]
तक हो सकती हैं. वैल्यू जितनी ज़्यादा होगी, जवाब उतने ही अलग-अलग होंगे. वहीं, वैल्यू 0.0
के आस-पास होने पर, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
maxTemperature
number
यह मॉडल ज़्यादा से ज़्यादा कितने तापमान का इस्तेमाल कर सकता है.
topP
number
न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को चुना जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP
होता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
topK
integer
टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है. अगर यह खाली है, तो इसका मतलब है कि मॉडल, टॉप-के सैंपलिंग का इस्तेमाल नहीं करता है. साथ ही, जनरेशन पैरामीटर के तौर पर topK
का इस्तेमाल नहीं किया जा सकता.
JSON के काेड में दिखाना |
---|
{ "name": string, "baseModelId": string, "version": string, "displayName": string, "description": string, "inputTokenLimit": integer, "outputTokenLimit": integer, "supportedGenerationMethods": [ string ], "thinking": boolean, "temperature": number, "maxTemperature": number, "topP": number, "topK": integer } |
तरीका: models.predict
यह कुकी, अनुमान लगाने के अनुरोध को पूरा करती है.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:predict
पाथ पैरामीटर
model
string
ज़रूरी है. अनुमान के लिए मॉडल का नाम. फ़ॉर्मैट: name=models/{model}
. यह models/{model}
के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में, इस स्ट्रक्चर का डेटा शामिल होता है:
instances[]
value (Value
format)
ज़रूरी है. वे इंस्टेंस जो अनुमान लगाने के लिए किए गए कॉल के इनपुट होते हैं.
parameters
value (Value
format)
ज़रूरी नहीं. ये पैरामीटर, अनुमान लगाने के लिए किए जाने वाले कॉल को कंट्रोल करते हैं.
जवाब का मुख्य भाग
[PredictionService.Predict] के लिए जवाब का मैसेज.
अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.
predictions[]
value (Value
format)
पूर्वानुमान लगाने वाले कॉल के आउटपुट.
JSON के काेड में दिखाना |
---|
{ "predictions": [ value ] } |
तरीका: models.predictLongRunning
यह models.predict की तरह ही है, लेकिन यह LRO दिखाता है.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:predictLongRunning
पाथ पैरामीटर
model
string
ज़रूरी है. अनुमान के लिए मॉडल का नाम. फ़ॉर्मैट: name=models/{model}
.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में, इस स्ट्रक्चर का डेटा शामिल होता है:
instances[]
value (Value
format)
ज़रूरी है. वे इंस्टेंस जो अनुमान लगाने के लिए किए गए कॉल के इनपुट होते हैं.
parameters
value (Value
format)
ज़रूरी नहीं. ये पैरामीटर, अनुमान लगाने के लिए किए जाने वाले कॉल को कंट्रोल करते हैं.
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में Operation
का एक इंस्टेंस शामिल किया जाता है.