লাইভ API হল একটি স্টেটফুল API যা WebSockets ব্যবহার করে। এই বিভাগে, আপনি WebSockets API সম্পর্কিত অতিরিক্ত বিবরণ পাবেন।
সেশন
একটি WebSocket সংযোগ ক্লায়েন্ট এবং জেমিনি সার্ভারের মধ্যে একটি সেশন স্থাপন করে। একটি ক্লায়েন্ট একটি নতুন সংযোগ শুরু করার পরে সেশনটি সার্ভারের সাথে বার্তা বিনিময় করতে পারে:
- Gemini সার্ভারে পাঠ্য, অডিও বা ভিডিও পাঠান।
- Gemini সার্ভার থেকে অডিও, টেক্সট, বা ফাংশন কল অনুরোধ গ্রহণ করুন।
ওয়েবসকেট সংযোগ
একটি সেশন শুরু করতে, এই ওয়েবসকেট এন্ডপয়েন্টের সাথে সংযোগ করুন:
wss://generativelanguage.googleapis.com/ws/google.ai.generativelanguage.v1beta.GenerativeService.BidiGenerateContent
সেশন কনফিগারেশন
সংযোগের পরে প্রাথমিক বার্তাটি সেশন কনফিগারেশন সেট করে, যার মধ্যে মডেল, প্রজন্মের পরামিতি, সিস্টেম নির্দেশাবলী এবং সরঞ্জাম রয়েছে।
আপনি অধিবেশন চলাকালীন মডেল ছাড়া কনফিগারেশন পরামিতি পরিবর্তন করতে পারেন.
নিম্নলিখিত উদাহরণ কনফিগারেশন দেখুন. মনে রাখবেন যে SDK-তে নামের আবরণ পরিবর্তিত হতে পারে। আপনি এখানে পাইথন SDK কনফিগারেশন বিকল্পগুলি দেখতে পারেন।
{
"model": string,
"generationConfig": {
"candidateCount": integer,
"maxOutputTokens": integer,
"temperature": number,
"topP": number,
"topK": integer,
"presencePenalty": number,
"frequencyPenalty": number,
"responseModalities": [string],
"speechConfig": object,
"mediaResolution": object
},
"systemInstruction": string,
"tools": [object]
}
API ক্ষেত্রে আরো তথ্যের জন্য, GenerationConfig দেখুন।
বার্তা পাঠান
WebSocket সংযোগের মাধ্যমে বার্তা বিনিময় করতে, ক্লায়েন্টকে অবশ্যই একটি খোলা WebSocket সংযোগের মাধ্যমে একটি JSON অবজেক্ট পাঠাতে হবে। JSON অবজেক্টে নিম্নলিখিত অবজেক্ট সেট থেকে ঠিক একটি ক্ষেত্র থাকতে হবে:
{
"setup": BidiGenerateContentSetup,
"clientContent": BidiGenerateContentClientContent,
"realtimeInput": BidiGenerateContentRealtimeInput,
"toolResponse": BidiGenerateContentToolResponse
}
সমর্থিত ক্লায়েন্ট বার্তা
নিম্নলিখিত টেবিলে সমর্থিত ক্লায়েন্ট বার্তাগুলি দেখুন:
বার্তা | বর্ণনা |
---|---|
BidiGenerateContentSetup | প্রথম বার্তায় সেশন কনফিগারেশন পাঠাতে হবে |
BidiGenerateContentClientContent | ক্লায়েন্ট থেকে বিতরণ করা বর্তমান কথোপকথনের ক্রমবর্ধমান বিষয়বস্তু আপডেট |
BidiGenerateContentRealtimeInput | রিয়েল টাইম অডিও, ভিডিও বা টেক্সট ইনপুট |
BidiGenerateContentToolResponse | সার্ভার থেকে প্রাপ্ত একটি ToolCallMessage এর প্রতিক্রিয়া |
বার্তা গ্রহণ
Gemini থেকে বার্তা পেতে, WebSocket 'বার্তা' ইভেন্টের জন্য শুনুন, এবং তারপর সমর্থিত সার্ভার বার্তাগুলির সংজ্ঞা অনুযায়ী ফলাফল পার্স করুন৷
নিম্নলিখিত দেখুন:
async with client.aio.live.connect(model='...', config=config) as session:
await session.send(input='Hello world!', end_of_turn=True)
async for message in session.receive():
print(message)
সার্ভারের বার্তাগুলির একটি usageMetadata
ক্ষেত্র থাকতে পারে কিন্তু অন্যথায় BidiGenerateContentServerMessage
বার্তা থেকে অন্য ক্ষেত্রগুলির মধ্যে একটিকে অন্তর্ভুক্ত করবে। ( messageType
ইউনিয়ন JSON-এ প্রকাশ করা হয়নি তাই ক্ষেত্রটি বার্তার শীর্ষ-স্তরে প্রদর্শিত হবে।)
বার্তা এবং ঘটনা
কার্যকলাপ শেষ
এই ধরনের কোন ক্ষেত্র আছে.
ব্যবহারকারীর কার্যকলাপের সমাপ্তি চিহ্নিত করে।
অ্যাক্টিভিটি হ্যান্ডলিং
ব্যবহারকারী কার্যকলাপ পরিচালনার বিভিন্ন উপায়.
Enums | |
---|---|
ACTIVITY_HANDLING_UNSPECIFIED | অনির্দিষ্ট থাকলে, ডিফল্ট আচরণ হল START_OF_ACTIVITY_INTERRUPTS । |
START_OF_ACTIVITY_INTERRUPTS | সত্য হলে, ক্রিয়াকলাপের শুরু মডেলের প্রতিক্রিয়াকে বাধা দেবে (একে "বার্জ ইন"ও বলা হয়)। মডেলের বর্তমান প্রতিক্রিয়া বাধার মুহুর্তে কেটে যাবে। এটি ডিফল্ট আচরণ। |
NO_INTERRUPTION | মডেলের প্রতিক্রিয়া বাধাগ্রস্ত হবে না। |
কার্যকলাপ শুরু
এই ধরনের কোন ক্ষেত্র আছে.
ব্যবহারকারীর কার্যকলাপের শুরু চিহ্নিত করে।
অডিও ট্রান্সক্রিপশন কনফিগারেশন
এই ধরনের কোন ক্ষেত্র আছে.
অডিও ট্রান্সক্রিপশন কনফিগারেশন।
স্বয়ংক্রিয় কার্যকলাপ সনাক্তকরণ
কার্যকলাপের স্বয়ংক্রিয় সনাক্তকরণ কনফিগার করে।
ক্ষেত্র | |
---|---|
disabled | ঐচ্ছিক। যদি সক্রিয় থাকে (ডিফল্ট), শনাক্ত করা ভয়েস এবং টেক্সট ইনপুট কার্যকলাপ হিসাবে গণনা। অক্ষম হলে, ক্লায়েন্টকে অবশ্যই কার্যকলাপ সংকেত পাঠাতে হবে। |
startOfSpeechSensitivity | ঐচ্ছিক। বক্তৃতা সনাক্ত করার সম্ভাবনা কতটা নির্ধারণ করে। |
prefixPaddingMs | ঐচ্ছিক। বক্তৃতা শুরু হওয়ার আগে শনাক্ত করা বক্তৃতার প্রয়োজনীয় সময়কাল। এই মান যত কম হবে, বক্তৃতা শনাক্তকরণ তত বেশি সংবেদনশীল হবে এবং সংক্ষিপ্ত বক্তৃতা স্বীকৃত হবে। যাইহোক, এটি মিথ্যা ইতিবাচক সম্ভাবনা বৃদ্ধি করে। |
endOfSpeechSensitivity | ঐচ্ছিক। শনাক্ত করা বক্তৃতা শেষ হওয়ার সম্ভাবনা কতটা নির্ধারণ করে। |
silenceDurationMs | ঐচ্ছিক। বক্তৃতা শেষ হওয়ার আগে শনাক্ত করা নন-স্পিচের প্রয়োজনীয় সময়কাল (যেমন নীরবতা)। এই মানটি যত বড় হবে, ব্যবহারকারীর কার্যকলাপে বাধা না দিয়ে স্পিচ গ্যাপ তত বেশি হতে পারে কিন্তু এটি মডেলের লেটেন্সি বাড়িয়ে দেবে। |
বিডিজেনারেট কনটেন্ট ক্লায়েন্ট কনটেন্ট
ক্লায়েন্ট থেকে বিতরণ করা বর্তমান কথোপকথনের ক্রমবর্ধমান আপডেট। এখানে সমস্ত বিষয়বস্তু নিঃশর্তভাবে কথোপকথনের ইতিহাসে যুক্ত করা হয়েছে এবং সামগ্রী তৈরি করার জন্য মডেলের প্রম্পটের অংশ হিসাবে ব্যবহার করা হয়েছে।
এখানে একটি বার্তা যেকোনো বর্তমান মডেল প্রজন্মকে বাধাগ্রস্ত করবে।
ক্ষেত্র | |
---|---|
turns[] | ঐচ্ছিক। মডেলের সাথে বর্তমান কথোপকথনের সাথে বিষয়বস্তু যুক্ত করা হয়েছে। একক-পালা প্রশ্নের জন্য, এটি একটি একক উদাহরণ। মাল্টি-টার্ন কোয়েরির জন্য, এটি একটি পুনরাবৃত্ত ক্ষেত্র যাতে কথোপকথনের ইতিহাস এবং সর্বশেষ অনুরোধ রয়েছে। |
turnComplete | ঐচ্ছিক। সত্য হলে, নির্দেশ করে যে সার্ভারের বিষয়বস্তু তৈরি করা বর্তমানে জমা হওয়া প্রম্পট দিয়ে শুরু করা উচিত। অন্যথায়, সার্ভার প্রজন্ম শুরু করার আগে অতিরিক্ত বার্তার জন্য অপেক্ষা করে। |
বিডিজেনারেট কনটেন্ট রিয়েলটাইম ইনপুট
ব্যবহারকারীর ইনপুট যা রিয়েল টাইমে পাঠানো হয়।
বিভিন্ন পদ্ধতি (অডিও, ভিডিও এবং পাঠ্য) সমসাময়িক স্ট্রীম হিসাবে পরিচালনা করা হয়। এই স্ট্রীম জুড়ে অর্ডার নিশ্চিত করা হয় না.
এটি BidiGenerateContentClientContent
থেকে কয়েকটি উপায়ে আলাদা:
- মডেল জেনারেশনে কোনো বাধা ছাড়াই ক্রমাগত পাঠানো যেতে পারে।
-
BidiGenerateContentClientContent
এবংBidiGenerateContentRealtimeInput
জুড়ে আন্তঃলিপ্ত ডেটা মিশ্রিত করার প্রয়োজন হলে, সার্ভারটি সর্বোত্তম প্রতিক্রিয়ার জন্য অপ্টিমাইজ করার চেষ্টা করে, কিন্তু কোন গ্যারান্টি নেই। - টার্নের শেষ স্পষ্টভাবে নির্দিষ্ট করা হয়নি, বরং ব্যবহারকারীর কার্যকলাপ থেকে উদ্ভূত হয়েছে (উদাহরণস্বরূপ, বক্তৃতার শেষ)।
- এমনকি পালা শেষ হওয়ার আগে, মডেল থেকে প্রতিক্রিয়া দ্রুত শুরু করার জন্য অপ্টিমাইজ করার জন্য ডেটা ক্রমবর্ধমানভাবে প্রক্রিয়া করা হয়।
ক্ষেত্র | |
---|---|
mediaChunks[] | ঐচ্ছিক। মিডিয়া ইনপুটের জন্য ইনলাইন বাইট ডেটা। একাধিক অপ্রচলিত: পরিবর্তে |
audio | ঐচ্ছিক। এগুলো রিয়েলটাইম অডিও ইনপুট স্ট্রীম গঠন করে। |
video | ঐচ্ছিক। এগুলো রিয়েলটাইম ভিডিও ইনপুট স্ট্রীম গঠন করে। |
activityStart | ঐচ্ছিক। ব্যবহারকারীর কার্যকলাপের শুরু চিহ্নিত করে। স্বয়ংক্রিয় (অর্থাৎ সার্ভার-সাইড) কার্যকলাপ সনাক্তকরণ অক্ষম থাকলেই এটি পাঠানো যেতে পারে। |
activityEnd | ঐচ্ছিক। ব্যবহারকারীর কার্যকলাপের সমাপ্তি চিহ্নিত করে। স্বয়ংক্রিয় (অর্থাৎ সার্ভার-সাইড) কার্যকলাপ সনাক্তকরণ অক্ষম থাকলেই এটি পাঠানো যেতে পারে। |
audioStreamEnd | ঐচ্ছিক। ইঙ্গিত করে যে অডিও স্ট্রীম শেষ হয়েছে, যেমন মাইক্রোফোন বন্ধ করা হয়েছে। এটি শুধুমাত্র তখনই পাঠানো উচিত যখন স্বয়ংক্রিয় কার্যকলাপ সনাক্তকরণ সক্ষম করা হয় (যা ডিফল্ট)। ক্লায়েন্ট একটি অডিও বার্তা পাঠিয়ে স্ট্রিমটি পুনরায় খুলতে পারে। |
text | ঐচ্ছিক। এগুলো রিয়েলটাইম টেক্সট ইনপুট স্ট্রীম গঠন করে। |
বিডিজেনারেট কনটেন্ট সার্ভার কন্টেন্ট
ক্লায়েন্ট বার্তাগুলির প্রতিক্রিয়া হিসাবে মডেল দ্বারা উত্পন্ন ক্রমবর্ধমান সার্ভার আপডেট৷
বিষয়বস্তু যত তাড়াতাড়ি সম্ভব তৈরি করা হয়, এবং বাস্তব সময়ে নয়। ক্লায়েন্টরা বাফার করতে এবং রিয়েল টাইমে এটি চালাতে বেছে নিতে পারে।
ক্ষেত্র | |
---|---|
generationComplete | শুধুমাত্র আউটপুট। সত্য হলে, নির্দেশ করে যে মডেলটি তৈরি করা হয়েছে। জেনারেট করার সময় যখন মডেল বাধাপ্রাপ্ত হয় তখন বাধাপ্রাপ্ত টার্নে কোনো 'generation_complete' বার্তা থাকবে না, এটি 'interrupted > turn_complete'-এর মধ্য দিয়ে যাবে। যখন মডেল রিয়েলটাইম প্লেব্যাক অনুমান করে তখন জেনারেশন_কমপ্লিট এবং টার্ন_কমপ্লিটের মধ্যে বিলম্ব হবে যা মডেল প্লেব্যাক শেষ হওয়ার জন্য অপেক্ষা করার কারণে হয়। |
turnComplete | শুধুমাত্র আউটপুট। সত্য হলে, নির্দেশ করে যে মডেলটি তার পালা সম্পন্ন করেছে। জেনারেশন শুধুমাত্র অতিরিক্ত ক্লায়েন্ট বার্তার প্রতিক্রিয়ায় শুরু হবে। |
interrupted | শুধুমাত্র আউটপুট। সত্য হলে, নির্দেশ করে যে একটি ক্লায়েন্ট বার্তা বর্তমান মডেল তৈরিতে বাধা দিয়েছে। যদি ক্লায়েন্ট রিয়েল টাইমে বিষয়বস্তু চালায়, তাহলে বর্তমান প্লেব্যাক সারি বন্ধ এবং খালি করার জন্য এটি একটি ভাল সংকেত। |
groundingMetadata | শুধুমাত্র আউটপুট। জেনারেট করা সামগ্রীর জন্য গ্রাউন্ডিং মেটাডেটা। |
outputTranscription | শুধুমাত্র আউটপুট। আউটপুট অডিও প্রতিলিপি. ট্রান্সক্রিপশনটি অন্যান্য সার্ভারের বার্তাগুলির থেকে স্বাধীনভাবে পাঠানো হয় এবং কোনও গ্যারান্টিযুক্ত অর্ডার নেই, বিশেষ করে |
modelTurn | শুধুমাত্র আউটপুট। ব্যবহারকারীর সাথে বর্তমান কথোপকথনের অংশ হিসাবে মডেলটি যে সামগ্রী তৈরি করেছে৷ |
বিডিজেনারেট কনটেন্ট সার্ভার মেসেজ
BidiGenerateContent কলের জন্য প্রতিক্রিয়া বার্তা।
ক্ষেত্র | |
---|---|
usageMetadata | শুধুমাত্র আউটপুট। প্রতিক্রিয়া(গুলি) সম্পর্কে মেটাডেটা ব্যবহার করুন। |
ইউনিয়ন ক্ষেত্রের messageType । বার্তার ধরন। messageType নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: | |
setupComplete | শুধুমাত্র আউটপুট। সেটআপ সম্পূর্ণ হলে ক্লায়েন্টের কাছ থেকে একটি |
serverContent | শুধুমাত্র আউটপুট। ক্লায়েন্ট বার্তার প্রতিক্রিয়ায় মডেল দ্বারা উত্পন্ন সামগ্রী। |
toolCall | শুধুমাত্র আউটপুট। ক্লায়েন্টকে |
toolCallCancellation | শুধুমাত্র আউটপুট। ক্লায়েন্টের জন্য বিজ্ঞপ্তি যে নির্দিষ্ট |
goAway | শুধুমাত্র আউটপুট। একটি বিজ্ঞপ্তি যে সার্ভারটি শীঘ্রই সংযোগ বিচ্ছিন্ন হবে৷ |
sessionResumptionUpdate | শুধুমাত্র আউটপুট। সেশন পুনঃসূচনা অবস্থার আপডেট। |
বিডিজেনারেট কনটেন্ট সেটআপ
বার্তা পাঠানো হবে প্রথম (এবং শুধুমাত্র প্রথমটিতে) BidiGenerateContentClientMessage
। কনফিগারেশন রয়েছে যা স্ট্রিমিং RPC সময়কালের জন্য প্রযোজ্য হবে।
কোনো অতিরিক্ত বার্তা পাঠানোর আগে গ্রাহকদের একটি BidiGenerateContentSetupComplete
বার্তার জন্য অপেক্ষা করা উচিত।
ক্ষেত্র | |
---|---|
model | প্রয়োজন। মডেলের সম্পদের নাম। এটি মডেল ব্যবহার করার জন্য একটি আইডি হিসাবে কাজ করে। বিন্যাস: |
generationConfig | ঐচ্ছিক। জেনারেশন কনফিগারেশন। নিম্নলিখিত ক্ষেত্র সমর্থিত নয়:
|
systemInstruction | ঐচ্ছিক। ব্যবহারকারী মডেলের জন্য সিস্টেম নির্দেশাবলী প্রদান করেছে। দ্রষ্টব্য: অংশগুলিতে শুধুমাত্র পাঠ্য ব্যবহার করা উচিত এবং প্রতিটি অংশের বিষয়বস্তু একটি পৃথক অনুচ্ছেদে থাকবে। |
tools[] | ঐচ্ছিক। পরবর্তী প্রতিক্রিয়া তৈরি করতে মডেলটি ব্যবহার করতে পারে একটি |
realtimeInputConfig | ঐচ্ছিক। রিয়েলটাইম ইনপুটের হ্যান্ডলিং কনফিগার করে। |
sessionResumption | ঐচ্ছিক। সেশন পুনরায় শুরু করার প্রক্রিয়া কনফিগার করে। অন্তর্ভুক্ত করা হলে, সার্ভার |
contextWindowCompression | ঐচ্ছিক। একটি প্রসঙ্গ উইন্ডো কম্প্রেশন মেকানিজম কনফিগার করে। যদি অন্তর্ভুক্ত করা হয়, সার্ভার স্বয়ংক্রিয়ভাবে প্রসঙ্গটির আকার কমাবে যখন এটি কনফিগার করা দৈর্ঘ্য অতিক্রম করে। |
outputAudioTranscription | ঐচ্ছিক। সেট করা থাকলে, মডেলের অডিও আউটপুটের ট্রান্সক্রিপশন সক্ষম করে। ট্রান্সক্রিপশনটি কনফিগার করা থাকলে আউটপুট অডিওর জন্য নির্দিষ্ট করা ভাষা কোডের সাথে সারিবদ্ধ হয়। |
বিডি জেনারেট কনটেন্ট সেটআপ সম্পূর্ণ
এই ধরনের কোন ক্ষেত্র আছে.
ক্লায়েন্টের কাছ থেকে একটি BidiGenerateContentSetup
বার্তার জবাবে পাঠানো হয়েছে।
বিডিজেনারেট কনটেন্ট টুলকল
ক্লায়েন্টকে functionCalls
চালানোর জন্য অনুরোধ করুন এবং ম্যাচিং id
সাথে প্রতিক্রিয়াগুলি ফেরত দিন।
ক্ষেত্র | |
---|---|
functionCalls[] | শুধুমাত্র আউটপুট। ফাংশন কল নির্বাহ করা হবে. |
BidiGenerateContentToolCallCancellation
ক্লায়েন্টের জন্য বিজ্ঞপ্তি যে নির্দিষ্ট id
সহ পূর্বে জারি করা ToolCallMessage
কার্যকর করা উচিত নয় এবং বাতিল করা উচিত। যদি সেই টুল কলগুলির পার্শ্বপ্রতিক্রিয়া থাকে, তাহলে ক্লায়েন্টরা টুল কলগুলি পূর্বাবস্থায় ফেরানোর চেষ্টা করতে পারে। এই বার্তাটি কেবলমাত্র সেই ক্ষেত্রেই ঘটে যেখানে ক্লায়েন্টরা সার্ভারে বাধা দেয়।
ক্ষেত্র | |
---|---|
ids[] | শুধুমাত্র আউটপুট। টুলের আইডি বাতিল করতে হবে। |
বিডিজেনারেট কনটেন্ট টুল রেসপন্স
ক্লায়েন্ট সার্ভার থেকে প্রাপ্ত একটি ToolCall
প্রতিক্রিয়া তৈরি করেছে। স্বতন্ত্র FunctionResponse
অবজেক্টগুলি id
ফিল্ড দ্বারা সংশ্লিষ্ট FunctionCall
অবজেক্টের সাথে মিলে যায়।
উল্লেখ্য যে ইউনারি এবং সার্ভার-স্ট্রিমিং GenerateContent API-এ ফাংশন কলিং হয় Content
অংশ বিনিময়ের মাধ্যমে, যখন বিডিতে GenerateContent APIs ফাংশন কলিং এই উত্সর্গীকৃত বার্তাগুলির উপর ঘটে।
ক্ষেত্র | |
---|---|
functionResponses[] | ঐচ্ছিক। ফাংশন কল প্রতিক্রিয়া. |
বিডিজেনারেট কনটেন্ট ট্রান্সক্রিপশন
অডিওর ট্রান্সক্রিপশন (ইনপুট বা আউটপুট)।
ক্ষেত্র | |
---|---|
text | প্রতিলিপি পাঠ্য। |
ContextWindowCompressionConfig
প্রসঙ্গ উইন্ডো কম্প্রেশন সক্ষম করে — মডেলের প্রসঙ্গ উইন্ডো পরিচালনা করার জন্য একটি প্রক্রিয়া যাতে এটি একটি প্রদত্ত দৈর্ঘ্য অতিক্রম না করে।
ক্ষেত্র | |
---|---|
ইউনিয়ন ফিল্ড compressionMechanism । প্রসঙ্গ উইন্ডো কম্প্রেশন প্রক্রিয়া ব্যবহৃত. compressionMechanism নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: | |
slidingWindow | একটি স্লাইডিং-উইন্ডো মেকানিজম। |
triggerTokens | একটি প্রসঙ্গ উইন্ডো কম্প্রেশন ট্রিগার করার জন্য প্রয়োজনীয় টোকেনের সংখ্যা (একটি পালা চালানোর আগে)। এটি লেটেন্সির বিরুদ্ধে মানের ভারসাম্য রাখতে ব্যবহার করা যেতে পারে কারণ ছোট প্রসঙ্গ উইন্ডোর ফলে দ্রুত মডেল প্রতিক্রিয়া হতে পারে। যাইহোক, যেকোনো কম্প্রেশন অপারেশন সাময়িক লেটেন্সি বৃদ্ধির কারণ হবে, তাই তাদের ঘন ঘন ট্রিগার করা উচিত নয়। সেট না থাকলে, মডেলের প্রসঙ্গ উইন্ডো সীমার 80% ডিফল্ট। এটি পরবর্তী ব্যবহারকারীর অনুরোধ/মডেল প্রতিক্রিয়ার জন্য 20% ছেড়ে দেয়। |
শেষ সংবেদনশীলতা
বক্তৃতার শেষ কিভাবে সনাক্ত করা হয় তা নির্ধারণ করে।
Enums | |
---|---|
END_SENSITIVITY_UNSPECIFIED | ডিফল্ট হল END_SENSITIVITY_HIGH৷ |
END_SENSITIVITY_HIGH | স্বয়ংক্রিয় সনাক্তকরণ প্রায়শই বক্তৃতা শেষ করে। |
END_SENSITIVITY_LOW | স্বয়ংক্রিয় সনাক্তকরণ কম প্রায়ই বক্তৃতা শেষ করে। |
GoAway
একটি বিজ্ঞপ্তি যে সার্ভারটি শীঘ্রই সংযোগ বিচ্ছিন্ন হবে৷
ক্ষেত্র | |
---|---|
timeLeft | সংযোগের আগে বাকি সময়টি ABORTED হিসাবে বন্ধ করা হবে। এই সময়কালটি কখনই একটি মডেল-নির্দিষ্ট ন্যূনতম থেকে কম হবে না, যা মডেলের জন্য হারের সীমার সাথে একত্রে নির্দিষ্ট করা হবে। |
রিয়েলটাইম ইনপুট কনফিগারেশন
BidiGenerateContent
এ রিয়েলটাইম ইনপুট আচরণ কনফিগার করে।
ক্ষেত্র | |
---|---|
automaticActivityDetection | ঐচ্ছিক। সেট করা না থাকলে, স্বয়ংক্রিয় কার্যকলাপ সনাক্তকরণ ডিফল্টরূপে সক্রিয় করা হয়। স্বয়ংক্রিয় ভয়েস সনাক্তকরণ অক্ষম থাকলে, ক্লায়েন্টকে অবশ্যই কার্যকলাপ সংকেত পাঠাতে হবে। |
activityHandling | ঐচ্ছিক। ক্রিয়াকলাপের কী প্রভাব রয়েছে তা নির্ধারণ করে। |
turnCoverage | ঐচ্ছিক। ব্যবহারকারীর পালা কোন ইনপুট অন্তর্ভুক্ত করা হয়েছে তা সংজ্ঞায়িত করে। |
SessionResumptionConfig
সেশন পুনরায় শুরু করার কনফিগারেশন।
এই বার্তাটি সেশন কনফিগারেশনে BidiGenerateContentSetup.sessionResumption
হিসাবে অন্তর্ভুক্ত করা হয়েছে। কনফিগার করা হলে, সার্ভার SessionResumptionUpdate
বার্তা পাঠাবে।
ক্ষেত্র | |
---|---|
handle | আগের সেশনের হ্যান্ডেল। যদি উপস্থিত না থাকে তবে একটি নতুন অধিবেশন তৈরি করা হয়। সেশন হ্যান্ডেলগুলি পূর্ববর্তী সংযোগগুলিতে |
সেশন রিজাম্পশন আপডেট
সেশন পুনঃসূচনা অবস্থার আপডেট।
BidiGenerateContentSetup.sessionResumption
সেট করা থাকলেই কেবল পাঠানো হবে।
ক্ষেত্র | |
---|---|
newHandle | নতুন হ্যান্ডেল যা আবার শুরু করা যেতে পারে এমন একটি অবস্থার প্রতিনিধিত্ব করে। |
resumable | বর্তমান অধিবেশন এই সময়ে পুনরায় শুরু করা যেতে পারে যদি সত্য. অধিবেশনের কিছু পয়েন্টে পুনরায় চালু করা সম্ভব নয়। উদাহরণস্বরূপ, যখন মডেলটি ফাংশন কল নির্বাহ করছে বা জেনারেট করছে। সেশনটি পুনরায় শুরু করলে (পূর্ববর্তী সেশনের টোকেন ব্যবহার করে) এমন অবস্থায় কিছু ডেটা নষ্ট হবে। এই ক্ষেত্রে, |
স্লাইডিং উইন্ডো
স্লাইডিংউইন্ডো পদ্ধতিটি প্রসঙ্গ উইন্ডোর শুরুতে বিষয়বস্তু বাতিল করে কাজ করে। ফলাফল প্রসঙ্গ সর্বদা একটি USER ভূমিকার শুরুতে শুরু হবে৷ সিস্টেম নির্দেশাবলী এবং যেকোনো BidiGenerateContentSetup.prefixTurns
সবসময় ফলাফলের শুরুতে থাকবে।
ক্ষেত্র | |
---|---|
targetTokens | টোকেনের টার্গেট নম্বর রাখতে হবে। ডিফল্ট মান হল trigger_tokens/2। প্রসঙ্গ উইন্ডোর অংশগুলি বাদ দিলে অস্থায়ী লেটেন্সি বৃদ্ধি পায় তাই ঘন ঘন কম্প্রেশন অপারেশন এড়াতে এই মানটি ক্যালিব্রেট করা উচিত। |
সংবেদনশীলতা শুরু করুন
বক্তৃতার শুরু কিভাবে সনাক্ত করা হয় তা নির্ধারণ করে।
Enums | |
---|---|
START_SENSITIVITY_UNSPECIFIED | ডিফল্ট হল START_SENSITIVITY_HIGH৷ |
START_SENSITIVITY_HIGH | স্বয়ংক্রিয় সনাক্তকরণ আরও প্রায়ই বক্তৃতা শুরু সনাক্ত করবে। |
START_SENSITIVITY_LOW | স্বয়ংক্রিয় সনাক্তকরণ কম ঘন ঘন বক্তৃতা শুরু শনাক্ত করবে। |
টার্নকভারেজ
বিকল্প কোন ইনপুট ব্যবহারকারীর পালা অন্তর্ভুক্ত করা হয়.
Enums | |
---|---|
TURN_COVERAGE_UNSPECIFIED | অনির্দিষ্ট থাকলে, ডিফল্ট আচরণ হল TURN_INCLUDES_ONLY_ACTIVITY । |
TURN_INCLUDES_ONLY_ACTIVITY | নিষ্ক্রিয়তা (যেমন অডিও স্ট্রীমে নীরবতা) বাদ দিয়ে ব্যবহারকারীরা শুধুমাত্র শেষ পালা থেকে কার্যকলাপ অন্তর্ভুক্ত করে। এটি ডিফল্ট আচরণ। |
TURN_INCLUDES_ALL_INPUT | ব্যবহারকারীরা শেষ পালা থেকে সমস্ত রিয়েলটাইম ইনপুট অন্তর্ভুক্ত করে, নিষ্ক্রিয়তা সহ (যেমন অডিও স্ট্রীমে নীরবতা)। |
মেটাডেটা ব্যবহার
প্রতিক্রিয়া(গুলি) সম্পর্কে মেটাডেটা ব্যবহার করুন।
ক্ষেত্র | |
---|---|
promptTokenCount | শুধুমাত্র আউটপুট। প্রম্পটে টোকেনের সংখ্যা। যখন |
cachedContentTokenCount | প্রম্পটের ক্যাশ করা অংশে টোকেনের সংখ্যা (ক্যাশ করা বিষয়বস্তু) |
responseTokenCount | শুধুমাত্র আউটপুট। সমস্ত উত্পন্ন প্রতিক্রিয়া প্রার্থীদের জুড়ে টোকেনের মোট সংখ্যা। |
toolUsePromptTokenCount | শুধুমাত্র আউটপুট। টুল-ব্যবহার প্রম্পটে উপস্থিত টোকেনের সংখ্যা। |
thoughtsTokenCount | শুধুমাত্র আউটপুট। চিন্তাভাবনার মডেলের জন্য চিন্তার টোকেনের সংখ্যা। |
totalTokenCount | শুধুমাত্র আউটপুট। প্রজন্মের অনুরোধের জন্য মোট টোকেন গণনা (প্রম্পট + প্রতিক্রিয়া প্রার্থী)। |
promptTokensDetails[] | শুধুমাত্র আউটপুট। অনুরোধ ইনপুট প্রক্রিয়া করা হয়েছে যে পদ্ধতির তালিকা. |
cacheTokensDetails[] | শুধুমাত্র আউটপুট। অনুরোধ ইনপুটে ক্যাশে করা বিষয়বস্তুর পদ্ধতির তালিকা। |
responseTokensDetails[] | শুধুমাত্র আউটপুট। প্রতিক্রিয়াতে ফিরে আসা পদ্ধতির তালিকা। |
toolUsePromptTokensDetails[] | শুধুমাত্র আউটপুট। টুল-ব্যবহারের অনুরোধ ইনপুটগুলির জন্য প্রক্রিয়াকৃত পদ্ধতির তালিকা। |
সাধারণ ধরনের সম্পর্কে আরও তথ্য
সাধারণত-ব্যবহৃত API রিসোর্স ধরনের Blob
, Content
, FunctionCall
, FunctionResponse
, GenerationConfig
, GroundingMetadata
, ModalityTokenCount
, এবং Tool
সম্পর্কে আরও তথ্যের জন্য, সামগ্রী তৈরি করা দেখুন।