Gemma 3n मॉडल की खास जानकारी

Gemma 3n, जनरेटिव एआई मॉडल है. इसे फ़ोन, लैपटॉप, और टैबलेट जैसे हर दिन इस्तेमाल किए जाने वाले डिवाइसों में इस्तेमाल करने के लिए ऑप्टिमाइज़ किया गया है. इस मॉडल में, पैरामीटर की बेहतर प्रोसेसिंग के लिए कई नए तरीके शामिल किए गए हैं. इनमें हर लेयर के लिए एम्बेडिंग (PLE) पैरामीटर कैश मेमोरी और MatFormer मॉडल आर्किटेक्चर शामिल है. इससे, कंप्यूट और मेमोरी की ज़रूरतों को कम करने में मदद मिलती है. इन मॉडल में ऑडियो इनपुट मैनेज करने के साथ-साथ, टेक्स्ट और विज़ुअल डेटा भी शामिल है.

Gemma 3n में ये मुख्य सुविधाएं शामिल हैं:

  • ऑडियो इनपुट: बोली पहचानने, अनुवाद करने, और ऑडियो डेटा का विश्लेषण करने के लिए, आवाज़ का डेटा प्रोसेस करना. ज़्यादा जानें
  • विज़ुअल और टेक्स्ट इनपुट: मल्टीमोडल सुविधाओं की मदद से, विज़ुअल, आवाज़, और टेक्स्ट को मैनेज किया जा सकता है. इससे आपको अपने आस-पास की दुनिया को समझने और उसका विश्लेषण करने में मदद मिलती है. ज़्यादा जानें
  • विज़न एन्कोडर: बेहतरीन परफ़ॉर्मेंस वाला MobileNet-V5 एन्कोडर, विज़ुअल डेटा को प्रोसेस करने की रफ़्तार और सटीक नतीजे देने की क्षमता को काफ़ी बेहतर बनाता है. ज़्यादा जानें
  • पीएलई कैश मेमोरी: इन मॉडल में मौजूद हर लेयर के एम्बेडिंग (पीएलई) पैरामीटर को तेज़ी से काम करने वाले लोकल स्टोरेज में कैश मेमोरी में सेव किया जा सकता है. इससे मॉडल की मेमोरी में चलने की लागत कम हो जाती है. ज़्यादा जानें
  • MatFormer आर्किटेक्चर: Matryoshka ट्रांसफ़ॉर्मर आर्किटेक्चर की मदद से, हर अनुरोध के लिए मॉडल पैरामीटर को चुनिंदा तौर पर चालू किया जा सकता है. इससे, कैलकुलेट करने की लागत और रिस्पॉन्स में लगने वाले समय को कम किया जा सकता है. ज़्यादा जानें
  • शर्त के हिसाब से पैरामीटर लोड करना: मॉडल में विज़न और ऑडियो पैरामीटर लोड करने की सुविधा को बायपास करें, ताकि लोड किए गए पैरामीटर की कुल संख्या कम की जा सके और मेमोरी संसाधनों को बचाया जा सके. ज़्यादा जानें
  • कई भाषाओं में काम करने की सुविधा: यह मशीन लर्निंग मॉडल, 140 से ज़्यादा भाषाओं में काम करता है.
  • 32 हज़ार टोकन वाला कॉन्टेक्स्ट: डेटा का विश्लेषण करने और प्रोसेसिंग टास्क को मैनेज करने के लिए ज़रूरी इनपुट कॉन्टेक्स्ट.

Gemma 3n आज़माएं इसे Kaggle से पाएं इसे Hugging Face से पाएं

Gemma के अन्य मॉडल की तरह ही, Gemma 3n में ओपन वेट उपलब्ध हैं. साथ ही, इसे व्यावसायिक तौर पर इस्तेमाल करने के लिए लाइसेंस दिया गया है. इसकी मदद से, अपने प्रोजेक्ट और ऐप्लिकेशन में इसे ट्यून और डिप्लॉय किया जा सकता है.

मॉडल पैरामीटर और असरदार पैरामीटर

Gemma 3n मॉडल, पैरामीटर की संख्या के साथ सूची में शामिल किए जाते हैं. जैसे, E2B और E4B. ये संख्याएं, मॉडल में मौजूद पैरामीटर की कुल संख्या से कम होती हैं. E प्रीफ़िक्स से पता चलता है कि ये मॉडल, असरदार पैरामीटर के कम सेट के साथ काम कर सकते हैं. कम पैरामीटर वाले ऑपरेशन को, Gemma 3n मॉडल में पहले से मौजूद फ़्लेक्सिबल पैरामीटर टेक्नोलॉजी का इस्तेमाल करके हासिल किया जा सकता है. इससे, कम संसाधन वाले डिवाइसों पर बेहतर तरीके से काम करने में मदद मिलती है.

Gemma 3n मॉडल में पैरामीटर को चार मुख्य ग्रुप में बांटा गया है: टेक्स्ट, विज़ुअल, ऑडियो, और हर लेयर में एम्बेड करने (पीएलई) वाले पैरामीटर. E2B मॉडल को स्टैंडर्ड तरीके से लागू करने पर, मॉडल को लागू करते समय पांच अरब से ज़्यादा पैरामीटर लोड होते हैं. हालांकि, पैरामीटर स्किप करने और PLE कैश मेमोरी की तकनीकों का इस्तेमाल करके, इस मॉडल को 20 करोड़ (1.91 अरब) पैरामीटर के मेमोरी लोड के साथ चलाया जा सकता है, जैसा कि पहली इमेज में दिखाया गया है.

पैरामीटर के इस्तेमाल का Gemma 3n डायग्राम

पहली इमेज. Gemma 3n E2B मॉडल के पैरामीटर, स्टैंडर्ड तरीके से चल रहे हैं. इसके मुकाबले, PLE कैश मेमोरी और पैरामीटर स्किप करने की तकनीकों का इस्तेमाल करके, पैरामीटर लोड को कम किया जा सकता है.

पैरामीटर को ऑफ़लोड करने और चुनिंदा पैरामीटर को चालू करने की इन तकनीकों का इस्तेमाल करके, मॉडल को पैरामीटर के बहुत कम सेट के साथ चलाया जा सकता है. इसके अलावा, विज़ुअल और ऑडियो जैसे अन्य डेटा टाइप को मैनेज करने के लिए, अतिरिक्त पैरामीटर भी चालू किए जा सकते हैं. इन सुविधाओं की मदद से, डिवाइस की सुविधाओं या टास्क की ज़रूरतों के आधार पर, मॉडल की सुविधाओं को बेहतर बनाया जा सकता है या कम किया जा सकता है. नीचे दिए गए सेक्शन में, Gemma 3n मॉडल में उपलब्ध पैरामीटर की बेहतर तकनीकों के बारे में ज़्यादा जानकारी दी गई है.

PLE कैशिंग

Gemma 3n मॉडल में, हर लेयर के लिए एम्बेडिंग (PLE) पैरामीटर शामिल होते हैं. इनका इस्तेमाल, मॉडल को लागू करने के दौरान डेटा बनाने के लिए किया जाता है. इससे हर मॉडल लेयर की परफ़ॉर्मेंस बेहतर होती है. PLE डेटा को मॉडल की ऑपरेटिंग मेमोरी के बाहर, अलग से जनरेट किया जा सकता है. साथ ही, इसे तेज़ स्टोरेज में कैश मेमोरी में सेव किया जा सकता है. इसके बाद, हर लेयर के चलने पर, मॉडल के अनुमान लगाने की प्रोसेस में जोड़ा जा सकता है. इस तरीके से, PLE पैरामीटर को मॉडल के स्टोरेज से बाहर रखा जा सकता है. इससे रिसॉर्स का इस्तेमाल कम होता है और मॉडल के रिस्पॉन्स की क्वालिटी बेहतर होती है.

MatFormer का आर्किटेक्चर

Gemma 3n मॉडल, Matryoshka Transformer या MatFormer मॉडल आर्किटेक्चर का इस्तेमाल करते हैं. इसमें एक बड़े मॉडल में नेस्ट किए गए छोटे मॉडल होते हैं. अनुरोधों का जवाब देते समय, नेस्ट किए गए सब-मॉडल का इस्तेमाल, अनुमान लगाने के लिए किया जा सकता है. इसके लिए, इन सब-मॉडल को शामिल करने वाले मॉडल के पैरामीटर चालू करने की ज़रूरत नहीं होती. MatFormer मॉडल में सिर्फ़ छोटे और मुख्य मॉडल चलाने की सुविधा से, मॉडल के लिए कंप्यूट लागत, रिस्पॉन्स समय, और एनर्जी फ़ुटप्रिंट कम हो सकता है. Gemma 3n के मामले में, E4B मॉडल में E2B मॉडल के पैरामीटर शामिल होते हैं. इस आर्किटेक्चर की मदद से, पैरामीटर चुने जा सकते हैं और 2B से 4B के बीच के इंटरमीडिएट साइज़ में मॉडल असेंबल किए जा सकते हैं. इस तरीके के बारे में ज़्यादा जानने के लिए, MatFormer रिसर्च पेपर देखें. MatFormer Lab की गाइड की मदद से, Gemma 3n मॉडल का साइज़ कम करने के लिए, MatFormer की तकनीकों का इस्तेमाल करें.

शर्त के हिसाब से पैरामीटर लोड करना

PLE पैरामीटर की तरह ही, Gemma 3n मॉडल में कुछ पैरामीटर को मेमोरी में लोड करने से बचाया जा सकता है. जैसे, ऑडियो या विज़ुअल पैरामीटर. इससे मेमोरी लोड कम होता है. अगर डिवाइस में ज़रूरी संसाधन हैं, तो इन पैरामीटर को रनटाइम के दौरान डाइनैमिक तौर पर लोड किया जा सकता है. कुल मिलाकर, पैरामीटर स्किप करने से Gemma 3n मॉडल के लिए ज़रूरी ऑपरेटिंग मेमोरी कम हो सकती है. इससे, इसे ज़्यादा डिवाइसों पर चलाया जा सकता है. साथ ही, डेवलपर कम मांग वाले टास्क के लिए, संसाधनों का इस्तेमाल ज़्यादा बेहतर तरीके से कर सकते हैं.


क्या आपका ऐप्लिकेशन बनाने का प्लान है? Gemma मॉडल का इस्तेमाल शुरू करें!