Gemma 3n মডেল ওভারভিউ

Gemma 3n হল একটি জেনারেটিভ এআই মডেল যা প্রতিদিনের ডিভাইস, যেমন ফোন, ল্যাপটপ এবং ট্যাবলেটগুলিতে ব্যবহারের জন্য অপ্টিমাইজ করা হয়েছে। এই মডেলটিতে প্যারামিটার-দক্ষ প্রক্রিয়াকরণে উদ্ভাবন রয়েছে, যার মধ্যে রয়েছে পার-লেয়ার এমবেডিং (PLE) প্যারামিটার ক্যাশিং এবং একটি MatFormer মডেল আর্কিটেকচার যা গণনা এবং মেমরির প্রয়োজনীয়তা হ্রাস করার নমনীয়তা প্রদান করে। এই মডেলগুলিতে অডিও ইনপুট হ্যান্ডলিং, সেইসাথে পাঠ্য এবং ভিজ্যুয়াল ডেটা রয়েছে।

Gemma 3n নিম্নলিখিত মূল বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে:

  • অডিও ইনপুট : স্পিচ রিকগনিশন, অনুবাদ এবং অডিও ডেটা বিশ্লেষণের জন্য শব্দ ডেটা প্রক্রিয়া করুন। আরও জানুন
  • ভিজ্যুয়াল এবং টেক্সট ইনপুট : মাল্টিমোডাল ক্ষমতা আপনাকে আপনার চারপাশের বিশ্ব বুঝতে এবং বিশ্লেষণ করতে সাহায্য করার জন্য দৃষ্টি, শব্দ এবং পাঠ্য পরিচালনা করতে দেয়। আরও জানুন
  • ভিশন এনকোডার: উচ্চ-কার্যক্ষমতা সম্পন্ন MobileNet-V5 এনকোডার ভিজ্যুয়াল ডেটা প্রক্রিয়াকরণের গতি এবং নির্ভুলতাকে উল্লেখযোগ্যভাবে উন্নত করে। আরও জানুন
  • PLE ক্যাশিং : এই মডেলগুলিতে থাকা পার-লেয়ার এম্বেডিং (PLE) প্যারামিটারগুলি মডেল মেমরি চালানোর খরচ কমাতে দ্রুত, স্থানীয় স্টোরেজে ক্যাশে করা যেতে পারে। আরও জানুন
  • ম্যাটফর্মার আর্কিটেকচার: ম্যাট্রিওশকা ট্রান্সফরমার আর্কিটেকচার কম্পিউট খরচ এবং প্রতিক্রিয়ার সময় কমাতে অনুরোধের প্রতি মডেলের প্যারামিটারের নির্বাচনী সক্রিয়করণের অনুমতি দেয়। আরও জানুন
  • শর্তসাপেক্ষ প্যারামিটার লোডিং: লোড হওয়া প্যারামিটারের মোট সংখ্যা কমাতে এবং মেমরি সংস্থান সংরক্ষণ করতে মডেলটিতে দৃষ্টি এবং অডিও পরামিতিগুলির বাইপাস লোডিং। আরও জানুন
  • বিস্তৃত ভাষা সমর্থন : বিস্তৃত ভাষাগত ক্ষমতা, 140 টিরও বেশি ভাষায় প্রশিক্ষিত।
  • 32K টোকেন প্রসঙ্গ : ডেটা বিশ্লেষণ এবং প্রক্রিয়াকরণের কাজগুলি পরিচালনার জন্য যথেষ্ট ইনপুট প্রসঙ্গ।

Gemma 3n ব্যবহার করে দেখুন এটি Kaggle এ গেট ইট অন হ্যাগিং ফেস

অন্যান্য জেমা মডেলের মতো, জেম্মা 3n-এ খোলা ওজন সরবরাহ করা হয় এবং দায়িত্বশীল বাণিজ্যিক ব্যবহারের জন্য লাইসেন্স দেওয়া হয়, যা আপনাকে আপনার নিজস্ব প্রকল্প এবং অ্যাপ্লিকেশনগুলিতে এটি টিউন এবং স্থাপন করার অনুমতি দেয়।

মডেল পরামিতি এবং কার্যকরী পরামিতি

Gemma 3n মডেলগুলি পরামিতি গণনার সাথে তালিকাভুক্ত করা হয়েছে, যেমন E2B এবং E4B , যা মডেলগুলিতে থাকা মোট প্যারামিটারের চেয়ে কমE উপসর্গ নির্দেশ করে যে এই মডেলগুলি কার্যকরী প্যারামিটারের একটি কম সেটের সাথে কাজ করতে পারে। কম রিসোর্স ডিভাইসে দক্ষতার সাথে চালাতে সাহায্য করার জন্য Gemma 3n মডেলগুলিতে তৈরি নমনীয় প্যারামিটার প্রযুক্তি ব্যবহার করে এই হ্রাস করা প্যারামিটার অপারেশনটি অর্জন করা যেতে পারে।

Gemma 3n মডেলের প্যারামিটারগুলি 4টি প্রধান গ্রুপে বিভক্ত: টেক্সট, ভিজ্যুয়াল, অডিও এবং পার-লেয়ার এম্বেডিং (PLE) প্যারামিটার। E2B মডেলের স্ট্যান্ডার্ড এক্সিকিউশনের সাথে, মডেলটি কার্যকর করার সময় 5 বিলিয়নের বেশি প্যারামিটার লোড হয়। যাইহোক, প্যারামিটার স্কিপিং এবং পিএলই ক্যাশিং কৌশল ব্যবহার করে, এই মডেলটি মাত্র 2 বিলিয়ন (1.91B) প্যারামিটারের একটি কার্যকর মেমরি লোডের সাথে পরিচালিত হতে পারে, যেমন চিত্র 1 এ দেখানো হয়েছে।

প্যারামিটার ব্যবহারের Gemma 3n ডায়াগ্রাম

চিত্র 1. Gemma 3n E2B মডেল প্যারামিটারগুলি স্ট্যান্ডার্ড এক্সিকিউশন বনাম একটি কার্যকরভাবে নিম্ন প্যারামিটার লোডের সাথে PLE ক্যাশিং এবং প্যারামিটার স্কিপিং কৌশল ব্যবহার করে।

এই প্যারামিটার অফলোডিং এবং সিলেক্টিভ অ্যাক্টিভেশন কৌশলগুলি ব্যবহার করে, আপনি প্যারামিটারগুলির একটি খুব ক্ষীণ সেট সহ মডেলটি চালাতে পারেন বা ভিজ্যুয়াল এবং অডিওর মতো অন্যান্য ডেটা প্রকারগুলি পরিচালনা করতে অতিরিক্ত প্যারামিটার সক্রিয় করতে পারেন। এই বৈশিষ্ট্যগুলি আপনাকে ডিভাইসের ক্ষমতা বা কাজের প্রয়োজনীয়তার উপর ভিত্তি করে মডেল কার্যকারিতা বাড়াতে বা র‌্যাম্প ডাউন ক্ষমতা করতে সক্ষম করে। নিম্নলিখিত বিভাগগুলি জেমা 3n মডেলগুলিতে উপলব্ধ প্যারামিটার দক্ষ কৌশলগুলি সম্পর্কে আরও ব্যাখ্যা করে।

PLE ক্যাশিং

Gemma 3n মডেলের মধ্যে রয়েছে পার-লেয়ার এমবেডিং (PLE) প্যারামিটার যা মডেল এক্সিকিউশনের সময় ডেটা তৈরি করতে ব্যবহৃত হয় যা প্রতিটি মডেল লেয়ারের কর্মক্ষমতা বাড়ায়। মডেলের অপারেটিং মেমরির বাইরে PLE ডেটা আলাদাভাবে তৈরি করা যেতে পারে, দ্রুত সঞ্চয়স্থানে ক্যাশে করা যায়, এবং তারপর প্রতিটি স্তর চলার সাথে সাথে মডেল অনুমান প্রক্রিয়ায় যোগ করা যেতে পারে। এই পদ্ধতিটি PLE প্যারামিটারগুলিকে মডেল মেমরির স্থানের বাইরে রাখার অনুমতি দেয়, যা এখনও মডেলের প্রতিক্রিয়ার গুণমান উন্নত করার সাথে সাথে সংস্থান খরচ হ্রাস করে।

ম্যাটফর্মার আর্কিটেকচার

জেমা 3n মডেলগুলি একটি ম্যাট্রিওশকা ট্রান্সফরমার বা ম্যাটফর্মার মডেল আর্কিটেকচার ব্যবহার করে যা একটি একক, বড় মডেলের মধ্যে নেস্টেড, ছোট মডেলগুলি ধারণ করে। অনুরোধে সাড়া দেওয়ার সময় এনস্টেড সাব-মডেলগুলি এনক্লোজিং মডেলের প্যারামিটারগুলি সক্রিয় না করেই অনুমানের জন্য ব্যবহার করা যেতে পারে। একটি MatFormer মডেলের মধ্যে কেবলমাত্র ছোট, মূল মডেলগুলি চালানোর এই ক্ষমতা গণনা খরচ, এবং প্রতিক্রিয়া সময় এবং মডেলের শক্তির পদচিহ্ন কমাতে পারে। Gemma 3n এর ক্ষেত্রে, E4B মডেলটিতে E2B মডেলের প্যারামিটার রয়েছে। এই আর্কিটেকচারটি আপনাকে প্যারামিটার নির্বাচন করতে এবং 2B এবং 4B এর মধ্যে মধ্যবর্তী আকারে মডেলগুলিকে একত্রিত করতে দেয়। এই পদ্ধতির আরো বিস্তারিত জানার জন্য, ম্যাটফর্মার গবেষণা পত্র দেখুন। MatFormer ল্যাব গাইডের সাথে একটি জেমমা 3n মডেলের আকার কমাতে MatFormer কৌশলগুলি ব্যবহার করার চেষ্টা করুন।

শর্তাধীন পরামিতি লোড হচ্ছে

PLE প্যারামিটারের মতো, আপনি মেমরির লোড কমাতে Gemma 3n মডেলে কিছু পরামিতি মেমরিতে লোড করা এড়িয়ে যেতে পারেন, যেমন অডিও বা ভিজ্যুয়াল প্যারামিটার। ডিভাইসে প্রয়োজনীয় সংস্থান থাকলে রানটাইমে এই পরামিতিগুলি গতিশীলভাবে লোড করা যেতে পারে। সামগ্রিকভাবে, প্যারামিটার স্কিপিং একটি Gemma 3n মডেলের জন্য প্রয়োজনীয় অপারেটিং মেমরিকে আরও কমিয়ে দিতে পারে, একটি বিস্তৃত পরিসরের ডিভাইসে এক্সিকিউশন সক্ষম করে এবং ডেভেলপারদের কম চাহিদাপূর্ণ কাজের জন্য সম্পদের দক্ষতা বাড়াতে দেয়।


বিল্ডিং শুরু করতে প্রস্তুত? জেমা মডেলের সাথে শুরু করুন !