LiterRT-LM ওভারভিউ

LiteRT-LM হলো একটি উৎপাদন-উপযোগী, ওপেন-সোর্স ইনফারেন্স ফ্রেমওয়ার্ক, যা এজ ডিভাইসে উচ্চ-পারফরম্যান্স সম্পন্ন ও ক্রস-প্ল্যাটফর্ম LLM ডেপ্লয়মেন্ট প্রদানের জন্য ডিজাইন করা হয়েছে।

  • ক্রস-প্ল্যাটফর্ম সাপোর্ট: অ্যান্ড্রয়েড, আইওএস, ওয়েব, ডেস্কটপ এবং আইওটি (যেমন রাস্পবেরি পাই)-তে চালানো যায়।
  • হার্ডওয়্যার অ্যাক্সিলারেশন: বিভিন্ন হার্ডওয়্যারে GPU এবং NPU অ্যাক্সিলারেটর ব্যবহার করে সর্বোচ্চ পারফরম্যান্স এবং সিস্টেমের স্থিতিশীলতা অর্জন করুন।
  • বহুমুখী ব্যবহার: এমন এলএলএম (LLM) দিয়ে নির্মাণ করুন যেগুলিতে দৃষ্টি ও শ্রবণ সমর্থন রয়েছে।
  • টুলের ব্যবহার: উন্নত নির্ভুলতার জন্য সীমাবদ্ধ ডিকোডিং সহ এজেন্টিক ওয়ার্কফ্লোতে ফাংশন কলিং সমর্থন।
  • ব্যাপক মডেল সমর্থন: Gemma, Llama, Phi-4, Qwen এবং আরও অনেক কিছু চালান।

ডিভাইসে GenAI শোকেস

গুগল এআই এজ গ্যালারি স্ক্রিনশট

গুগল এআই এজ গ্যালারি হলো একটি পরীক্ষামূলক অ্যাপ, যা LiteRT-LM ব্যবহার করে সম্পূর্ণ অফলাইনে চালিত ডিভাইসের জেনারেটিভ এআই সক্ষমতা প্রদর্শনের জন্য ডিজাইন করা হয়েছে।

  • গুগল প্লে : সমর্থিত অ্যান্ড্রয়েড ডিভাইসগুলিতে স্থানীয়ভাবে এলএলএম ব্যবহার করুন।
  • অ্যাপ স্টোর : আপনার iOS ডিভাইসে অন-ডিভাইস এআই-এর অভিজ্ঞতা নিন।
  • গিটহাব সোর্স : আপনার নিজের প্রোজেক্টে কীভাবে LiteRT-LM ইন্টিগ্রেট করবেন তা শিখতে গ্যালারি অ্যাপটির সোর্স কোড দেখুন।
ডিভাইস প্রোফাইল মোড প্রিফিল (tk/s) ডিকোড (tk/s)
ম্যাকবুক প্রো ২০২৩ এম৩ সিপিইউ ২৩৩ ২৮
ম্যাকবুক প্রো ২০২৪ এম৪ জিপিইউ ২২৬৫ ৪৮
স্যামসাং এস২৪ (আল্ট্রা) সিপিইউ ১১১ ১৬
জিপিইউ ৮১৬ ১৬

নির্মাণ শুরু করুন

নিম্নলিখিত কোড স্নিপেটগুলিতে দেখানো হয়েছে কীভাবে LiteRT-LM CLI এবং সেইসাথে Python, Kotlin, ও C++ API-গুলি দিয়ে কাজ শুরু করতে হয়।

সিএলআই

litert-lm run model.litertlm --prompt="What is the capital of France?"

পাইথন

engine = litert_lm.Engine("model.litertlm")

with engine.create_conversation() as conversation:
    response = conversation.send_message("What is the capital of France?")
    print(f"Response: {response['content'][0]['text']}")

কোটলিন

val engineConfig = EngineConfig(
    modelPath = "/path/to/your/model.litertlm",
    backend = Backend.CPU(),
)

val engine = Engine(engineConfig)
engine.initialize()

val conversation = engine.createConversation()
print(conversation.sendMessage("What is the capital of France?"))  

সি++

auto model_assets = ModelAssets::Create(model_path);
CHECK_OK(model_assets);

auto engine_settings = EngineSettings::CreateDefault(
    model_assets,
    /*backend=*/litert::lm::Backend::CPU);

absl::StatusOr<std::unique_ptr<Engine>> engine = Engine::CreateEngine(engine_settings);
CHECK_OK(engine);

auto conversation_config = ConversationConfig::CreateDefault(**engine);
CHECK_OK(conversation_config);
absl::StatusOr<std::unique_ptr<Conversation>> conversation = Conversation::Create(**engine, *conversation_config);
CHECK_OK(conversation);

absl::StatusOr<Message> model_message = (*conversation)->SendMessage(
    JsonMessage{
        {"role", "user"},
        {"content", "What is the capital of France?"}
    });
CHECK_OK(model_message);

std::cout << *model_message << std::endl;
ভাষা অবস্থা এর জন্য সেরা... ডকুমেন্টেশন
সিএলআই 🚀
প্রাথমিক প্রিভিউ
১ মিনিটেরও কম সময়ে LiteRT-LM দিয়ে কাজ শুরু করুন। সিএলআই গাইড
পাইথন
স্থিতিশীল
ডেস্কটপ ও রাস্পবেরি পাই-তে দ্রুত প্রোটোটাইপিং ও উন্নয়ন। পাইথন গাইড
কোটলিন
স্থিতিশীল
নেটিভ অ্যান্ড্রয়েড অ্যাপ এবং জেভিএম-ভিত্তিক ডেস্কটপ টুল। কো-রুটিনের জন্য অপ্টিমাইজ করা হয়েছে। কোটলিন গাইড
সি++
স্থিতিশীল
উচ্চ-কর্মক্ষমতাসম্পন্ন, ক্রস-প্ল্যাটফর্ম কোর লজিক এবং এমবেডেড সিস্টেম। সি++ গাইড
সুইফট 🚀
দেবের মধ্যে
বিশেষায়িত মেটাল সাপোর্ট সহ নেটিভ iOS এবং macOS ইন্টিগ্রেশন। শীঘ্রই আসছে

সমর্থিত ব্যাকএন্ড এবং প্ল্যাটফর্ম

ত্বরণ অ্যান্ড্রয়েড আইওএস ম্যাকওএস উইন্ডোজ লিনাক্স আইওটি
সিপিইউ
জিপিইউ -
এনপিইউ - - - - -

সমর্থিত মডেল

নিচের সারণিতে LiteRT-LM দ্বারা সমর্থিত মডেলগুলির তালিকা দেওয়া হলো। আরও বিস্তারিত পারফরম্যান্স তথ্য এবং মডেল কার্ডের জন্য, Hugging Face-এর LiteRT কমিউনিটিতে যান।

মডেল প্রকার আকার (এমবি) ডাউনলোড লিঙ্ক ডিভাইস সিপিইউ প্রিফিল (tk/s) সিপিইউ ডিকোড (tk/s) জিপিইউ প্রিফিল (tk/s) জিপিইউ ডিকোড (tk/s)
জেমা৩-১বি চ্যাট ১০০৫ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ১৭৭ ৩৩ ১১৯১ ২৪
জেমা-৩এন-ই২বি চ্যাট ২৯৬৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ২৩৩ ২৮ - -
স্যামসাং এস২৪ আল্ট্রা ১১১ ১৬ ৮১৬ ১৬
জেমা-৩এন-ই৪বি চ্যাট ৪২৩৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ১৭০ ২০ - -
স্যামসাং এস২৪ আল্ট্রা ৭৪ ৫৪৮
ফাংশনজেমা ভিত্তি ২৮৯ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২২৩৮ ১৫৪ - -
ফাই-৪-মিনি চ্যাট ৩৯০৬ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ৬৭ ৩১৪ ১০
Qwen2.5-1.5B চ্যাট ১৫৯৮ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২৯৮ ৩৪ ১৬৬৮ ৩১
Qwen3-0.6B চ্যাট ৫৮৬ মডেল কার্ড ভিভো এক্স৩০০ প্রো ১৬৫ ৫৮০ ২১
Qwen2.5-0.5B চ্যাট ৫২১ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ২৫১ ৩০ - -

সমস্যা রিপোর্ট করা

আপনি যদি কোনো বাগ খুঁজে পান বা কোনো ফিচারের অনুরোধ থাকে, তাহলে LiteRT-LM GitHub Issues- এ রিপোর্ট করুন।