29 अगस्त, 2025
InstaLILY: यह Gemini की मदद से काम करने वाला, एंटरप्राइज़ सर्च इंजन है

एंटरप्राइज़ एआई एजेंट, मुश्किल वर्कफ़्लो को ऑटोमेट करते हैं. जैसे, B2B बिक्री या औद्योगिक रखरखाव. इसके लिए, ऐसे मॉडल की ज़रूरत होती है जिन्हें डोमेन के हिसाब से, बड़ी मात्रा में अच्छी क्वालिटी वाले डेटा पर ट्रेन किया गया हो. कई कंपनियों के लिए, इस डेटा को बनाना एक बड़ी चुनौती है. इसकी वजह यह है कि मैन्युअल तरीके से लेबलिंग करने में समय लगता है और यह महंगा भी होता है. साथ ही, सामान्य मॉडल में ज़रूरी बारीकियां नहीं होती हैं.
InstaLILY AI, एआई एजेंट के लिए एक एंटरप्राइज़ प्लैटफ़ॉर्म है. यह कंपनियों को बिक्री, सेवा, और ऑपरेशंस में जटिल वर्कफ़्लो को ऑटोमेट करने और चलाने में मदद करता है. PartsTown नाम के अपने एक क्लाइंट के लिए, उन्हें एआई एजेंट के लिए रीयल-टाइम सर्च इंजन बनाना था. इससे फ़ील्ड सर्विस टेक्नीशियन को तुरंत, 50 लाख से ज़्यादा आइटम वाले कैटलॉग में से, बदलने के लिए खास पुर्ज़े मिल सकें. इसके लिए, मॉडल ट्रेनिंग के लिए लाखों अच्छी क्वालिटी वाले लेबल जनरेट करने का तरीका चाहिए था.
इस समस्या को हल करने के लिए, InstaLILY AI ने कई चरणों वाली सिंथेटिक डेटा जनरेशन पाइपलाइन तैयार की. इस पाइपलाइन में शिक्षक-छात्र आर्किटेक्चर का इस्तेमाल किया जाता है. इसमें Gemini 2.5 Pro, “शिक्षक” मॉडल के तौर पर काम करता है, ताकि ट्रेनिंग के लिए बेहतरीन डेटा जनरेट किया जा सके. साथ ही, फ़ाइन-ट्यून किया गया Gemma मॉडल, “छात्र” के तौर पर काम करता है, ताकि कम लागत में बड़े पैमाने पर प्रोडक्शन डिप्लॉयमेंट किया जा सके.
बड़े पैमाने पर खास ट्रेनिंग डेटा बनाने की चुनौती
पुर्ज़ों को खोजने वाले सर्च इंजन का मुख्य हिस्सा, काम के नतीजों को दिखाने वाला मॉडल होता है. यह मॉडल, सर्विस टेक्नीशियन की क्वेरी (जैसे, "नॉर्थलैंड रेफ़्रिजरेटर के लिए कंप्रेसर") को सटीक पार्ट नंबर पर रीडायरेक्ट किया जाता है. इस मॉडल को ट्रेन करने के लिए, क्वेरी-पार्ट के बड़े डेटासेट की ज़रूरत पड़ी.
InstaLILY AI को पारंपरिक तरीकों से कई चुनौतियों का सामना करना पड़ा:
- स्केलेबिलिटी: लाखों वर्क-ऑर्डर लाइनों को मैन्युअल तरीके से लेबल करना मुमकिन नहीं था.
- लागत और क्वालिटी: लेबलिंग के लिए अन्य फ़्रंटियर मॉडल का इस्तेमाल करने पर, फ़ाइनल समाधान की तुलना में तीन गुना ज़्यादा लागत आई. साथ ही, सहमति की दरें 15% कम रहीं.
- परफ़ॉर्मेंस: एलएलएम की मदद से लाइव खोज करने की सुविधा बहुत धीमी होगी. शुरुआती टेस्ट में, दो मिनट की देरी देखी गई. साथ ही, यह सुविधा प्रोडक्शन में, हर सेकंड में 500 से ज़्यादा क्वेरी (क्यूपीएस) को हैंडल नहीं कर पाएगी.
उन्हें एक ऐसे सिस्टम की ज़रूरत थी जो कम लागत में अच्छी क्वालिटी का डेटा जनरेट कर सके. इससे फ़ाइनल मॉडल को तेज़ी से और सटीक तरीके से तैयार किया जा सके.
Gemini और Gemma के साथ तीन चरणों वाली पाइपलाइन
InstaLILY AI ने तीन चरणों वाली एक पाइपलाइन तैयार की है. इसमें Gemini 2.5 Pro की ऐडवांस रीज़निंग का इस्तेमाल करके, अच्छी क्वालिटी वाले लेबल बनाए जाते हैं. इसके बाद, उस जानकारी को प्रोडक्शन के लिए छोटे और ज़्यादा असरदार मॉडल में बदला जाता है.
पाइपलाइन इस तरह काम करती है:
- सिंथेटिक डेटा जनरेशन (टीचर मॉडल): Gemini 2.5 Pro, क्वेरी-पार्ट पेयर के लिए गोल्ड-स्टैंडर्ड लेबल जनरेट करता है. ज़्यादा सटीक नतीजे पाने के लिए, InstaLILY AI, मल्टी-पर्सपेक्टिव चेन-ऑफ़-थॉट (मल्टी-सीओटी) रीज़निंग का इस्तेमाल करता है. इससे मॉडल को ब्रैंड, कैटगरी, स्पेसिफ़िकेशन, और कंपैटिबिलिटी के लिए जटिल कारोबारी लॉजिक जैसे कई पहलुओं से विश्लेषण करने का निर्देश मिलता है. इस तरीके से, ब्लाइंड टेस्ट सेट पर इंसानी विशेषज्ञों के साथ 94% सहमति हासिल की गई.
- छात्रों के मॉडल को ट्रेनिंग देना: Gemini 2.5 Pro से मिले बेहतर क्वालिटी वाले लेबल का इस्तेमाल, Gemma-7B को बेहतर बनाने के लिए किया जाता है. InstaLILY AI ने छात्र-छात्राओं के मॉडल को बेहतर बनाने के लिए कई तकनीकों का इस्तेमाल किया. इनमें डायरेक्ट प्रेफ़रेंस ऑप्टिमाइज़ेशन (डीपीओ) भी शामिल है. इससे फ़ॉल्स पॉज़िटिव में 40% की कमी आई. उन्होंने फ़ाइन-ट्यून किए गए Gemma के तीन वैरिएंट का एक ग्रुप भी बनाया. ये वैरिएंट, हर सैंपल पर वोट करते हैं. इससे लेबल की सटीकता 96% तक बढ़ जाती है.
- प्रोडक्शन सर्वर: Gemma मॉडल से मिली जानकारी को, फ़ाइनल प्रोडक्शन एनवायरमेंट के लिए लाइटवेट BERT मॉडल (11 करोड़ पैरामीटर) में शामिल किया जाता है. यह छोटा मॉडल, 600 QPS पर अनुरोधों को पूरा करते समय 89% F1-स्कोर की सटीकता बनाए रखता है.
InstaLILY की एआई टीम ने कहा, "अगर हम अपने डिस्टिल्ड मॉडल को बूटस्ट्रैप करने के लिए, एलएलएम के चेन‑ऑफ़‑थॉट लेबलिंग का इस्तेमाल नहीं करते, तो हमें बहुत ज़्यादा डेटा को मैन्युअल तरीके से टैग करना पड़ता." "Gemini ने डेटा तैयार करने की प्रोसेस को काफ़ी तेज़ कर दिया. इससे हमें इंजीनियरिंग के सैकड़ों घंटे बचाने में मदद मिली. इन घंटों का इस्तेमाल, हम फ़ाइन-ट्यूनिंग और ऑर्केस्ट्रेशन जैसे ज़्यादा ज़रूरी कामों के लिए कर पाए.”
इंतज़ार के समय में 99.8% और लागत में 98.3% की कमी
शिक्षक-छात्र आर्किटेक्चर की मदद से, जवाब देने की स्पीड, लागत, और सटीकता में काफ़ी सुधार हुआ.
फ़ाइनल सिस्टम ने यह स्कोर हासिल किया:
- क्वेरी के नतीजे मिलने में लगने वाले समय में कमी: 2 मिनट से 0.2 सेकंड (99.8% की बढ़ोतरी).
- विज्ञापन दिखाने की लागत में कमी: 1,000 क्वेरी के लिए 0.12 डॉलर से 0.002 डॉलर (98.3% की कमी).
- ज़्यादा सटीक: ब्लाइंड होल्ड-आउट डेटासेट पर ~90% F1-स्कोर.
इससे डेवलपमेंट की प्रोसेस भी तेज़ हो गई. टीम ने 48 घंटों में एक प्रोटोटाइप और चार हफ़्तों में प्रोडक्शन के लिए तैयार पाइपलाइन बनाई. टीम का अनुमान है कि Gemini और Gemma के इकोसिस्टम के बिना, इस प्रोसेस में तीन से चार महीने लग जाते.
InstaLILY के फ़ाउंडर और सीईओ, अमित शाह ने कहा, “Google Accelerator का हिस्सा बनने से, हमें इस पूरे तरीके को अनलॉक करने में मदद मिली.” “तकनीकी सहायता, Gemini और Gemma को रिलीज़ होने से पहले ऐक्सेस करने की सुविधा, और Cloud क्रेडिट की वजह से, हम प्रोटोटाइप से प्रोडक्शन में कुछ ही हफ़्तों में माइग्रेट कर पाए. ऐसा करने में हमें महीनों नहीं लगे.”
मल्टीमॉडल और लगातार सीखने की सुविधा के साथ आने वाले समय में होने वाले डेवलपमेंट
InstaLILY, Gemini की मल्टीमॉडल सुविधाओं को शामिल करके, अपने एआई एजेंट की क्षमताओं को बढ़ाना चाहता है. इससे टेक्नीशियन, खराब हो चुके डिवाइस की फ़ोटो अपलोड कर पाएंगे, ताकि गड़बड़ी का पता लगाने में मदद मिल सके. वे लगातार ऐक्टिव लर्निंग वाली एक सेवा भी डेवलप कर रहे हैं. यह सेवा, कम भरोसेमंद लाइव क्वेरी को फ़्लैग करती है. साथ ही, उन्हें एनोटेशन के लिए Gemini पर भेजती है. इसके अलावा, यह हर हफ़्ते प्रोडक्शन मॉडल को फिर से ट्रेन करती है.
InstaLILY AI के एआई एजेंट के लिए सर्च इंजन की सफलता से पता चलता है कि शिक्षक-छात्र आर्किटेक्चर, Gemini 2.5 Pro की तर्क क्षमता को फ़ाइन-ट्यून किए गए Gemma मॉडल की क्षमता के साथ जोड़कर, डेटा जनरेट करने से जुड़ी मुश्किल चुनौतियों को हल कर सकता है. साथ ही, ज़्यादा परफ़ॉर्म करने वाले और बड़े पैमाने पर इस्तेमाल किए जा सकने वाले एआई ऐप्लिकेशन को चालू कर सकता है.
Gemini और Gemma मॉडल का इस्तेमाल करके ऐप्लिकेशन बनाना शुरू करने के लिए, API से जुड़ा हमारा दस्तावेज़ पढ़ें.