शेयर करें

11 दिसंबर, 2024

Gemini, tldraw की "नैचुरल लैंग्वेज कंप्यूटिंग" सुविधा को बेहतर बनाता है

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

स्टीव रुइज़

Tldraw

Tldraw showcase hero

Gemini API की मदद से, नैचुरल लैंग्वेज में इंटरैक्ट करने की सुविधा को अनलॉक करना

Gemini API की मदद से डेवलपर, एआई की बेहतर सुविधाओं को अपने ऐप्लिकेशन में आसानी से इंटिग्रेट कर सकते हैं. इससे, उपयोगकर्ताओं को बेहतर अनुभव मिलता है और ऐप्लिकेशन की परफ़ॉर्मेंस भी बेहतर होती है. इस पोस्ट में बताया गया है कि tldraw, अपने नए प्रोजेक्ट computer में "नैचुरल लैंग्वेज कंप्यूटिंग" की सुविधा देने के लिए, Gemini का इस्तेमाल कैसे करता है. इससे पता चलता है कि स्टार्टअप, Gemini API और tldraw के canvas SDK का इस्तेमाल करके, कितनी आसानी से और कम समय में एआई को इंटिग्रेट कर सकते हैं. tldraw टीम, जल्द ही Gemini 1.5 Flash के साथ कंप्यूटर लॉन्च करने वाली है (वेटलिस्ट में शामिल हों). फ़िलहाल, यह टीम Gemini 2.0 Flash के साथ प्रोटोटाइप बना रही है, ताकि आने वाले समय में इसे बेहतर बनाया जा सके.

tldraw, Gemini API का इस्तेमाल करके विज़ुअल प्रोग्रामिंग में बातचीत करने वाले एआई की सुविधा उपलब्ध करा रहा है. इससे उपयोगकर्ता, नैचुरल लैंग्वेज का इस्तेमाल करके कॉन्टेंट जनरेट कर सकते हैं और जानकारी प्रोसेस कर सकते हैं. इससे एआई के साथ ज़्यादा सहज और असरदार तरीके से काम करने का मौका मिलता है. साथ ही, विज़ुअल कम्यूनिकेशन की सीमाओं को आगे बढ़ाया जा सकता है.

कंप्यूटर के पीछे का विज़न

tldraw का मकसद, डायग्राम बनाने की सुविधा को आसान और सहज बनाना है. इसलिए, उसने उपयोगकर्ताओं के लिए कैनवस से इंटरैक्ट करने का एक ज़्यादा सहज तरीका तैयार किया. संस्थापक स्टीव रुइज़ ने tldraw के इनफ़िनिट कैनवस एसडीके की मदद से, जनरेटिव एआई के साथ काम करने के लिए डाइनैमिक एनवायरमेंट बनाया. इसी विज़न के तहत, computer ऐप्लिकेशन को बनाया गया है. यह एक एक्सपेरिमेंटल ऐप्लिकेशन है. इसमें उपयोगकर्ता, टेक्स्ट, इमेज, और निर्देशों के ब्लॉक से वर्कफ़्लो बनाते हैं. जब कोई वर्कफ़्लो चलता है, तो जानकारी एक कॉम्पोनेंट से दूसरे कॉम्पोनेंट में जाती है. हर जनरेशन का आउटपुट, अगले जनरेशन के लिए इनपुट के तौर पर काम करता है. इससे ऐसी प्रोसेस बनती हैं जो आउटपुट जनरेट करने के लिए, ब्रांच, लूप, और दोहराव करती हैं.

Gemini 2.0 की मदद से बनाना: कंप्यूटर के बारे में ज़्यादा जानकारी

tldraw का कंप्यूटर, आपस में जुड़े “कॉम्पोनेंट” के नेटवर्क पर बनाया गया है. ये कॉम्पोनेंट, कैनवस पर मौजूद एलिमेंट (टेक्स्ट बॉक्स, इमेज, ऑडियो क्लिप वगैरह) को दिखाते हैं. इन कॉम्पोनेंट को ऐरो से लिंक किया जाता है. इससे डेटा फ़्लो और ट्रांसफ़ॉर्मेशन को विज़ुअलाइज़ किया जाता है. हर कॉम्पोनेंट से जुड़ी "प्रोसीजर" होती हैं. ये निर्देशों के ऐसे सेट होते हैं जिन्हें कनेक्ट किए गए कॉम्पोनेंट से मिले इनपुट के आधार पर लागू किया जाता है. कोई कॉम्पोनेंट, किसी भी संख्या में अन्य कॉम्पोनेंट से डेटा स्वीकार कर सकता है. साथ ही, अपने आउटपुट डेटा को कई अन्य कॉम्पोनेंट को भेज सकता है. इसमें खुद का डेटा भी शामिल है! कॉम्पोनेंट पर आधारित इस आर्किटेक्चर और Gemini 2.0 Flash की क्षमता और तेज़ी की वजह से, यह सिस्टम अलग-अलग तरह के कामों को तेज़ी से और आसानी से पूरा कर पाता है.

tldraw कंप्यूटर का एआई, Gemini 2.0 का इस्तेमाल करके टेक्स्ट जनरेट करने और इमेज जनरेट करने वाले मॉडल का इस्तेमाल करके इमेज जनरेट करने की सुविधा देता है

Gemini 2.0 Flash की प्रोटोटाइपिंग ने इस सुविधा को बेहतर बनाने में कैसे मदद की है, यहां बताया गया है:


  • तेज़ी से प्रोसेस पूरी करना: Gemini 2.0 Flash, प्रोसेस को तेज़ी से पूरा करता है. उदाहरण के लिए, "निर्देश" कॉम्पोनेंट में "एक छोटा कमर्शियल लिखो" शामिल हो सकता है. ट्रिगर होने के कुछ ही समय बाद, कॉम्पोनेंट ऐसे चरणों की स्क्रिप्ट जनरेट करेगा जिसका दोबारा इस्तेमाल किया जा सकता है. इससे इनपुट के किसी भी कॉम्बिनेशन को कमर्शियल स्क्रिप्ट में बदला जा सकता है. इसके बाद, यह कॉम्पोनेंट इस स्क्रिप्ट का इस्तेमाल करेगा. साथ ही, मौजूदा इनपुट (जैसे, "बिल्लियों के लिए एआई की मदद से काम करने वाले नए स्मार्टग्लोव" के साथ "टेक्स्ट" कॉम्पोनेंट) का इस्तेमाल करके, मॉडल को दूसरा प्रॉम्प्ट देगा, ताकि वह फ़ाइनल आउटपुट दे सके. इस आउटपुट को डिसप्ले के लिए, लिंक किए गए किसी दूसरे "टेक्स्ट" कॉम्पोनेंट को भेजा जा सकता है. साथ ही, इसे कनेक्ट किए गए अन्य कॉम्पोनेंट को भी भेजा जा सकता है. जैसे, टेक्स्ट को स्पीच में बदलने के लिए "स्पीच", विज़ुअल जनरेट करने के लिए "इमेज" या आगे की प्रोसेस के लिए अन्य “निर्देश” कॉम्पोनेंट.

  • ज़्यादा कॉन्टेक्स्ट, कई मोड: tldraw के कंप्यूटर में ज़्यादा से ज़्यादा जानकारी देने के लिए, तेज़ स्पीड, ज़्यादा क्षमता, और बेहतर परफ़ॉर्मेंस की ज़रूरत होती है. हर जनरेशन के लिए डेटा उपलब्ध कराने वाले कई कॉम्पोनेंट की वजह से, Gemini 2.0 Flash की बड़ी कॉन्टेक्स्ट विंडो, ऐसे आउटपुट जनरेट करने के लिए ज़रूरी थी जिनमें सभी इनपुट को ध्यान में रखा गया हो. साथ ही, लिखित प्रॉम्प्ट के साथ-साथ इमेज और फ़ाइलों के लिए भी इसकी सहायता ज़रूरी थी.

  • स्ट्रक्चर्ड डेटा: एक ही स्कीमा का इस्तेमाल किए बिना, कॉम्पोनेंट के बीच डेटा ट्रांसफ़र नहीं किया जा सकता. Gemini 2.0 Flash से मिलने वाला स्ट्रक्चर्ड JSON आउटपुट यह पक्का करता है कि वर्कफ़्लो में मौजूद हर कॉम्पोनेंट, किसी भी तरह के डेटा को पहचान सके. साथ ही, उसी स्ट्रक्चर में अपने आउटपुट जनरेट कर सके. इससे, वर्कफ़्लो के रुकने की समस्या नहीं होती और यह आसानी से काम करता है. साथ ही, यह पक्का होता है कि बड़े वर्कफ़्लो भी भरोसेमंद तरीके से पूरे हो सकें.

  • डाइनैमिक तरीके से प्रोसेस जनरेट करना: Gemini 2.0 Flash, पहले से तय की गई प्रोसेस को पूरा करने के साथ-साथ, डाइनैमिक तरीके से प्रोसेस जनरेट कर सकता है. कोई उपयोगकर्ता "इस प्रॉडक्ट के ब्यौरे के आधार पर मार्केटिंग कैंपेन बनाओ" इनपुट कर सकता है. इसके बाद, Gemini 2.0 Flash ज़रूरी चरणों और कॉम्पोनेंट को जनरेट करेगा. साथ ही, उपयोगकर्ता के अनुरोध के आधार पर कैनवस पर वर्कफ़्लो बनाएगा. डाइनैमिक तरीके से कॉन्टेंट जनरेट करने की सुविधा से, उपयोगकर्ताओं को बेहतर अनुभव मिलता है और काम करने का तरीका आसान हो जाता है.

इनोवेशन के लिए क्विक विन

tldraw में कंप्यूटर विज़न को तुरंत लागू करने से, स्टार्टअप के लिए Gemini की वैल्यू प्रपोज़िशन का पता चलता है: तेज़ी से प्रोटोटाइपिंग, सहज आम भाषा वाले इंटरफ़ेस के ज़रिए बेहतर उपयोगकर्ता अनुभव, और Gemini 2.0 Flash जैसे मॉडल की मदद से स्ट्रक्चर्ड डेटा को बेहतर तरीके से मैनेज करना. इस कॉम्बिनेशन की मदद से, छोटी टीमें एआई की मदद से काम करने वाली नई सुविधाओं को कम समय और कम लागत में बना सकती हैं.

“हम यह दिखाना चाहते हैं कि कोई भी टीम, tldraw के कैनवस SDK की मदद से बड़े प्रोजेक्ट बना सकती है. Gemini Flash, तेज़ी से काम करने वाला एक बेहतरीन इंजन था. यह अलग-अलग मोड में काम कर सकता था और कैनवस पर आधारित वर्कफ़्लो टूल के तौर पर काम करता था. Gemini 2.0 और शायद एक बेहतर नाम के साथ, हमें पूरा भरोसा है कि हम कल कंप्यूटर को एक स्टार्टअप के तौर पर पेश कर सकते हैं.”

— स्टीव रुइज़, tldraw के फ़ाउंडर

Gemini API की मदद से अपने ऐप्लिकेशन को बेहतर बनाएं

क्या आप tldraw की सफलता से प्रेरित हैं? Gemini API, आपके ऐप्लिकेशन में एआई की नई सुविधाएं जोड़ने के लिए, Gemini 1.5 Pro, Gemini 1.5 Flash, और अब Gemini 2.0 Flash जैसे बेहतरीन मॉडल उपलब्ध कराता है. Gemini 2.0 Flash, एक्सपेरिमेंट के तौर पर उपलब्ध एक प्रीव्यू मॉडल है. Gemini API के दस्तावेज़ देखें और अपने उपयोगकर्ताओं को एआई की सुविधाएं उपलब्ध कराएं.

क्रिएटिव पेशेवरों, डेवलपर, और सभी तरह की टीमों के लिए, tldraw एक यूनीक और बेहतरीन प्लैटफ़ॉर्म है. इसकी मदद से, आइडिया को हकीकत में बदला जा सकता है. कंप्यूटर के लिए वेटलिस्ट में शामिल हों. विज़ुअल कोलैबरेशन की नई तकनीक का अनुभव आज ही करें.