भाषा का पता लगाने वाली गाइड

यूज़र इंटरफ़ेस (यूआई) का उदाहरण, जिसमें फ़्रेंच में लिखा गया एक वाक्य दिखाया गया है. आउटपुट में, इस वाक्य को फ़्रेंच के तौर पर सही तरीके से पहचाना गया है.

MediaPipe Language Detector टास्क की मदद से, किसी टेक्स्ट की भाषा की पहचान की जा सकती है. यह टास्क, मशीन लर्निंग (एमएल) मॉडल की मदद से टेक्स्ट डेटा पर काम करता है. साथ ही, अनुमान की एक सूची दिखाता है. इसमें हर अनुमान में ISO 639-1 भाषा कोड और संभावना शामिल होती है.

इसे आज़माएं!

शुरू करें

अपने टारगेट प्लैटफ़ॉर्म के लिए, लागू करने से जुड़ी इनमें से किसी एक गाइड का पालन करके, इस टास्क का इस्तेमाल शुरू करें. प्लैटफ़ॉर्म के हिसाब से बनी इन गाइड में, इस टास्क को लागू करने का बुनियादी तरीका बताया गया है. इनमें सुझाया गया मॉडल और सुझाए गए कॉन्फ़िगरेशन विकल्पों के साथ कोड का उदाहरण भी शामिल है:

टास्क की जानकारी

इस सेक्शन में, इस टास्क की सुविधाओं, इनपुट, आउटपुट, और कॉन्फ़िगरेशन के विकल्पों के बारे में बताया गया है.

सुविधाएं

  • स्कोर थ्रेशोल्ड - अनुमान के स्कोर के आधार पर नतीजे फ़िल्टर करना
  • अनुमति वाली सूची और ब्लॉकलिस्ट को लेबल करना - पता लगाई गई कैटगरी की जानकारी दें
टास्क के इनपुट टास्क के आउटपुट
भाषा का पता लगाने वाली सुविधा, इनपुट डेटा के इस टाइप को स्वीकार करती है:
  • स्ट्रिंग
भाषा का पता लगाने वाला टूल, अनुमान की एक सूची दिखाता है. इसमें ये शामिल हैं:
    • भाषा कोड: ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) के मुताबिक, भाषा / स्थानीय भाषा का कोड.जैसे, अंग्रेज़ी के लिए "en", उज़बेक के लिए "uz", और जैपनीज़ (रोमाजी) के लिए "ja-Latn". यह कोड, स्ट्रिंग के तौर पर होना चाहिए.
    • संभावना: इस अनुमान के लिए कॉन्फ़िडेंस स्कोर, जो फ़्लोटिंग पॉइंट वैल्यू के तौर पर, शून्य से एक के बीच की संभावना के तौर पर दिखाया जाता है.

कॉन्फ़िगरेशन के विकल्प

इस टास्क के लिए, कॉन्फ़िगरेशन के ये विकल्प उपलब्ध हैं:

विकल्प का नाम ब्यौरा वैल्यू की रेंज डिफ़ॉल्ट मान
max_results सबसे ज़्यादा स्कोर वाली भाषा के अनुमान की ज़्यादा से ज़्यादा संख्या सेट करता है. हालांकि, ऐसा करना ज़रूरी नहीं है. अगर यह वैल्यू शून्य से कम है, तो सभी उपलब्ध नतीजे दिखाए जाते हैं. कोई भी पॉज़िटिव संख्या -1
score_threshold अनुमान के स्कोर का थ्रेशोल्ड सेट करता है. यह थ्रेशोल्ड, मॉडल के मेटाडेटा में दिए गए थ्रेशोल्ड (अगर कोई है) को बदल देता है. इस वैल्यू से कम के नतीजे अस्वीकार कर दिए जाते हैं. कोई भी फ़्लोट सेट नहीं है
category_allowlist इस्तेमाल की अनुमति वाली भाषाओं के कोड की वैकल्पिक सूची सेट करता है. अगर यह सेट नहीं है, तो भाषा के उन अनुमान को फ़िल्टर कर दिया जाएगा जिनका भाषा कोड इस सेट में नहीं है. यह विकल्प, category_denylist के साथ इस्तेमाल नहीं किया जा सकता. दोनों का इस्तेमाल करने पर गड़बड़ी का मैसेज दिखता है. कोई भी स्ट्रिंग सेट नहीं है
category_denylist भाषा कोड की ऐसी वैकल्पिक सूची सेट करता है जिनकी अनुमति नहीं है. अगर यह सेट नहीं है, तो भाषा के जिन अनुमानों का भाषा कोड इस सेट में है उन्हें फ़िल्टर कर दिया जाएगा. यह विकल्प, category_allowlist के साथ काम नहीं करता. साथ ही, दोनों का इस्तेमाल करने पर गड़बड़ी होती है. कोई भी स्ट्रिंग सेट नहीं है

मॉडल

इस टास्क के साथ डेवलपमेंट शुरू करने पर, हम डिफ़ॉल्ट रूप से सुझाया गया मॉडल उपलब्ध कराते हैं.

यह मॉडल, लाइटवेट (315 केबी) बनाने के लिए बनाया गया है. साथ ही, यह एम्बेडिंग पर आधारित, नेटवर्क क्लासिफ़िकेशन आर्किटेक्चर का इस्तेमाल करता है. यह मॉडल, ISO 639-1 भाषा कोड का इस्तेमाल करके भाषा की पहचान करता है. साथ ही, यह 110 भाषाओं की पहचान कर सकता है. इस मॉडल के साथ काम करने वाली भाषाओं की सूची के लिए, लेबल फ़ाइल देखें. इसमें भाषाओं को उनके आईएसओ 639-1 कोड के हिसाब से दिखाया जाता है.

मॉडल का नाम इनपुट का आकार क्वांटाइज़ेशन का टाइप मॉडल कार्ड वर्शन
Language Detector स्ट्रिंग UTF-8 कोई नहीं (float32) info हाल ही के अपडेट

टास्क के मानदंड

यहां पूरी पाइपलाइन के लिए टास्क के मानदंड दिए गए हैं. ये मानदंड, ऊपर दिए गए पहले से ट्रेन किए गए मॉडल पर आधारित हैं. इंतज़ार का समय, सीपीयू / जीपीयू का इस्तेमाल करके Pixel 6 पर औसत इंतज़ार का समय होता है.

मॉडल का नाम सीपीयू के इंतज़ार का समय जीपीयू में इंतज़ार का समय
भाषा की पहचान करने की सुविधा 0.31 मिलीसेकंड -