دليل مهام تصنيف النصوص

مثال على واجهة مستخدم تعرض مراجعة إيجابية لفيلم كإدخال والنتيجة على النحو التالي:
خمس نجوم وعلامة تقييم
بالإصبع

تتيح لك مهمة "تصنيف النصوص" في MediaPipe تصنيف النصوص إلى مجموعة من الفئات المحدّدة، مثل المشاعر الإيجابية أو السلبية. يتم تحديد الفئات أثناء تدريب النموذج. تعمل هذه المهمة على بيانات نصية باستخدام نموذج تعلُّم الآلة (ML) كبيانات ثابتة، وتُخرج قائمة بالفئات ونتائج احتمالية حدوثها.

ننصحك بتجربة الميزة.

البدء

ابدأ استخدام هذه المهمة باتّباع أحد أدلة التنفيذ التالية ل المنصة التي تعمل عليها:

ترشدك هذه الأدلة الخاصة بالنظام الأساسي إلى تنفيذ أساسي لهذه ال tâche، بما في ذلك نموذج مقترَح ومثال على الرمز البرمجي مع خيارات الإعداد المقترَحة.

تفاصيل المهمة

يصف هذا القسم ميزات هذه المهمة ومدخلاتها ومخرجاتها وخيارات الضبط.

الميزات

  • معالجة نص الإدخال: إتاحة وضع علامات خارج الرسم البياني للنماذج بدون وضع علامات داخل الرسم البياني
  • رؤوس تصنيف متعددة: يمكن لكل رأس استخدام مجموعة الفئات الخاصة به.
  • لغة خريطة التصنيف: يمكنك ضبط اللغة المستخدَمة للأسماء المعروضة.
  • الحدّ الأدنى للنتيجة: فلترة النتائج استنادًا إلى نتائج التوقّعات
  • نتائج التصنيف ضمن أفضل k: فلترة عدد نتائج الكشف
  • القائمة المسموح بها والقائمة المحظورة للتصنيف: حدِّد الفئات التي تم رصدها.
مدخلات المهام نتائج المهام
يقبل "تصنيف النصوص" نوع بيانات الإدخال التالي:
  • سلسلة
تُخرج أداة "تصنيف النصوص" قائمة بالفئات التي تحتوي على ما يلي:
  • فهرس الفئة: فهرس الفئة في نواتج النموذج
  • التقييم: تقييم الثقة لهذه الفئة، يتم التعبير عنه كقيمة احتمالية تتراوح بين 0 و1 كقيمة نقطة عائمة.
  • اسم الفئة (اختياري): اسم الفئة كما هو محدّد في البيانات الوصفية لنموذج TensorFlow Lite، في حال توفّرها.
  • الاسم المعروض للفئة (اختياري): اسم معروض للفئة كما هو موضح في البيانات الوصفية لنموذج TensorFlow Lite، باللغة المحدّدة من خلال خيارات لغات الأسماء المعروضة، إن توفّرت.

خيارات الضبط

تتضمّن هذه المهمة خيارات الضبط التالية:

اسم الخيار الوصف نطاق القيمة القيمة التلقائية
displayNamesLocale لضبط لغة التصنيفات لاستخدامها في الأسماء المعروضة المقدَّمة في البيانات الوصفية لنموذج المهمة، في حال توفّرها. القيمة التلقائية هي en لعبارة English. يمكنك إضافة تصنيفات مترجَمة إلى البيانات الوصفية لنموذج مخصّص باستخدام واجهة برمجة التطبيقات TensorFlow Lite Metadata Writer API. رمز اللغة en
maxResults تُستخدَم لتحديد الحد الأقصى الاختياري لعدد نتائج التصنيف التي ستعرضها. إذا كان < 0، سيتم عرض جميع النتائج المتاحة. أي أرقام موجبة -1
scoreThreshold تُستخدَم لضبط الحدّ الأدنى لنتيجة التوقّع الذي يتجاوز الحدّ الأدنى المقدَّم في البيانات الوصفية للنموذج (إن توفّرت). ويتم رفض النتائج التي تقلّ عن هذه القيمة. أيّ عائمة لم يتم الضبط
categoryAllowlist لضبط القائمة الاختيارية لأسماء الفئات المسموح بها. إذا لم تكن فارغة، سيتم استبعاد نتائج التصنيف التي لا يتضمّن اسم فئتها هذه المجموعة. ويتم تجاهل أسماء الفئات المكرّرة أو غير المعروفة. هذا الخيار غير متوافق مع الخيار categoryDenylist، ويؤدي استخدام كلا الخيارَين إلى حدوث خطأ. أي سلاسل لم يتم الضبط
categoryDenylist لضبط القائمة الاختيارية لأسماء الفئات غير المسموح بها. إذا كانت هذه المجموعة ليست فارغة، سيتم فلترة نتائج التصنيف التي يكون اسم فئتها في هذه المجموعة. ويتم تجاهل أسماء الفئات المكرّرة أو غير المعروفة. هذا الخيار متناقض مع الخيار categoryAllowlist، ويؤدي استخدام كليهما إلى حدوث خطأ. أي سلاسل لم يتم الضبط

النماذج

يمكن استخدام "أداة تصنيف النصوص" مع أكثر من نموذج تعلُّم آلي واحد. ابدأ باستخدام النموذج التلقائي المُقترَح للنظام الأساسي المستهدَف عند بدء التطوير باستخدام هذه ال tâche. وعادةً ما توازن النماذج الأخرى المتاحة بين الأداء والدقة والدقة ومتطلبات الموارد، وفي بعض الحالات، تتضمّن ميزات إضافية.

يتم تدريب النماذج المدربة مسبقًا على تحليل المشاعر، وتتوقّع ما إذا كان الانطباع عن النص الذي تم إدخاله إيجابيًا أو سلبيًا. تم تدريب النماذج على مجموعة بيانات SST-2 (Stanford Sentiment Treebank)، والتي تتألف من مراجعات أفلام مصنّفة على أنّها إيجابية أو سلبية. تجدر الإشارة إلى أنّ النماذج تتيح استخدام اللغة الإنجليزية فقط. وبما أنّه تم تدريبها على قراءة مجموعة بيانات تتضمّن مراجعات الأفلام، قد تلاحظ انخفاضًا في جودة النص الذي يتناول مجالات موضوعية أخرى.

يستخدم هذا النموذج بنية مستندة إلى BERT (على وجه التحديد، نموذج MobileBERT)، ويُنصح به بسبب دقة العالية. يحتوي على بيانات وصفية تسمح للمهمة بتنفيذ BERT تجزئة خارج الرسم البياني.

اسم الطراز شكل الإدخال نوع التقريب الإصدارات
BERT-classifier [1x128],[1x128],[1x128] النطاق الديناميكي الأحدث

متوسّط نموذج إدراج الكلمات

يستخدم هذا النموذج بنية متوسطة لدمج الكلمات. يقدّم هذا النموذج حجمًا أصغر للنموذج ووقت استجابة أقل، ولكن على حساب دقة أقل في التنبؤ مقارنةً بتصنيف BERT. إنّ تخصيص هذا النموذج من خلال تدريب إضافي أسرع أيضًا من تدريب المصنّف المستنِد إلى BERT. يحتوي هذا النموذج على بيانات وصفية تسمح للمهمة بتنفيذ تحليل نحوي للسلسلة العادية خارج الرسم البياني.

اسم الطراز شكل الإدخال نوع التقريب الإصدارات
متوسط إدراج الكلمات ‫1 x ‏256 لا شيء (float32) الأحدث

مقاييس أداء المهام

في ما يلي مقاييس أداء المهام لعملية المعالجة بأكملها استنادًا إلى نماذج التدريب المُسبَق أعلاه. نتيجة وقت الاستجابة هي متوسط وقت الاستجابة على هاتف Pixel 6 باستخدام وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات (GPU).

اسم النموذج وقت استجابة وحدة المعالجة المركزية وقت استجابة وحدة معالجة الرسومات
متوسط إدراج الكلمات 0.14 ملي ثانية -
مصنِّف BERT 57.68 ملي ثانية -

النماذج المخصّصة

يمكنك استخدام نموذج تعلُّم آلي مخصّص مع هذه المهمة إذا كنت تريد تحسين قدرات النماذج المقدَّمة أو تغييرها. يمكنك استخدام Model Maker لتعديل النماذج الحالية أو إنشاء نموذج باستخدام أدوات مثل TensorFlow. يجب أن تكون النماذج المخصّصة المستخدَمة مع MediaPipe بتنسيق TensorFlow Lite ويجب أن تتضمّن metadata محدّدة تصف مَعلمات تشغيل النموذج. ننصحك باستخدام "أداة إنشاء النماذج" لتعديل النماذج المقدَّمة لهذه المهمة قبل إنشاء نموذجك الخاص.