ترغب بنشر مسار تعليمي؟ اضغط هنا

CFILT IIT Bombay @ LT-EDI-EACL 2021: الكشف عن الكلام للأمل للمساواة والتنوع والإدماج باستخدام تمثيل متعدد اللغات من المحولات

CFILT IIT Bombay@LT-EDI-EACL2021: Hope Speech Detection for Equality, Diversity, and Inclusion using Multilingual Representation fromTransformers

301   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مع أن تصبح الإنترنت جزءا لا يتجزأ من حياتنا، زادت المشاركة في وسائل التواصل الاجتماعي كثيرا. أصبح تحديد المحتوى الهجومي والقضاء عليه من وسائل التواصل الاجتماعي بأولوية قصوى لمنع أي نوع من العنف. ومع ذلك، فإن اكتشاف المحتوى المشجع والداعم والإيجابي مهم بنفس القدر لمنع إساءة استخدام الرقابة المستهدفة لمهاجمة حرية التعبير. تقدم هذه الورقة نظامنا للكشف عن الكلام المهمة المشتركة للأمل للهاتف والتنوع وإدراجه في LT-EDI، EACL 2021. يتم توفير بيانات هذه المهمة المشتركة باللغة الإنجليزية والتاميل والمالايالامية التي تم جمعها من تعليقات YouTube. إنها مشكلة تصنيف متعدد الألوان حيث يتم تصنيف كل مثيل بيانات في أحد الفئات الثلاثة: خطاب الأمل "، وليس الكلام"، وليس في اللغة المقصودة ". نقترح نظام يستخدم نماذج محولات متعددة اللغات للحصول على تمثيل النص وتصنيفه إلى أحد الفئات الثلاثة. استكشفنا استخدام النماذج متعددة اللغات المدربة خصيصا للغات الهندية جنبا إلى جنب مع نماذج متعددة اللغات العامة. تم تصنيف نظامنا في المرتبة الثانية للغة الإنجليزية والثاني للأللايالام، والسابع من أجل لغة التاميل في مجلس الإدارة النهائي الذي نشره المنظمون وحصلوا على درجة مئوية F1 من 0.92، 0.84، 0.55 على التوالي على مجموعة بيانات الاختبار الخفية المستخدمة في المنافسة. لقد جعلنا نظامنا متاحا علنا ​​في جيثب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه الورقة تقديم فريق IIITK إلى اكتشاف الكلام في الأمل للهاتف والتنوع والإدراج في المهمة المشتركة لغات Dravidian التي نظمتها LT-EDI 2021 ورشة عمل @ EACL 2021. أفضل تكوينات المهام المشتركة تحقق درجات F1 المرجح من 0.60 من أجل التاميل0.83 للمالايال ام، و 0.93 للغة الإنجليزية.لقد حصلنا على صفوف من 4 و 3 و 2 في التاميل المالايالام والإنجليزية على التوالي.
التحليل والكشف عن البيانات المختلطة من الكود أمر حتمي في الأوساط الأكاديمية والصناعة، في بلد متعدد اللغات مثل الهند، من أجل حل المشاكل معالجة اللغة الطبيعية في Apropos.تقترح هذه الورقة ذاكرة قصيرة الأجل الطويلة الأجل (Bilstm) مع النهج القائم على الاه تمام، في حل مشكلة الكشف عن الكلام الأمل.باستخدام هذا النهج، تم تحقيق نتيجة F1 من 0.73 (9 أنثو) في مجموعة بيانات ملليالامية - من بين ما مجموعه 31 فريقا شاركت في المسابقة.
تعتبر الأمل مهمة بالنسبة لرفاهية الحياة البشرية واستعادتها من قبل المهنيين الصحيين.يعكس خطاب الأمل الاعتقاد بأن المرء يمكنه اكتشاف مسارات لأهدافها المرجوة وتصبح طرحا للاستفادة من هذه المسارات.لتشجيع البحث في معالجة اللغة الطبيعية نحو نهج التعزيز الإي جابي، أنشأنا مجموعة بيانات الكشف عن الكلام الأمل.هذه التقارير الورقية عن المهمة المشتركة الخاصة باكتشاف الكلام للأمل للتاميل والإنجليزية واللغات المالايالامية.أجريت المهمة المشتركة كجزء من ورشة عمل EACL 2021 حول تكنولوجيا اللغة للمساواة والتنوع والإدماج (LT-EDI-2021).نحن تلخص هنا مجموعات البيانات الخاصة بهذا التحدي المتوفرة بصراحة في https://competitions.codalab.org/competitions/27653، وتقديم نظرة عامة على الأساليب ونتائج النظم المنافسة.إلى حد ما من معرفتنا، هذه هي المهمة المشتركة الأولى لإجراء الكشف عن الكلام الأمل.
في هذه الورقة نعمل مع كورسيا الكشف عن الكلام تتضمن مجموعات بيانات اللغة الإنجليزية والتاميل والمالياالام.نقدم آلية مرحلتين لاكتشاف خطاب الأمل.في المرحلة الأولى، نبني مصنف لتحديد لغة النص.في المرحلة الثانية، نبني مصنف للكشف عن خطاب الأمل أو الكلام غير الأمل أو لا تانج.تظهر النتائج التجريبية أن الكشف عن الكلام الأمل صعبة وهناك مجال للتحسين.
في هذه الورقة، نصف نهجنا تجاه استخدام النماذج المدربة مسبقا لمهمة الكشف عن الكلام الأمل.شاركنا في المهمة 2: الكشف عن الكلام للأمل للتساوي والتنوع والإدماج في LT-EDI-2021 @ EACL2021.الهدف من هذه المهمة هو التنبؤ بحضور خطاب الأمل، إلى جانب وجود العينات التي لا تنتمي إلى نفس اللغة في مجموعة البيانات.نحن نصف نهجنا لضبط روبرتا من أجل الكشف عن الكلام على الأمل باللغة الإنجليزية ونهجنا لضبط XLM-Roberta من أجل الكشف عن الكلام في التاميل والمالايالام، وهو لغتين منخفضان من الموارد.نوضح أداء نهجنا على تصنيف النص في الأمل، غير الأمل وغير اللغة.تصنيفنا في المرتبة الأولى في اللغة الإنجليزية (F1 = 0.93)، الأول في التاميل (F1 = 0.61) و 3 في مالايالام (F1 = 0.83).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا