ترغب بنشر مسار تعليمي؟ اضغط هنا

متفائل الرجال @ LT-EDI-EACL2021: الكشف عن الكلام الأمل باستخدام نظام الترجمة والمحولات

Hopeful Men@LT-EDI-EACL2021: Hope Speech Detection Using Indic Transliteration and Transformers

257   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تهدف هذه الورقة إلى وصف النهج الذي اعتدنا عليه اكتشاف خطاب الأمل في مجموعة بيانات Hopeiedi.جربنا مع نهجين.في النهج الأول، استخدمنا ادارة سياقية لتدريب المصنفات باستخدام الانحدار اللوجستي، والغابات العشوائية، و SVM، و LSTM.النهج الثاني المعني باستخدام فرقة التصويت للأغلبية من 11 نماذج تم الحصول عليها عن طريق نماذج محولات محول مدربة مسبقا (بيرت، ألبرت، روبرتا، Inderbert) بعد إضافة طبقة إخراج.وجدنا أن النهج الثاني كان متفوقا على اللغة الإنجليزية والتاميل والمالايالامية.حصل حلنا على درجة مرجحة F1 من 0.93 و 0.75 و 0.49 للغة الإنجليزية ومالايالامية والتاميل على التوالي.احتل محلولنا في المرتبة الأولى باللغة الإنجليزية، الثامن في ملايال و 11 في التاميل.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نصف نهجنا تجاه استخدام النماذج المدربة مسبقا لمهمة الكشف عن الكلام الأمل.شاركنا في المهمة 2: الكشف عن الكلام للأمل للتساوي والتنوع والإدماج في LT-EDI-2021 @ EACL2021.الهدف من هذه المهمة هو التنبؤ بحضور خطاب الأمل، إلى جانب وجود العينات التي لا تنتمي إلى نفس اللغة في مجموعة البيانات.نحن نصف نهجنا لضبط روبرتا من أجل الكشف عن الكلام على الأمل باللغة الإنجليزية ونهجنا لضبط XLM-Roberta من أجل الكشف عن الكلام في التاميل والمالايالام، وهو لغتين منخفضان من الموارد.نوضح أداء نهجنا على تصنيف النص في الأمل، غير الأمل وغير اللغة.تصنيفنا في المرتبة الأولى في اللغة الإنجليزية (F1 = 0.93)، الأول في التاميل (F1 = 0.61) و 3 في مالايالام (F1 = 0.83).
التحليل والكشف عن البيانات المختلطة من الكود أمر حتمي في الأوساط الأكاديمية والصناعة، في بلد متعدد اللغات مثل الهند، من أجل حل المشاكل معالجة اللغة الطبيعية في Apropos.تقترح هذه الورقة ذاكرة قصيرة الأجل الطويلة الأجل (Bilstm) مع النهج القائم على الاه تمام، في حل مشكلة الكشف عن الكلام الأمل.باستخدام هذا النهج، تم تحقيق نتيجة F1 من 0.73 (9 أنثو) في مجموعة بيانات ملليالامية - من بين ما مجموعه 31 فريقا شاركت في المسابقة.
في عالم مع تحديات خطيرة مثل تغير المناخ والصراعات الدينية والسياسية، والأوبئة العالمية والإرهاب، والتمييز العنصري، وهو إنترنت مليء بخطاب الكراهية، والمحتوى المسيء والهجوم هو آخر شيء نرغب فيه.في هذه الورقة، نعمل على تحديد وتعزيز المحتوى الإيجابي والدا عم على هذه المنصات.نحن نعمل مع العديد من النماذج القائمة على المحولات لتصنيف تعليقات وسائل التواصل الاجتماعي ككلام نأمل أو عدم الأمل باللغات باللغة الإنجليزية، مالايالام، وتاميل.تصور هذه الورقة عملنا للمهمة المشتركة على اكتشاف خطاب الأمل للهاتف والتنوع والتنوع والإدماج في LT-EDI 2021- EACL 2021. يمكن عرض رموز أفضل طلباتنا.
في هذه الورقة نعمل مع كورسيا الكشف عن الكلام تتضمن مجموعات بيانات اللغة الإنجليزية والتاميل والمالياالام.نقدم آلية مرحلتين لاكتشاف خطاب الأمل.في المرحلة الأولى، نبني مصنف لتحديد لغة النص.في المرحلة الثانية، نبني مصنف للكشف عن خطاب الأمل أو الكلام غير الأمل أو لا تانج.تظهر النتائج التجريبية أن الكشف عن الكلام الأمل صعبة وهناك مجال للتحسين.
تقدم هذه الورقة بشكل أساسي المحتوى ذي الصلة للكشف عن خطاب الأمل للمهمة للمساواة والتنوع والإدراج في LT-EDI 2021-EACL 2021 ''.تم توفير ما مجموعه ثلاث مجموعات بيانات لغوية، ونختار مجموعة البيانات الإنجليزية لإكمال هذه المهمة.الهدف المهمة المحددة هو تصن يف الكلام المحدد إلى خطاب الأمل "، وليس الكلام الأمل"، وليس في اللغة المقصودة ".فيما يتعلق بالطريقة، نستخدم Albert Tuned و K Fold Validation لإنجاز هذه المهمة.في النهاية، حققنا نتيجة جيدة في قائمة رتبة النتيجة المهمة، وكانت النتيجة F1 النهائية 0.93، ربط للمكان الأول.ومع ذلك، سوف نستمر في محاولة تحسين الأساليب للحصول على نتائج أفضل في العمل في المستقبل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا