في هذه الورقة، نصف نهجنا تجاه استخدام النماذج المدربة مسبقا لمهمة الكشف عن الكلام الأمل.شاركنا في المهمة 2: الكشف عن الكلام للأمل للتساوي والتنوع والإدماج في LT-EDI-2021 @ EACL2021.الهدف من هذه المهمة هو التنبؤ بحضور خطاب الأمل، إلى جانب وجود العينات التي لا تنتمي إلى نفس اللغة في مجموعة البيانات.نحن نصف نهجنا لضبط روبرتا من أجل الكشف عن الكلام على الأمل باللغة الإنجليزية ونهجنا لضبط XLM-Roberta من أجل الكشف عن الكلام في التاميل والمالايالام، وهو لغتين منخفضان من الموارد.نوضح أداء نهجنا على تصنيف النص في الأمل، غير الأمل وغير اللغة.تصنيفنا في المرتبة الأولى في اللغة الإنجليزية (F1 = 0.93)، الأول في التاميل (F1 = 0.61) و 3 في مالايالام (F1 = 0.83).
In this paper, we describe our approach towards utilizing pre-trained models for the task of hope speech detection. We participated in Task 2: Hope Speech Detection for Equality, Diversity and Inclusion at LT-EDI-2021 @ EACL2021. The goal of this task is to predict the presence of hope speech, along with the presence of samples that do not belong to the same language in the dataset. We describe our approach to fine-tuning RoBERTa for Hope Speech detection in English and our approach to fine-tuning XLM-RoBERTa for Hope Speech detection in Tamil and Malayalam, two low resource Indic languages. We demonstrate the performance of our approach on classifying text into hope-speech, non-hope and not-language. Our approach ranked 1st in English (F1 = 0.93), 1st in Tamil (F1 = 0.61) and 3rd in Malayalam (F1 = 0.83).
المراجع المستخدمة
https://aclanthology.org/
تهدف هذه الورقة إلى وصف النهج الذي اعتدنا عليه اكتشاف خطاب الأمل في مجموعة بيانات Hopeiedi.جربنا مع نهجين.في النهج الأول، استخدمنا ادارة سياقية لتدريب المصنفات باستخدام الانحدار اللوجستي، والغابات العشوائية، و SVM، و LSTM.النهج الثاني المعني باستخدام
في عالم مع تحديات خطيرة مثل تغير المناخ والصراعات الدينية والسياسية، والأوبئة العالمية والإرهاب، والتمييز العنصري، وهو إنترنت مليء بخطاب الكراهية، والمحتوى المسيء والهجوم هو آخر شيء نرغب فيه.في هذه الورقة، نعمل على تحديد وتعزيز المحتوى الإيجابي والدا
الأمل هو جانب أساسي من استقرار الصحة العقلية والانتعاش في كل فرد في هذا العالم سريع المتغير.ستكون أي أدوات وأساليب تم تطويرها للكشف والتحليل وتوليد خطاب الأمل مفيدا.في هذه الورقة، نقترح نموذجا على اكتشاف الأمل في الأمل للكشف تلقائيا عن محتوى الويب ال
التحليل والكشف عن البيانات المختلطة من الكود أمر حتمي في الأوساط الأكاديمية والصناعة، في بلد متعدد اللغات مثل الهند، من أجل حل المشاكل معالجة اللغة الطبيعية في Apropos.تقترح هذه الورقة ذاكرة قصيرة الأجل الطويلة الأجل (Bilstm) مع النهج القائم على الاه
التراجع السريع للشبكات الاجتماعية عبر الإنترنت مثل YouTube، Facebook، Twitter يسمح للناس بالتعبير عن آرائهم على نطاق واسع على الإنترنت.ومع ذلك، في الوقت نفسه، يمكن أن يؤدي إلى زيادة في الصراع والكراهية بين المستهلكين في شكل حرية خطاب.لذلك، من الضروري