ترغب بنشر مسار تعليمي؟ اضغط هنا

Wanlp 2021 المهمة المشتركة: نحو كشف المفارقة والشعور في تغريدات عربية باستخدام Multi-head-lstm-cnn-gru و marbert

WANLP 2021 Shared-Task: Towards Irony and Sentiment Detection in Arabic Tweets using Multi-headed-LSTM-CNN-GRU and MaRBERT

203   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المفارقة والكشف عن المعنويات مهمة لفهم سلوك الناس وأفكار الناس.وبالتالي أصبحت مهمة شعبية في معالجة اللغة الطبيعية (NLP).هذه الورقة تقدم النتائج والنتائج الرئيسية في المهام المشتركة WANLP 2021 واحدة واثنين.استندت المهمة إلى DataSet Arsarcasm-V2 (أبو فرحة وآخرون، 2021).في هذه الورقة، نحن نصف نظامنا متعدد الرؤوس LSTM-CNN-GRU وكذلك ماربرت (عبد المجيد وآخرون، 2021) مقدم لهذه المهمة المشتركة، المرتبة 10 من أصل 27 في مهمة مشتركة تحقيق واحد 0.5662 F1-Sarcasmوتحتل المرتبة 3 من 22 في المهمة المشتركة اثنين من تحقيق 0.7321 F1-PN تحت اسم مستخدم Codalab Rematchka ''.لقد جربنا نماذج مختلفة، وهناك نماذج أفضل أداء هي مجموعة من cnn-lstm متعددة برأسنا، حيث استخدمنا نص prepossessed و emoji المقدمة من تغريدات وماربرت.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توفر هذه الورقة نظرة عامة على المهمة المشتركة WANLP 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية.المهمة المشتركة لها مفتاحان فرعي: الكشف عن السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).تهدف هذه المهمة المشتركة إلى الترويج والاهتمام بالكشف عن السخرية العربية، وهو أمر بالغ الأهمية لتحسين الأداء في مهام أخرى مثل تحليل المعرفات.تتكون DataSet المستخدمة في هذه المهمة المشتركة، وهي Arsarcasm-V2، من 15،548 تغريدات تسمى السخرية والشعور واللهجة.تلقينا 27 و 22 عروضا للمجموعات الفرعية 1 و 2 على التوالي.تعتمد معظم النهج على استخدام النماذج اللغوية المدربة مسبقا وضبطها جيدا مثل أرابيرت وماربرت.وكانت أفضل النتائج التي تحققت في مهام تحليل السخرية وتحليل المعنويات 0.6225 F1 و 0.748 F1-PN على التوالي.
في هذه المهمة المشتركة، تقترح هذه الورقة طريقة للجمع بين نموذج ناقلات Word القائم على BERT ومقدمة تنبؤ LSTM للتنبؤ بقيم التكافؤ والإثارة في النص.من بينها، ناقل الكلمات المستند إلى بيرت هو 768 ثيم، ويتم تغذية كل ناقلات كلمة في الجملة بالتتابع لطراز LS TM للتنبؤ.تظهر النتائج التجريبية أن أداء طريقة لدينا المقترحة أفضل من نتائج نموذج الانحدار لاسو.
تقدم هذه الورقة استراتيجيتنا لمعالجة المهمة المشتركة EACL WANLP-2021: السخرية والكشف عن المعنويات.يهدف أحد المهن الفرعية إلى تطوير نظام يحدد ما إذا كانت سقسقة عربية معينة ساخرة في الطبيعة أم لا، في حين أن الآخر يهدف إلى تحديد مشاعر سقسقة اللغة العربي ة.نحن نقترب من المهمة في خطوتين.تتضمن الخطوة الأولى مسبقا لمعلومات البيانات المقدمة من خلال إجراء الإدراج والحذف وعمليات التجزئة في أجزاء مختلفة من النص.تنطوي الخطوة الثانية على تجربة متغيرات متعددة من نماذج محولتين، Araelectra وعربت.تم تصنيف نهجنا النهائي في المرتبة السابعة والرابعة في المهاجمين والكشف عن المشاعر الفرعية على التوالي.
نحن نستخدم محولات Macbert وضبطها بشكل جيد على المهام المشتركة Rocling-2021 باستخدام بيانات CVAT و CVAS.قارنا أداء ماكبيرت مع اثنين من المحولاتين الآخرين وروبرتا في الأبعاد الإثارة، على التوالي.تم استخدام معامل ماي والارتباط (ص) كمقاييس التقييم.على مج موعة اختبار Rocling-2021، يحقق نموذج Macbert المستخدم الخاص بنا 0.611 من MAE و 0.904 من R في أبعاد التكافؤ؛و 0.938 من ماي و 0.549 من ص في البعد الإثرا.
السخرية هي واحدة من التحديات الرئيسية لأنظمة تحليل المعنويات بسبب استخدام الصياغة غير المباشرة الضمنية للتعبير عن الآراء، وخاصة باللغة العربية.تقدم هذه الورقة النظام الذي قدمناه إلى المهمة الكشف عن السخرية والشاحنات الخاصة بمهمة WANLP-2021 القادرة عل ى التعامل مع كل من المهارات الفرعية.نقوم أولا بإجراء ضبط جيد على نوعين من نماذج اللغة المدربة مسبقا (PLMS) مع استراتيجيات تدريب مختلفة.ثم يتم تطبيق آلية تكديس فعالة على رأس Plms المصنفات الدقيقة للحصول على التنبؤ النهائي.النتائج التجريبية على DataSet Arsarcasm-V2 تظهر فعالية طريقتنا ونحن نحتل المرتبة الثالثة والثانية للحصول على التراكب الفرعي 1 و 2.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا