ترغب بنشر مسار تعليمي؟ اضغط هنا

R00 في NLP4IF-2021 مكافحة المعكرية Covid-19 مع المحولات والمحولات أكثر

R00 at NLP4IF-2021 Fighting COVID-19 Infodemic with Transformers and More Transformers

298   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة النموذج الفائز في المهمة المشتركة باللغة العربية NLP4IF لمحاربة المعكرية CovID-19.الهدف من المهمة المشتركة هو التحقق من التضليل حول Covid-19 في تغريدات عربية.تم تصنيف نموذجنا المقترح الأول مع درجة F1 من 0.780 ونتيجة دقة من 0.762.تم تجربة مجموعة متنوعة من النماذج اللغوية المدربة المستندة إلى المحولات من خلال هذه الدراسة.يعد النموذج الأفضل سجل فرقة من نماذج عربيرت والقاعدة في عربيه، وأربرت.تتمثل إحدى النتائج الرئيسية في الدراسة في إظهار التأثير يمكن أن يكون للمعالجة المسبقة في درجة كل نموذج.بالإضافة إلى وصف النموذج الفائز، تظهر الدراسة الحالية تحليل الأخطاء.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توفر هذه الورقة نظرة عامة مفصلة للنظام ونتائجها، والتي تم إنتاجها كجزء من المهمة المشتركة NLP4IF بشأن مكافحة المعكرات المعاكسة 19 في Naacl 2021. هذه المهمة تم إنجازها باستخدام مجموعة متنوعة من التقنيات.استخدمنا نماذج التمثيل النصية الحديثة للسياق الت ي كانت تم ضبطها بشكل جيد لمهمة المصب في متناول اليد.تم استخدام Arbert، Marbert، أرابيرت، ألبرت العربي وألبرت والقاعدة العربية.وفقا للنتائج، كان لدى Bert-Base-Arabic أعلى درجة 0.784 F1 في مجموعة الاختبار.
نقدم النتائج والنتائج الرئيسية للمهام المشتركة NLP4IF-2021. تركز المهمة 1 على محاربة المعكرات المعاكسة 19 في وسائل التواصل الاجتماعي، وتم عرضها باللغة العربية والكبلانية والإنجليزية. بالنظر إلى تغريدة، طلبت التنبؤ بما إذا كانت هذه التغريدات تحتوي على مطالبة يمكن التحقق منها، وإذا كان الأمر كذلك، فمن المحتمل أن تكون خاطئة، من المحتمل أن تكون ذات مصلحة عامة، من المرجح أن تكون ضارة، وتستحق التحقق من الحقائق اليدوية؛ أيضا، سواء كان ضارا بالمجتمع، وما إذا كان يتطلب انتباه صانعي السياسات. المهمة 2 التي تركز على كشف الرقابة، وتم عرضها باللغة الصينية. ما مجموعه عشرة فرق تقدم أنظمة للمهمة 1، وشارك فريق واحد في المهمة 2؛ قدمت تسعة فرق أيضا ورقة وصف للنظام. هنا، نقدم المهام، وتحليل النتائج، ومناقشة طلبات النظام والأساليب التي استخدموها. حققت معظم التقديمات تحسينات كبيرة على العديد من خطوط الأساس، وأفضل أنظمة تستخدم المحولات المدربة مسبقا وفرق. تتوفر البيانات، والهدوشات ومصدرها للمهام على http://gitlab.com/nlp4if/nlp4if-2021.
وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل قد جربنا عددا من النماذج التعلم العميقة، بما في ذلك تضمين كلمة مختلفة، مثل القفازات، إلمو، من بين أمور أخرى.حقق نموذج Bertweet أفضل درجة F1 بشكل عام من 0.881 وأمنت المرتبة الثالثة على المهمة المذكورة أعلاه.
أصبح الانتشار الهائل للمعلومات الخاطئة عن وسائل التواصل الاجتماعي مخاطر عالمية خاصة في وضع جائحة عالمي مثل Covid-19. وبالتالي أصبح الكشف عن المعلومات الخاطئة موضوعا للأبحاث في الأشهر الأخيرة. في السنوات الأخيرة، تم استخدام نماذج تعلم الآلات الخاضعة ل لإشراف لتحديد المعلومات الخاطئة تلقائيا في وسائل التواصل الاجتماعي. ومع ذلك، فإن معظم نماذج تعلم الآلات هذه تركز فقط على اللغة التي تم تدريبها عليها. بالنظر إلى حقيقة أن منصات وسائل التواصل الاجتماعي تستخدم بلغات مختلفة، فإن إدارة نماذج التعلم في الآلات لكل لغة ستكون كل لغة فوضوية. في هذا البحث، نقوم بتجربة نماذج متعددة اللغات لتحديد معلومات خاطئة في وسائل التواصل الاجتماعي باستخدام مجموعة بيانات كشف مزورة متعددة اللغات تم إصدارها مؤخرا. نظرا لأن النماذج متعددة اللغات تؤدي على قدم المساواة مع النماذج الأولية وأحيانا أفضل من النماذج الأولية للكشف عن معلومات كاذبة في وسائل التواصل الاجتماعي مما يجعلها أكثر فائدة في سيناريوهات العالم الحقيقي.
في هذه الورقة، نصف نظامنا للمهمة المشتركة بشأن مكافحة المعكرية CovID-19 باللغة الإنجليزية.تتألف الهندسة المعمارية المقترحة من نموذج تصنيف متعدد الناتج للمهام السبعة، مع طبقة اهتمام مهام متعددة المهام المتعددة الرأس لمجموع المعلومات المشتركة بين المها م.تم بناء هذا على رأس تمثيل التشفير الثنائي الاتجاه الذي تم الحصول عليه من محول روبرتا.تمكنا من تحقيق درجة F1 متوسط قدرها 0.891 في بيانات الاختبار، مما يؤدي إلى المنصب الثاني في لوحة الاختبار.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا