ترغب بنشر مسار تعليمي؟ اضغط هنا

Icompass في NLP4IF-2021 - قتال المعكرية CovID-19

iCompass at NLP4IF-2021--Fighting the COVID-19 Infodemic

410   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توفر هذه الورقة نظرة عامة مفصلة للنظام ونتائجها، والتي تم إنتاجها كجزء من المهمة المشتركة NLP4IF بشأن مكافحة المعكرات المعاكسة 19 في Naacl 2021. هذه المهمة تم إنجازها باستخدام مجموعة متنوعة من التقنيات.استخدمنا نماذج التمثيل النصية الحديثة للسياق التي كانت تم ضبطها بشكل جيد لمهمة المصب في متناول اليد.تم استخدام Arbert، Marbert، أرابيرت، ألبرت العربي وألبرت والقاعدة العربية.وفقا للنتائج، كان لدى Bert-Base-Arabic أعلى درجة 0.784 F1 في مجموعة الاختبار.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة النموذج الفائز في المهمة المشتركة باللغة العربية NLP4IF لمحاربة المعكرية CovID-19.الهدف من المهمة المشتركة هو التحقق من التضليل حول Covid-19 في تغريدات عربية.تم تصنيف نموذجنا المقترح الأول مع درجة F1 من 0.780 ونتيجة دقة من 0.762.تم تجر بة مجموعة متنوعة من النماذج اللغوية المدربة المستندة إلى المحولات من خلال هذه الدراسة.يعد النموذج الأفضل سجل فرقة من نماذج عربيرت والقاعدة في عربيه، وأربرت.تتمثل إحدى النتائج الرئيسية في الدراسة في إظهار التأثير يمكن أن يكون للمعالجة المسبقة في درجة كل نموذج.بالإضافة إلى وصف النموذج الفائز، تظهر الدراسة الحالية تحليل الأخطاء.
نقدم النتائج والنتائج الرئيسية للمهام المشتركة NLP4IF-2021. تركز المهمة 1 على محاربة المعكرات المعاكسة 19 في وسائل التواصل الاجتماعي، وتم عرضها باللغة العربية والكبلانية والإنجليزية. بالنظر إلى تغريدة، طلبت التنبؤ بما إذا كانت هذه التغريدات تحتوي على مطالبة يمكن التحقق منها، وإذا كان الأمر كذلك، فمن المحتمل أن تكون خاطئة، من المحتمل أن تكون ذات مصلحة عامة، من المرجح أن تكون ضارة، وتستحق التحقق من الحقائق اليدوية؛ أيضا، سواء كان ضارا بالمجتمع، وما إذا كان يتطلب انتباه صانعي السياسات. المهمة 2 التي تركز على كشف الرقابة، وتم عرضها باللغة الصينية. ما مجموعه عشرة فرق تقدم أنظمة للمهمة 1، وشارك فريق واحد في المهمة 2؛ قدمت تسعة فرق أيضا ورقة وصف للنظام. هنا، نقدم المهام، وتحليل النتائج، ومناقشة طلبات النظام والأساليب التي استخدموها. حققت معظم التقديمات تحسينات كبيرة على العديد من خطوط الأساس، وأفضل أنظمة تستخدم المحولات المدربة مسبقا وفرق. تتوفر البيانات، والهدوشات ومصدرها للمهام على http://gitlab.com/nlp4if/nlp4if-2021.
وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل قد جربنا عددا من النماذج التعلم العميقة، بما في ذلك تضمين كلمة مختلفة، مثل القفازات، إلمو، من بين أمور أخرى.حقق نموذج Bertweet أفضل درجة F1 بشكل عام من 0.881 وأمنت المرتبة الثالثة على المهمة المذكورة أعلاه.
في هذه الورقة، نصف نظامنا للمهمة المشتركة بشأن مكافحة المعكرية CovID-19 باللغة الإنجليزية.تتألف الهندسة المعمارية المقترحة من نموذج تصنيف متعدد الناتج للمهام السبعة، مع طبقة اهتمام مهام متعددة المهام المتعددة الرأس لمجموع المعلومات المشتركة بين المها م.تم بناء هذا على رأس تمثيل التشفير الثنائي الاتجاه الذي تم الحصول عليه من محول روبرتا.تمكنا من تحقيق درجة F1 متوسط قدرها 0.891 في بيانات الاختبار، مما يؤدي إلى المنصب الثاني في لوحة الاختبار.
مع ظهور جائحة Covid-19، تم دمج الجوانب السياسية والطبية المتمثلة في التضليل حيث حصلت المشكلة على ارتفاع إلى مستوى جديد تماما لتصبح أول انفجار عالمي. تم إعلان محاربة هذا المعف النقود أحد أهم مجالات التركيز في منظمة الصحة العالمية، مع وجود مخاطر تتراوح من تعزيز العلاجات المزيفة والشائعات ونظريات المؤامرة لنشر كراهية الأجانب والذعر. يتطلب معالجة القضية حل عدد من المشاكل الصعبة مثل تحديد الرسائل التي تحتوي على مطالبات، وتحديد الجدارة الشيكية والوصيل لها، وإمكاناتها لإيذاءها وكذلك طبيعة هذا الضرر، لنذكر عدد قليل فقط. لمعالجة هذه الفجوة، نقوم بإصدار مجموعة بيانات كبيرة من 16 ألف تغريدات مشروح يدويا لتحليل التهيئة الدقيقة التي يركز عليها (ط) على CovID-19، (II) تجمع بين وجهات النظر ومصالح الصحفيين، ومساجي الحقائق، ومنصات وسائل التواصل الاجتماعي ، صانعي السياسات، والمجتمع، و (3) يغطي العربية والكبلانية والهولندية والإنجليزية. أخيرا، نظهر نتائج تقييم قوية باستخدام محولات مسبقا، وبالتالي تؤكد الأداة المساعدة العملة لمجموعة البيانات في أحادي التوتر مقابل تعدد اللغات، ومهمة واحدة مقابل إعدادات متعددة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا