ترغب بنشر مسار تعليمي؟ اضغط هنا

NLPIITR في مهمة Semeval-2021 6: نموذج روبرتا مع تكبير البيانات للكشف عن تقنيات الإقناع

NLPIITR at SemEval-2021 Task 6: RoBERTa Model with Data Augmentation for Persuasion Techniques Detection

293   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من ميمي يستخدم غالبا في حملة تضليل للتأثير على المستخدمين.توفر الورقة مقارنة واسعة النطاق بين مختلف أنظمة تعليم الآلات كحل للمهمة.نقوم بتوصيل المعالجة المسبقة للبيانات النصية لصالح المهمة وعدة طرق للتغلب على خلل الفصل.تظهر النتائج أن ضبط نموذج روبرتا يعطى أفضل النتائج مع نقاط F1-Micro من 0.51 على مجموعة التطوير.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف مهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور: البيانات، إرشادات التوضيحية، إعداد التقييم، النتائج، والأنظمة المشاركة.المهمة التي تركز على الميمات وكانت ثلاث مجموعات فرعية: (1) اكتشاف التقنيات في النص، (2) اكتشاف تمديد النص ح يث يتم استخدام التقنيات، و (3) كشف التقنيات في جميع أنحاء، أي كلاهما في النصوفي الصورة.كانت مهمة شائعة، وجذب 71 تسجيل، و 22 فريقا قدمت في نهاية المطاف تقديم رسمي في مجموعة الاختبار.أكدت نتائج التقييم للمراكب الفرعي الثالث أهمية كل من الطرائق والنص والصورة.علاوة على ذلك، ذكرت بعض الفرق المزايا عند عدم الجمع بين الطرطرين، على سبيل المثال، باستخدام الانصهار المبكر أو المتأخر، بل ينطلق على التفاعل بينهما في نموذج مشترك.
يقدم وصف النظام التالي نهجنا في اكتشاف تقنيات الإقناع في النصوص والصور.تم تأطير المهمة المعينة بمثابة مشكلة تصنيف متعدد العلامات مع التقنيات المختلفة التي تخدم باسم ملصقات فئة.تعد مشكلة تصنيف العلامات المتعددة واحدة واحدة فيها قائمة من المتغيرات المس تهدفة مثل ملصقاتنا الفئة مرتبطة بكل قطعة إدخال ويفترض أن المستند يمكن أن يتم تعيينه في وقت واحد ويتم تعيينه بشكل مستقل إلى ملصقات أو فئات متعددة.من أجل تخصيص ملصقات فئة للميمات المعينة، اخترنا روبرتا (نهج برت محمول بقوة) كفنذة شبكة عصبية لتصنيف الرمز المميز والتسلسل.بدء التشغيل باستخدام نموذج مدرب مسبقا لتمثيل اللغة، نضربنا هذا النموذج على مهمة التصنيف المعطاة مع البيانات المشروحة المقدمة في خطوات التدريب الخاضعة للإشراف.لدمج ميزات الصور في الإعداد المتعدد الوسائط، نعتمد على بنية VGGG-16 المدربة مسبقا مسبقا.
الهدف من SEMEVAL-2021 المهمة 6 هو تحديد التقنيات المستخدمة مع فترة (ق) من النص المشمول من كل تقنية.تصف هذه الورقة النظام والنموذج الذي طورنا لهذه المهمة.نقترح أولا نظام خط أنابيب لتحديد المواقف، ثم صنف هذه التقنية في تسلسل الإدخال.لكنه يعاني بشدة من التعامل مع المتداخلة في فترة متداخلة.ثم نقترح صياغة المهمة كمسألة مسألة الإجابة على مهمة MRC التي تحقق نتيجة أفضل مقارنة بطريقة خط الأنابيب.علاوة على ذلك، يتم استكشاف تقنيات تكبير البيانات وتصميم الخسائر أيضا لتخفيف مشكلة متفرج البيانات والخلل.أخيرا، نحن نحصل على المركز الثالث في مرحلة التقييم النهائي.
قمنا بتطوير نظام للمهمة 6 المهمة الفرعية 1 للكشف عن الدعاية في الميمات. تم استخدام مجموعة بيانات خارجية ومجموعة بيانات تكبير لتمديد مجموعة بيانات المنافسة الرسمية. تم تطبيق تقنيات تكبير البيانات على مجموعة البيانات الخارجية ومجموعة بيانات المنافسة لل توصل إلى مجموعة البيانات المعززة. تدربنا 5 محولات (Deberta و 4 روبرتا) وفرعهم لجعل التنبؤ. قمنا بتدريب نموذج 1 روبرتا في البداية على مجموعة البيانات المعززة لعدد قليل من العصر، ثم ضبطها على مجموعة بيانات المنافسة التي تحسن من النتائج F1 الصغرى حتى 0.1 درجات 0.1. بعد ذلك، تم تدريب نموذج روبرتا أولي آخر على مجموعة البيانات الخارجية، حيث تم دمجها مع مجموعة البيانات المعززة لعدد قليل من الحدوث والضبط بشكل جيد على مجموعة بيانات المنافسة. علاوة على ذلك، كنعت النماذج الأولية مع النماذج بعد ضبط الرصيد. بالنسبة للنموذج الأخير في الفرقة، قامنا بتدريب نموذج Deberta على مجموعة البيانات المعززة دون ضبطه على مجموعة بيانات المنافسة. أخيرا، بلغنا استرجاع إخراج كل نموذج في الفرقة لجعل التنبؤ.
وصف نهجنا لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في محتوى متعدد الوسائط (الميمات).يجمع نظامنا بين النماذج المتعددة مسبقا (مقطع) والصفوف المصنفة.أيضا، نقترح إثراء البيانات من خلال تقنية تكبير البيانات.يحقق التقديم لدينا رتبة 8/16 من حيث F1-Micro و 9/16 مع F1-Macro في مجموعة الاختبار.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا