ترغب بنشر مسار تعليمي؟ اضغط هنا

Lecun في Semeval-2021 Task 6: اكتشاف تقنيات الإقناع في نص باستخدام محولات محولات مسبقا حظرها وتعزيز البيانات

LeCun at SemEval-2021 Task 6: Detecting Persuasion Techniques in Text Using Ensembled Pretrained Transformers and Data Augmentation

365   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

قمنا بتطوير نظام للمهمة 6 المهمة الفرعية 1 للكشف عن الدعاية في الميمات. تم استخدام مجموعة بيانات خارجية ومجموعة بيانات تكبير لتمديد مجموعة بيانات المنافسة الرسمية. تم تطبيق تقنيات تكبير البيانات على مجموعة البيانات الخارجية ومجموعة بيانات المنافسة للتوصل إلى مجموعة البيانات المعززة. تدربنا 5 محولات (Deberta و 4 روبرتا) وفرعهم لجعل التنبؤ. قمنا بتدريب نموذج 1 روبرتا في البداية على مجموعة البيانات المعززة لعدد قليل من العصر، ثم ضبطها على مجموعة بيانات المنافسة التي تحسن من النتائج F1 الصغرى حتى 0.1 درجات 0.1. بعد ذلك، تم تدريب نموذج روبرتا أولي آخر على مجموعة البيانات الخارجية، حيث تم دمجها مع مجموعة البيانات المعززة لعدد قليل من الحدوث والضبط بشكل جيد على مجموعة بيانات المنافسة. علاوة على ذلك، كنعت النماذج الأولية مع النماذج بعد ضبط الرصيد. بالنسبة للنموذج الأخير في الفرقة، قامنا بتدريب نموذج Deberta على مجموعة البيانات المعززة دون ضبطه على مجموعة بيانات المنافسة. أخيرا، بلغنا استرجاع إخراج كل نموذج في الفرقة لجعل التنبؤ.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من ميمي يستخدم غالبا في حملة تضليل للتأثير على المستخدمين.توفر الورقة مقارنة واسعة النطاق بين مختلف أنظمة تعليم الآلات كحل للمهمة.نقوم بتوصيل المعالجة المسبقة للبيانات النصية لصالح المهمة وعدة طرق للتغلب على خلل الفصل.تظهر النتائج أن ضبط نموذج روبرتا يعطى أفضل النتائج مع نقاط F1-Micro من 0.51 على مجموعة التطوير.
وصف نهجنا لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في محتوى متعدد الوسائط (الميمات).يجمع نظامنا بين النماذج المتعددة مسبقا (مقطع) والصفوف المصنفة.أيضا، نقترح إثراء البيانات من خلال تقنية تكبير البيانات.يحقق التقديم لدينا رتبة 8/16 من حيث F1-Micro و 9/16 مع F1-Macro في مجموعة الاختبار.
نحن تصف مهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور: البيانات، إرشادات التوضيحية، إعداد التقييم، النتائج، والأنظمة المشاركة.المهمة التي تركز على الميمات وكانت ثلاث مجموعات فرعية: (1) اكتشاف التقنيات في النص، (2) اكتشاف تمديد النص ح يث يتم استخدام التقنيات، و (3) كشف التقنيات في جميع أنحاء، أي كلاهما في النصوفي الصورة.كانت مهمة شائعة، وجذب 71 تسجيل، و 22 فريقا قدمت في نهاية المطاف تقديم رسمي في مجموعة الاختبار.أكدت نتائج التقييم للمراكب الفرعي الثالث أهمية كل من الطرائق والنص والصورة.علاوة على ذلك، ذكرت بعض الفرق المزايا عند عدم الجمع بين الطرطرين، على سبيل المثال، باستخدام الانصهار المبكر أو المتأخر، بل ينطلق على التفاعل بينهما في نموذج مشترك.
يقدم وصف النظام التالي نهجنا في اكتشاف تقنيات الإقناع في النصوص والصور.تم تأطير المهمة المعينة بمثابة مشكلة تصنيف متعدد العلامات مع التقنيات المختلفة التي تخدم باسم ملصقات فئة.تعد مشكلة تصنيف العلامات المتعددة واحدة واحدة فيها قائمة من المتغيرات المس تهدفة مثل ملصقاتنا الفئة مرتبطة بكل قطعة إدخال ويفترض أن المستند يمكن أن يتم تعيينه في وقت واحد ويتم تعيينه بشكل مستقل إلى ملصقات أو فئات متعددة.من أجل تخصيص ملصقات فئة للميمات المعينة، اخترنا روبرتا (نهج برت محمول بقوة) كفنذة شبكة عصبية لتصنيف الرمز المميز والتسلسل.بدء التشغيل باستخدام نموذج مدرب مسبقا لتمثيل اللغة، نضربنا هذا النموذج على مهمة التصنيف المعطاة مع البيانات المشروحة المقدمة في خطوات التدريب الخاضعة للإشراف.لدمج ميزات الصور في الإعداد المتعدد الوسائط، نعتمد على بنية VGGG-16 المدربة مسبقا مسبقا.
في السنوات الأخيرة، تم استخدام ميم يجمع بين الصورة والنص على نطاق واسع في وسائل التواصل الاجتماعي، والميمات هي واحدة من أكثر أنواع المحتوى شعبية المستخدمة في حملات التضاعف عبر الإنترنت.في هذه الورقة، يتم تلخيص دراستنا حول اكتشاف تقنيات الإقناع في الن صوص والصور في مهمة Semeval-2021.بالنسبة للكشف عن تكنولوجيا الدعاية في النص، نقترح نموذج مزيج من كل من ألبرت ونص سي إن إن تصنيف النص، بالإضافة إلى نموذج وضع تسلسل متعدد المهام متعدد المهام لاستغلال التغطية التكنولوجية للدعاية.بالنسبة لمهمة تصنيف Meme المشاركة في فهم النص واستخراج الميزة البصرية، قمنا بتصميم نموذج قناة متوازية مقسمة إلى قنوات نصية وصورة.حققت طريقتنا أداء جيدا بشأن المجموع الفرعي 1 و 3. درجات مايكرو F1 من 0.492، 0.091، و 0.446 التي تحققت في مجموعات الاختبار من المهارات الفرعية الثلاثة المرتبة الثانية عشرة، 7، وحتى 11، على التوالي، وكلها أعلى من الأساسنموذج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا