ترغب بنشر مسار تعليمي؟ اضغط هنا

YNU-HPCC في مهمة Semeval-2021 6: الجمع بين ألبرت والنصوص CNN للكشف عن الإقناع في النصوص والصور

YNU-HPCC at SemEval-2021 Task 6: Combining ALBERT and Text-CNN for Persuasion Detection in Texts and Images

284   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في السنوات الأخيرة، تم استخدام ميم يجمع بين الصورة والنص على نطاق واسع في وسائل التواصل الاجتماعي، والميمات هي واحدة من أكثر أنواع المحتوى شعبية المستخدمة في حملات التضاعف عبر الإنترنت.في هذه الورقة، يتم تلخيص دراستنا حول اكتشاف تقنيات الإقناع في النصوص والصور في مهمة Semeval-2021.بالنسبة للكشف عن تكنولوجيا الدعاية في النص، نقترح نموذج مزيج من كل من ألبرت ونص سي إن إن تصنيف النص، بالإضافة إلى نموذج وضع تسلسل متعدد المهام متعدد المهام لاستغلال التغطية التكنولوجية للدعاية.بالنسبة لمهمة تصنيف Meme المشاركة في فهم النص واستخراج الميزة البصرية، قمنا بتصميم نموذج قناة متوازية مقسمة إلى قنوات نصية وصورة.حققت طريقتنا أداء جيدا بشأن المجموع الفرعي 1 و 3. درجات مايكرو F1 من 0.492، 0.091، و 0.446 التي تحققت في مجموعات الاختبار من المهارات الفرعية الثلاثة المرتبة الثانية عشرة، 7، وحتى 11، على التوالي، وكلها أعلى من الأساسنموذج.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف مهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور: البيانات، إرشادات التوضيحية، إعداد التقييم، النتائج، والأنظمة المشاركة.المهمة التي تركز على الميمات وكانت ثلاث مجموعات فرعية: (1) اكتشاف التقنيات في النص، (2) اكتشاف تمديد النص ح يث يتم استخدام التقنيات، و (3) كشف التقنيات في جميع أنحاء، أي كلاهما في النصوفي الصورة.كانت مهمة شائعة، وجذب 71 تسجيل، و 22 فريقا قدمت في نهاية المطاف تقديم رسمي في مجموعة الاختبار.أكدت نتائج التقييم للمراكب الفرعي الثالث أهمية كل من الطرائق والنص والصورة.علاوة على ذلك، ذكرت بعض الفرق المزايا عند عدم الجمع بين الطرطرين، على سبيل المثال، باستخدام الانصهار المبكر أو المتأخر، بل ينطلق على التفاعل بينهما في نموذج مشترك.
يقدم وصف النظام التالي نهجنا في اكتشاف تقنيات الإقناع في النصوص والصور.تم تأطير المهمة المعينة بمثابة مشكلة تصنيف متعدد العلامات مع التقنيات المختلفة التي تخدم باسم ملصقات فئة.تعد مشكلة تصنيف العلامات المتعددة واحدة واحدة فيها قائمة من المتغيرات المس تهدفة مثل ملصقاتنا الفئة مرتبطة بكل قطعة إدخال ويفترض أن المستند يمكن أن يتم تعيينه في وقت واحد ويتم تعيينه بشكل مستقل إلى ملصقات أو فئات متعددة.من أجل تخصيص ملصقات فئة للميمات المعينة، اخترنا روبرتا (نهج برت محمول بقوة) كفنذة شبكة عصبية لتصنيف الرمز المميز والتسلسل.بدء التشغيل باستخدام نموذج مدرب مسبقا لتمثيل اللغة، نضربنا هذا النموذج على مهمة التصنيف المعطاة مع البيانات المشروحة المقدمة في خطوات التدريب الخاضعة للإشراف.لدمج ميزات الصور في الإعداد المتعدد الوسائط، نعتمد على بنية VGGG-16 المدربة مسبقا مسبقا.
وصف نهجنا لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في محتوى متعدد الوسائط (الميمات).يجمع نظامنا بين النماذج المتعددة مسبقا (مقطع) والصفوف المصنفة.أيضا، نقترح إثراء البيانات من خلال تقنية تكبير البيانات.يحقق التقديم لدينا رتبة 8/16 من حيث F1-Micro و 9/16 مع F1-Macro في مجموعة الاختبار.
إن إشراق تقنيات الإقناع في الميمات هو الطريقة الأكثر تأثيرا للتأثير على عقليات الشعوب. إن الناس يميلون أكثر إلى الميمات لأنهم أكثر تحفيزا وغالبا ما يتم استغلال الأيمن وغالبا ما يتم استغلال الأيمن بسلامة الدعاية بسلامة في سياقها بقصد تحقيق جدول أعمال محدد. تصف هذه الورقة مشاركتنا في المهام الفرعية الثلاثة التي ظهرت مهمة Semeval 2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور. نستخدم الانحدار من الانحدار اللوجستي، وشجرة القرار، والتقوية التي تم ضبطها بشكل جيد لمعالجة المراكط الفرعية 1. أما بالنسبة ل SubTask 2، نقترح نظام يقوم بدمج نموذج تحديد SPE SPAN ونموذج تصنيف متعدد التسميات يعتمد على بيرتف مدرب مسبقا. نحن نتطلع إلى تصنيف متعدد العلامات متعددة الوسائط للميمات المحددة في SubTask 3 عن طريق الاستفادة من طراز الصور المستند إلى RESNENT50 ونموذج النص المستند إلى Distilbert، وهي عبارة عن بنية متعددة الوسائط بناء على طراز Multikernel CNN + LSTM و MLP. توضح النتائج الأداء التنافسي لأنظمنا.
توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من ميمي يستخدم غالبا في حملة تضليل للتأثير على المستخدمين.توفر الورقة مقارنة واسعة النطاق بين مختلف أنظمة تعليم الآلات كحل للمهمة.نقوم بتوصيل المعالجة المسبقة للبيانات النصية لصالح المهمة وعدة طرق للتغلب على خلل الفصل.تظهر النتائج أن ضبط نموذج روبرتا يعطى أفضل النتائج مع نقاط F1-Micro من 0.51 على مجموعة التطوير.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا