تقدم هذه الورقة الحل المقترح من قبل فريق 1213LI ل Subtask 3 في مهمة Semeval-2021: تحديد تقنيات الإقناع المتعددة المستخدمة في المحتوى متعدد الوسائط للميمي.استكشفنا مناهج مختلفة في استخراج ميزة الكشف عن ملصقات الإقناع.توظف نموذجنا النهائي النماذج المدربة مسبقا بما في ذلك روبرتا و RESNET-50 كمستخلص ميزة للنصوص والصور، على التوالي، ويعتمد طبقة تضمين الملصقات مع آلية اهتمام متعدد الوسائط لقياس تشابه الملصقات مع المعلومات متعددة الوسائطمميزات الصمامات للتوقعات التسمية.تتفوقت طريقة لدينا المقترحة على الطريقة الأساسية المقدمة وتحقق 3 من 16 مشاركا مع 0.54860 / 0.22830 لعشرات مايكرو / ماكرو F1.
This paper presents the solution proposed by the 1213Li team for subtask 3 in SemEval-2021 Task 6: identifying the multiple persuasion techniques used in the multi-modal content of the meme. We explored various approaches in feature extraction and the detection of persuasion labels. Our final model employs pre-trained models including RoBERTa and ResNet-50 as a feature extractor for texts and images, respectively, and adopts a label embedding layer with multi-modal attention mechanism to measure the similarity of labels with the multi-modal information and fuse features for label prediction. Our proposed method outperforms the provided baseline method and achieves 3rd out of 16 participants with 0.54860/0.22830 for Micro/Macro F1 scores.
المراجع المستخدمة
https://aclanthology.org/
من بين المهام التي تحفزها انتشار المعلومات الخاطئة، فإن اكتشاف الدعاية تحديا بشكل خاص بسبب عجز التعليقات التوضيحية الدقيقة الدقيقة اللازمة لتدريب نماذج التعلم الآلي.هنا نظهر كيف يمكن الاستفادة من البيانات من المهام الأخرى ذات الصلة، بما في ذلك تقييم
نحن نصف أنظمتنا من SubTask1 و SubTask3 لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور.الغرض من SubTask1 هو تحديد تقنيات الدعاية المعطاة المحتوى النصي، وهدف الفرع SubTask3 هو اكتشافها بالنظر إلى كل من المحتوى النصي والبصرية.بالنسبة إل
تصف هذه الورقة نظامنا المشارك في المهمة 6 من Semeval-2021: تركز المهمة على تصنيف تقنية الدعاية متعددة الوسائط وتهدف إلى تصنيف الصورة والنص في 22 فئة. في هذه الورقة، نقترح استخدام الهندسة المعمارية القائمة على المحولات لفوسات القرائن من كل من الصورة و
الهدف من SEMEVAL-2021 المهمة 6 هو تحديد التقنيات المستخدمة مع فترة (ق) من النص المشمول من كل تقنية.تصف هذه الورقة النظام والنموذج الذي طورنا لهذه المهمة.نقترح أولا نظام خط أنابيب لتحديد المواقف، ثم صنف هذه التقنية في تسلسل الإدخال.لكنه يعاني بشدة من
تصف هذه الورقة النظام المستخدم من قبل فريق Aimh للتعامل مع المهمة السامية 6. نقترح نهج يعتمد على بنية بناء على نموذج المحول لمعالجة المحتوى متعدد الوسائط (النص والصور) في الميمات.بنية لدينا، تسمى DVTT (محول نصي مرئي مزدوج)، تقترب من المهام الفرعية 1