ترغب بنشر مسار تعليمي؟ اضغط هنا

multimodal أو النص؟استرجاع أو بيرت؟معيار الطبقات للمهمة المشتركة على الميمات البغيضة

Multimodal or Text? Retrieval or BERT? Benchmarking Classifiers for the Shared Task on Hateful Memes

261   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المهمة المشتركة بشأن الميمات البغيضة هي تحدي يهدف إلى اكتشاف المحتوى البغيض في الميمات من خلال دعوة تنفيذ النظم التي تفهم الميمات، يحتمل أن تجمع بين الصورة والمعلومات النصية.يتكون التحدي من ثلاثة مهام اكتشاف: الكراهية، الفئة المحمية ونوع الهجوم.الأول هو مهمة تصنيف ثنائية، في حين أن الاثنين الآخران مهام التصنيف متعدد العلامات.تضمنت مشاركتنا خط الأساس بيرت القائم على النص (TXTBERT)، وهو نفسه ولكن إضافة معلومات من الصورة (IMGBERT)، ونهج الاسترجاع العصبي.لقد جربنا أيضا نماذج التصنيف المعزز للاسترجاع.وجدنا أن مجموعة Txtbert و Imgbert تحقق أفضل أداء من حيث النتيجة AUC ROC في قسمين من المهام الثلاث في مجموعة التطوير الخاصة بنا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الميمات هي مجموعات من النص والصور التي غالبا ما تكون روح الدعابة في الطبيعة.ولكن، قد لا يكون هذا هو الحال دائما، وقد تصور مجموعات معينة من النصوص والصور الكراهية، يشار إليها باسم الميمات البغيضة.يقدم هذا العمل خط أنابيب متعدد الوسائط يأخذ كل من الميز ات المرئية والنصية من الميمات إلى (1) تحديد الفئة المحمية (على سبيل المثال، الجنس، الجنس وما إلى ذلك) التي هاجمت؛و (2) اكتشاف نوع الهجوم (E.G. ازدراء، Slurs وما إلى ذلك).يستخدم خط أنابيبنا تمثيلا مرئيا ومرئيا تدريبا مسبقا مسبقا، متبوعا بتصنيف الانحدار اللوجستي البسيط.نحن نوظف خط أنابيبنا على مجموعة بيانات تحدي الميمات البغيضة مع ملصقات إضافية تم إنشاؤها حديثا عن الفئة المحمية ونوع الهجوم.يحقق أفضل نموذج لدينا AUROC من 0.96 لتحديد الفئة المحمية، و 0.97 للكشف عن نوع الهجوم.نطلق سرد علاماتنا في https://github.com/harisbinzia/hatefulmemes
نقدم النتائج والنتائج الرئيسية للمهمة المشتركة في WOAH 5 على الكشف عن الميمات البغيضة.تتضمن المهمة ملاحقتين فرعيين يتعلق بالتحديات المتميزة في الكشف الدقيق للميمات البغيضة: (1) الفئة المحمية تعرضت لها MEME و (2) نوع الهجوم.3 فرق قدم وصف نظام وصف النظ ام.تعتمد هذه المهمة المشتركة على مهمة الكشف عن الأيمن التي تم إنشاؤها بواسطة بحث Facebook AI في عام 2020.
تشكل الميمات البغيضة تحديا فريدا لأنظمة تعلم الآلات الحالية لأن رسالتهم مشتقة من كل من الطرائق النصية والمرئية.لهذا الغرض، أصدر Facebook تحدي الميمات البغيض، مجموعة بيانات من الميمات ذات التسميات التوضيحية النصية المستخلصة مسبقا، لكن من غير الواضح ما إذا كانت هذه الأمثلة الاصطناعية تعزز إلى الميمات في البرية ".في هذه الورقة، نقوم بجمع الميمات البغيضة وغير البغيضة من Pinterest لتقييم الأداء الخارجي على النماذج المدربة مسبقا على مجموعة بيانات Facebook.نجد أن الميمات في البرية "تختلف في جوانبين رئيسيين: 1) يجب استخراج التسميات التوضيحية عبر OCR، ضجيج حقن وتقليل الأداء من النماذج متعددة الوسائط، و 2) الميمات أكثر تنوعا من الميمات التقليدية، بما في ذلك لقطات من المحادثات أو النصفي خلفية عادية.هذه الورقة هكذا بمثابة التحقق من الواقع للمعيار الحالي للكشف عن الكراهية ومستقليها على الكشف عن الكراهية في العالم الحقيقي.
تصف هذه الورقة التقديم الخاص بنا (حظنا الفائز للمهمة A) إلى المهمة المشتركة بشأن الكشف البغيض على WOAH 2021. نحن نبني نظامنا على رأس نظام أحدث لتصنيف ميمي بصرية ثنائي يستخدم علامات الصورة بالفعلمثل العرق والجنس وكيانات الويب.نضيف بيانات تعريف أخرى مث ل العواطف والتجربة مع تقنيات تكبير البيانات، حيث يتم تمييز المثيلات البغيضة في مجموعة البيانات.
دفع نجاح ترميزات ثنائية الاتجاه باستخدام نماذج لغة ملثم، مثل بيرت، في العديد من مهام معالجة اللغة الطبيعية، بباحثي المحاولة لإدماج هذه النماذج المدربة مسبقا في أنظمة الترجمة الآلية العصبية (NMT). ومع ذلك، فإن الأساليب المقترحة لإدماج النماذج المدربة مسبقا هي غير تافهة وتركز بشكل أساسي على بيرتف، والتي تفتقر إلى مقارنة التأثير الذي قد يكون له النماذج الأخرى المدربة مسبقا على أداء الترجمة. في هذه الورقة، نوضح ببساطة باستخدام الناتج (Attentralized Advedings) من طراز لغة تدرب مسبقا مخصص ومناسب (Bibert) مناسبة (Bibert) حيث أن إدخال ترميز NMT يحقق أداء ترجمة حديثة من بين الفن. علاوة على ذلك، نقترح أيضا نهج اختيار طبقة مؤشر استوكاستك ومفهوم نموذج الترجمة المزدوج الاتجاه لضمان الاستخدام الكافي للمشروعات السياقية. في حالة عدم استخدام الترجمة الخلفية، تحقق أفضل النماذج لدينا درجات بلو من 30.45 ل ill → DE و 38.61 ل De → EN على DataSet IWSLT'14، و 31.26 ل EN → DE و 34.94 ل De → EN على WMT 14 DataSet، مما يتجاوز جميع الأرقام المنشورة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا