ترغب بنشر مسار تعليمي؟ اضغط هنا

الميمات في البرية: تقييم تعميم بيانات تحدي الميمات البغيضة

Memes in the Wild: Assessing the Generalizability of the Hateful Memes Challenge Dataset

549   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تشكل الميمات البغيضة تحديا فريدا لأنظمة تعلم الآلات الحالية لأن رسالتهم مشتقة من كل من الطرائق النصية والمرئية.لهذا الغرض، أصدر Facebook تحدي الميمات البغيض، مجموعة بيانات من الميمات ذات التسميات التوضيحية النصية المستخلصة مسبقا، لكن من غير الواضح ما إذا كانت هذه الأمثلة الاصطناعية تعزز إلى الميمات في البرية ".في هذه الورقة، نقوم بجمع الميمات البغيضة وغير البغيضة من Pinterest لتقييم الأداء الخارجي على النماذج المدربة مسبقا على مجموعة بيانات Facebook.نجد أن الميمات في البرية "تختلف في جوانبين رئيسيين: 1) يجب استخراج التسميات التوضيحية عبر OCR، ضجيج حقن وتقليل الأداء من النماذج متعددة الوسائط، و 2) الميمات أكثر تنوعا من الميمات التقليدية، بما في ذلك لقطات من المحادثات أو النصفي خلفية عادية.هذه الورقة هكذا بمثابة التحقق من الواقع للمعيار الحالي للكشف عن الكراهية ومستقليها على الكشف عن الكراهية في العالم الحقيقي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم النتائج والنتائج الرئيسية للمهمة المشتركة في WOAH 5 على الكشف عن الميمات البغيضة.تتضمن المهمة ملاحقتين فرعيين يتعلق بالتحديات المتميزة في الكشف الدقيق للميمات البغيضة: (1) الفئة المحمية تعرضت لها MEME و (2) نوع الهجوم.3 فرق قدم وصف نظام وصف النظ ام.تعتمد هذه المهمة المشتركة على مهمة الكشف عن الأيمن التي تم إنشاؤها بواسطة بحث Facebook AI في عام 2020.
المهمة المشتركة بشأن الميمات البغيضة هي تحدي يهدف إلى اكتشاف المحتوى البغيض في الميمات من خلال دعوة تنفيذ النظم التي تفهم الميمات، يحتمل أن تجمع بين الصورة والمعلومات النصية.يتكون التحدي من ثلاثة مهام اكتشاف: الكراهية، الفئة المحمية ونوع الهجوم.الأول هو مهمة تصنيف ثنائية، في حين أن الاثنين الآخران مهام التصنيف متعدد العلامات.تضمنت مشاركتنا خط الأساس بيرت القائم على النص (TXTBERT)، وهو نفسه ولكن إضافة معلومات من الصورة (IMGBERT)، ونهج الاسترجاع العصبي.لقد جربنا أيضا نماذج التصنيف المعزز للاسترجاع.وجدنا أن مجموعة Txtbert و Imgbert تحقق أفضل أداء من حيث النتيجة AUC ROC في قسمين من المهام الثلاث في مجموعة التطوير الخاصة بنا.
الميمات هي مجموعات من النص والصور التي غالبا ما تكون روح الدعابة في الطبيعة.ولكن، قد لا يكون هذا هو الحال دائما، وقد تصور مجموعات معينة من النصوص والصور الكراهية، يشار إليها باسم الميمات البغيضة.يقدم هذا العمل خط أنابيب متعدد الوسائط يأخذ كل من الميز ات المرئية والنصية من الميمات إلى (1) تحديد الفئة المحمية (على سبيل المثال، الجنس، الجنس وما إلى ذلك) التي هاجمت؛و (2) اكتشاف نوع الهجوم (E.G. ازدراء، Slurs وما إلى ذلك).يستخدم خط أنابيبنا تمثيلا مرئيا ومرئيا تدريبا مسبقا مسبقا، متبوعا بتصنيف الانحدار اللوجستي البسيط.نحن نوظف خط أنابيبنا على مجموعة بيانات تحدي الميمات البغيضة مع ملصقات إضافية تم إنشاؤها حديثا عن الفئة المحمية ونوع الهجوم.يحقق أفضل نموذج لدينا AUROC من 0.96 لتحديد الفئة المحمية، و 0.97 للكشف عن نوع الهجوم.نطلق سرد علاماتنا في https://github.com/harisbinzia/hatefulmemes
تصف هذه الورقة التقديم الخاص بنا (حظنا الفائز للمهمة A) إلى المهمة المشتركة بشأن الكشف البغيض على WOAH 2021. نحن نبني نظامنا على رأس نظام أحدث لتصنيف ميمي بصرية ثنائي يستخدم علامات الصورة بالفعلمثل العرق والجنس وكيانات الويب.نضيف بيانات تعريف أخرى مث ل العواطف والتجربة مع تقنيات تكبير البيانات، حيث يتم تمييز المثيلات البغيضة في مجموعة البيانات.
أصبحت ميمات الإنترنت وسيلة قوية لنقل الأفكار السياسية والنفسية والاجتماعية الثقافية. على الرغم من أن الميمات هي روح الدعابة عادة، فقد شهدت الأيام الأخيرة تصعيدا من الأيمن الضارة المستخدمة في التصيد والتبريد الإلكتروني وسوء المعاملة. يكتشف مثل هذه الم يمات صعبة لأنها يمكن أن تكون مشفرة للغاية ومخفية. علاوة على ذلك، في حين أن العمل السابق قد ركز على جوانب محددة من الميمات مثل خطاب الكراهية والدعاية، إلا أنه كان هناك القليل من العمل على الضرر بشكل عام. هنا، نحن نهدف إلى سد هذه الفجوة. على وجه الخصوص، نركز على مهمتين: (ط) اكتشاف الميمات الضارة، و (2) تحديد الكيانات الاجتماعية التي يستهدفونها. لقد تمديد مجموعة بيانات الضرر التي تم إصدارها مؤخرا، والتي غطت covid-19، مع ميمات إضافية وموضوع جديد: السياسة الأمريكية. لحل هذه المهام، نقترح الزخم (إطار متعدد الوسائط للكشف عن الميمات الضارة وأهدافها) شبكة عميقة عميقة متعددة الوسائط تستخدم وجهات نظر عالمية ومحلية للكشف عن الميمات الضارة. تحلل الزخم بشكل منهجي المنظور المحلي والعالمي لمنظمة الإدخال (في كلا الطرائق) ويربطها في سياق الخلفية. الزخم هو تفسير ومتعمول، وإظهار تجاربنا أنه يتفوق على العديد من نهج التنافس القوية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا