هبيرت + BIASCORP - مكافحة العنصرية على شبكة الإنترنت


الملخص بالعربية

لا تزال العنصرية الدقيقة والعلانية موجودة في المجتمعات المادية والإنترنت اليوم وتأثرت في العديد من الأرواح في قطاعات مختلفة من المجتمع. في هذه القطعة القصيرة من العمل، نقدم كيف نتعامل مع هذه القضية المجتمعية مع معالجة اللغة الطبيعية. نحن نفرج BIASCORP، مجموعة بيانات تحتوي على 139،090 تعليقات وقطاع أخبار من ثلاثة مصادر محددة - Fox News، Breitbartnews و YouTube. الدفعة الأولى (45000 المشروح يدويا) جاهز للنشر. نحن حاليا في المرحلة الأخيرة من وصف مجموعة البيانات المتبقية يدويا باستخدام Amazon Mechanical Turk. تم استخدام بيرت على نطاق واسع في العديد من المهام المصب. في هذا العمل، نقدم هيرت، حيث نقوم بتعديل طبقات معينة من نموذج برت المحدد مع طبقة Hopfield الجديدة. تعميم هيرت جيدا عبر توزيعات مختلفة مع ميزة إضافية من تعقيد نموذج مخفض. نحن نطلق أيضا مكتبة JavaScript 3 وطلب امتداد Chrome، لمساعدة المطورين على الاستفادة من نموذجنا المدربين في تطبيقات الويب (يقول تطبيق الدردشة) وللمستخدمين لتحديد وتقرير محتويات منحازة عنصري على الويب على التوالي

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث