أصبحت الإيذاء عبر الإنترنت واللغة المسيئة في وسائل التواصل الاجتماعي مشاكل واسعة النطاق في العصر الرقمي اليوم.في هذه الورقة، نحن نساهم في مجموعة بيانات قائمة على إعادة استخدامها، تتكون من 68،159 إهانات و 51،102 تحية مستهدفة للأفراد بدلا من استهداف مجتمع أو سباق معين.ثانيا، نقوم بتقييم العديد من النماذج الحديثة الموجودة في كل من التصنيف ونقل النمط غير المقترح على DataSet.أخيرا، نقوم بتحليل النتائج التجريبية واستنتج أن مهمة النقل صعبة، تتطلب النماذج لفهم درجة عالية من الإبداع المعروضة في البيانات.
Online abuse and offensive language on social media have become widespread problems in today's digital age. In this paper, we contribute a Reddit-based dataset, consisting of 68,159 insults and 51,102 compliments targeted at individuals instead of targeting a particular community or race. Secondly, we benchmark multiple existing state-of-the-art models for both classification and unsupervised style transfer on the dataset. Finally, we analyse the experimental results and conclude that the transfer task is challenging, requiring the models to understand the high degree of creativity exhibited in the data.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقدم مجموعة بيانات جديدة تستند إلى Twitter للكشف عن السيبراني وإساءة استخدام عبر الإنترنت.تضم هذه البيانات التي تضم 62،587 تغريدات، تم الحصول على هذه البيانات من تويتر باستخدام شروط استعلام محددة تهدف إلى استرداد تغريدات مع احتمالات عا
تعتبر إساءة استخدام الإنترنت مشكلة مجتمعية مهمة في عصرنا. يواجه ملايين مستخدمي الإنترنت المضايقات والعنصرية والهجمات الشخصية وأنواع أخرى من سوء المعاملة عبر مختلف المنصات. يمكن أن تكون الآثار النفسية للإيذاء على الأفراد عميقة ودائمة. وبالتالي، خلال ا
يستخدم الأشخاص من المنتديات عبر الإنترنت إما أن نبحث عن معلومات أو للمساهمة به. بسبب شعبيتها المتنامية، تم إنشاء بعض المنتديات عبر الإنترنت خصيصا لتوفير الدعم والمساعدة والآراء للأشخاص الذين يعانون من مرض عقلي. الاكتئاب هو واحد من الأمراض النفسية الأ
تهدف مهمة الكشف عن الموقف إلى اكتشاف موقف سقسقة أو نص للحصول على هدف. يمكن تسمية هذه الأهداف كيانات أو جمل حرة (مطالبات). على الرغم من أن المهمة تنطوي على سبب سقسقة فيما يتعلق بهدف، إلا أننا نجد أنه من الممكن تحقيق دقة عالية على العديد من مجموعات بيا
تحليل Coreference Event Dockence (CDCR) هي مهمة تحديد الأحداث التي تشير إلى نفس الأحداث طوال مجموعة من المستندات. تعد شرح بيانات CDCR عملية شاقة ومكلفة، موضحا سبب وجود كورسا الموجودة صغيرة وتفتقر إلى تغطية المجال. للتغلب على هذه الاختناق، نستخلك تلقا