تعتبر إساءة استخدام الإنترنت مشكلة مجتمعية مهمة في عصرنا. يواجه ملايين مستخدمي الإنترنت المضايقات والعنصرية والهجمات الشخصية وأنواع أخرى من سوء المعاملة عبر مختلف المنصات. يمكن أن تكون الآثار النفسية للإيذاء على الأفراد عميقة ودائمة. وبالتالي، خلال السنوات القليلة الماضية، كان هناك جهد بحثي كبير نحو الكشف الآلي للكشف عن اللغة المسيئة في مجال NLP. في ورقة الموضع هذه، نناقش الدور الذي يلعبه نمذجة المستخدمين والمجتمعات عبر الإنترنت في اكتشاف إساءة الاستخدام. على وجه التحديد، نقوم بمراجعة وتحليل حالة الأساليب الفنية التي ترفض معلومات المستخدم أو المجتمع لتعزيز فهم اللغة والكشف عن اللغة المسيئة. ثم نستكشف التحديات الأخلاقية المتمثلة في دمج معلومات المستخدم والمجتمع، ووضع اعتبارات لتوجيه البحوث المستقبلية. أخيرا، نتعلم موضوع الشرح في الكشف عن اللغة المسيئة، واقتراح خصائص يجب أن تهدف طريقة تفسير إلى إظهارها. نحن تصف كيف يمكن للمستخدم والمعلومات المجتمعية تسهيل تحقيق هذه الخصائص ومناقشة التشغيل الفعال للتفسير في ضوء العقارات.
Abuse on the Internet is an important societal problem of our time. Millions of Internet users face harassment, racism, personal attacks, and other types of abuse across various platforms. The psychological effects of abuse on individuals can be profound and lasting. Consequently, over the past few years, there has been a substantial research effort towards automated abusive language detection in the field of NLP. In this position paper, we discuss the role that modeling of users and online communities plays in abuse detection. Specifically, we review and analyze the state of the art methods that leverage user or community information to enhance the understanding and detection of abusive language. We then explore the ethical challenges of incorporating user and community information, laying out considerations to guide future research. Finally, we address the topic of explainability in abusive language detection, proposing properties that an explainable method should aim to exhibit. We describe how user and community information can facilitate the realization of these properties and discuss the effective operationalization of explainability in view of the properties.
المراجع المستخدمة
https://aclanthology.org/
أصبحت الإيذاء عبر الإنترنت واللغة المسيئة في وسائل التواصل الاجتماعي مشاكل واسعة النطاق في العصر الرقمي اليوم.في هذه الورقة، نحن نساهم في مجموعة بيانات قائمة على إعادة استخدامها، تتكون من 68،159 إهانات و 51،102 تحية مستهدفة للأفراد بدلا من استهداف مج
في هذه الورقة، نقدم مجموعة بيانات جديدة تستند إلى Twitter للكشف عن السيبراني وإساءة استخدام عبر الإنترنت.تضم هذه البيانات التي تضم 62،587 تغريدات، تم الحصول على هذه البيانات من تويتر باستخدام شروط استعلام محددة تهدف إلى استرداد تغريدات مع احتمالات عا
يستخدم الأشخاص من المنتديات عبر الإنترنت إما أن نبحث عن معلومات أو للمساهمة به. بسبب شعبيتها المتنامية، تم إنشاء بعض المنتديات عبر الإنترنت خصيصا لتوفير الدعم والمساعدة والآراء للأشخاص الذين يعانون من مرض عقلي. الاكتئاب هو واحد من الأمراض النفسية الأ
يتم الاتفاق بشكل عام في مجتمع معالجة اللغة الطبيعية (NLP) على أنه ينبغي دمج الأخلاقيات في أي منهج.إدراك وفهم المفاهيم الأساسية ذات الصلة هو شرط أساسي فيما يتعلق بالمشاركة والمشاركة في الخطاب على NLP الأخلاقية.نقدم هنا مواد تعليمية جاهزة في شكل شرائح
نقدم أول كائن مشروح للتحليل متعدد اللغات من البنات غير العادلة المحتملة في شروط الخدمة عبر الإنترنت.تشتمل مجموعة البيانات على ما مجموعه 100 عقد، تم الحصول عليها من 25 وثيقة مشروح في أربع لغات مختلفة: الإنجليزية والألمانية والإيطالية والبولندية.لكل عق