يفترض العمل الحالي على تصنيف نطق الكراهية الآلي أن DataSet ثابتة ويتم تعريف الفصول الدراسية مسبقا.ومع ذلك، فإن مقدار البيانات في وسائل التواصل الاجتماعي يزيد كل يوم، وتتغير الموضوعات الساخنة بسرعة، مما يتطلب من المصنفين أن تكون قادرة على التكيف باستمرار مع البيانات الجديدة دون أن ننسى المعرفة المستفادة مسبقا.هذه القدرة، المشار إليها باسم التعلم مدى الحياة، أمر حاسم لتطبيق الكلمة الحقيقية من مصنف الكلاب الكراهية في وسائل التواصل الاجتماعي.في هذا العمل، نقترح التعلم مدى الحياة لتصنيف الكلام الكراهية على وسائل التواصل الاجتماعي.لتخفيف النسيان الكارثي، نقترح استخدام تعليم التمثيل التغيرات (VRL) جنبا إلى جنب مع وحدة الذاكرة المستندة إلى LB-Soinn (توازن الحركة النمو الذاتي التزايدي التزايدي).تجريبيا، نظهر أن الجمع بين التعلم التمثيل التغيرات ووحدة الذاكرة LB-Soinn يحقق أداء أفضل من تقنيات التعلم مدى الحياة المستخدمة بشكل شائع.
Existing work on automated hate speech classification assumes that the dataset is fixed and the classes are pre-defined. However, the amount of data in social media increases every day, and the hot topics changes rapidly, requiring the classifiers to be able to continuously adapt to new data without forgetting the previously learned knowledge. This ability, referred to as lifelong learning, is crucial for the real-word application of hate speech classifiers in social media. In this work, we propose lifelong learning of hate speech classification on social media. To alleviate catastrophic forgetting, we propose to use Variational Representation Learning (VRL) along with a memory module based on LB-SOINN (Load-Balancing Self-Organizing Incremental Neural Network). Experimentally, we show that combining variational representation learning and the LB-SOINN memory module achieves better performance than the commonly-used lifelong learning techniques.
المراجع المستخدمة
https://aclanthology.org/
ركزت الأبحاث السائدة على خطاب الكراهية في الغالب في الوقت الحالي في مهمة تصنيف وظائف وسائل التواصل الاجتماعي بشكل رئيسي فيما يتعلق بطبقات نطاقات الكراهية المحددة مسبقا إلى حد ما.قد يكون هذا كافيا إذا كان الهدف هو اكتشاف وحذف الوظائف اللغوية المسيئة.و
نحن نتطلع إلى مهمة اكتشاف الكلام الكراهية التلقائي لغات الموارد المنخفضة.بدلا من جمع وإشراف بيانات خطاب الكراهية الجديدة، نوضح كيفية استخدام التعلم عبر التحويلات عبر اللغات للاستفادة من البيانات الموجودة بالفعل من لغات الموارد العالية.باستخدام مصنفات
يمكن للكشف عن الموقف على وسائل التواصل الاجتماعي المساعدة في تحديد وفهم الأخبار أو التعليق المائل في الحياة اليومية.في هذا العمل، نقترح نموذجا جديدا للكشف عن موقف صفرية على Twitter يستخدم التعلم الخصم للتعميم عبر الموضوعات.ينص نموذجنا على الأداء الحد
تعاني الكشف عن الكلام والكشف عن الألفاظ النبأ من البيانات الخاصة بالبيانات، وخاصة لغات أخرى غير الإنجليزية، بسبب الطبيعة الذاتية للمهام وتوافق التعليق التوضيحي الناتج عن الشركة الحالية.في هذه الدراسة، نقوم بتحديد الفئات الفرعية الملتزمة في وظائف Word
بالنظر إلى لوائح التناقض الاجتماعي الحالية في جميع أنحاء العالم، أصبحت وسائل التواصل الاجتماعي الوضع الأساسي للتواصل لمعظم الناس. وقد عزل هذا الملايين الذين يعانون من الأمراض العقلية الذين لا يستطيعون الحصول على المساعدة شخصيا. لقد تحولوا بشكل متزايد