ترغب بنشر مسار تعليمي؟ اضغط هنا

التعلم مدى الحياة لتصنيف الكلام الكراهية على وسائل التواصل الاجتماعي

Lifelong Learning of Hate Speech Classification on Social Media

394   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يفترض العمل الحالي على تصنيف نطق الكراهية الآلي أن DataSet ثابتة ويتم تعريف الفصول الدراسية مسبقا.ومع ذلك، فإن مقدار البيانات في وسائل التواصل الاجتماعي يزيد كل يوم، وتتغير الموضوعات الساخنة بسرعة، مما يتطلب من المصنفين أن تكون قادرة على التكيف باستمرار مع البيانات الجديدة دون أن ننسى المعرفة المستفادة مسبقا.هذه القدرة، المشار إليها باسم التعلم مدى الحياة، أمر حاسم لتطبيق الكلمة الحقيقية من مصنف الكلاب الكراهية في وسائل التواصل الاجتماعي.في هذا العمل، نقترح التعلم مدى الحياة لتصنيف الكلام الكراهية على وسائل التواصل الاجتماعي.لتخفيف النسيان الكارثي، نقترح استخدام تعليم التمثيل التغيرات (VRL) جنبا إلى جنب مع وحدة الذاكرة المستندة إلى LB-Soinn (توازن الحركة النمو الذاتي التزايدي التزايدي).تجريبيا، نظهر أن الجمع بين التعلم التمثيل التغيرات ووحدة الذاكرة LB-Soinn يحقق أداء أفضل من تقنيات التعلم مدى الحياة المستخدمة بشكل شائع.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

ركزت الأبحاث السائدة على خطاب الكراهية في الغالب في الوقت الحالي في مهمة تصنيف وظائف وسائل التواصل الاجتماعي بشكل رئيسي فيما يتعلق بطبقات نطاقات الكراهية المحددة مسبقا إلى حد ما.قد يكون هذا كافيا إذا كان الهدف هو اكتشاف وحذف الوظائف اللغوية المسيئة.و مع ذلك، لا يمكن إزالة الإزالة دائما بسبب تشريع بلد ما.أيضا، هناك أدلة على أن خطاب الكراهية لا يمكن مكافحته بنجاح بمجرد إزالة مشاركات الكلام الكراهية؛يجب أن تواجهها التعليم والعديد من الروايات.لهذا الغرض، نحتاج إلى تحديد (I) من هو الهدف في وظيفة خطاب كراهية معينة، و (2) ما هي الجوانب (أو الخصائص) التي تعزى الهدف إلى الهدف في المنصب.كأول تقريب، نقترح تكييف نموذج استخراج مفهوم حقيقي للأحدث إلى مجال خطاب الكراهية.نتيجة التجارب واعدة ويمكن أن تكون مصدر إلهام لمزيد من العمل في المهمة
نحن نتطلع إلى مهمة اكتشاف الكلام الكراهية التلقائي لغات الموارد المنخفضة.بدلا من جمع وإشراف بيانات خطاب الكراهية الجديدة، نوضح كيفية استخدام التعلم عبر التحويلات عبر اللغات للاستفادة من البيانات الموجودة بالفعل من لغات الموارد العالية.باستخدام مصنفات مقرها Word من Word، نحقق الأداء الجيد على اللغة المستهدفة من خلال التدريب فقط على مجموعة بيانات المصدر.باستخدام نظامنا المنقول، نحن Bootstrap على بيانات اللغة المستهدفة غير المستهدفة، وتحسين أداء نهج النقل المتبادل القياسي.نحن نستخدم اللغة الإنجليزية كلغة موارد عالية والألمانية مثل اللغة المستهدفة التي تتوفر فقط كمية صغيرة من كورسا المشروح.تشير نتائجنا إلى أن التعلم عبر التحويلات الشاملة للتعلم مع نهجنا للاستفادة من البيانات الإضافية غير المسبقة هي وسيلة فعالة لتحقيق الأداء الجيد على لغات مستهدفة منخفضة الموارد دون الحاجة إلى أي شروح لغة الهدف.
يمكن للكشف عن الموقف على وسائل التواصل الاجتماعي المساعدة في تحديد وفهم الأخبار أو التعليق المائل في الحياة اليومية.في هذا العمل، نقترح نموذجا جديدا للكشف عن موقف صفرية على Twitter يستخدم التعلم الخصم للتعميم عبر الموضوعات.ينص نموذجنا على الأداء الحد يث في عدد من موضوعات الاختبار غير المرئية بأقل تكلفة حسابية.بالإضافة إلى ذلك، فإننا نقوم بإعادة اكتشاف موقف الرصاص في الصفر إلى المواضيع التي لم تعتبر سابقا، وتسليط الضوء على الاتجاهات المستقبلية للتحويل الصفر بالرصاص.
تعاني الكشف عن الكلام والكشف عن الألفاظ النبأ من البيانات الخاصة بالبيانات، وخاصة لغات أخرى غير الإنجليزية، بسبب الطبيعة الذاتية للمهام وتوافق التعليق التوضيحي الناتج عن الشركة الحالية.في هذه الدراسة، نقوم بتحديد الفئات الفرعية الملتزمة في وظائف Word وتمثيلات الجملة واستكشاف قدرة تعميمها على مجموعة متنوعة من المهام المستهدفة المماثلة والبعيدة في إعداد صفرية.تم إجراء هذا أحادي (ألماني) ويعرضا على المهام (الإنجليزية) ذات الصلة (باللغة الإنجليزية) عن كثب (باللغة الفرنسية) وغير ذات الصلة (العربية).نلاحظ أنه، في كل من المهام المستهدفة المماثلة والبعيدة وعلى جميع اللغات، فإن التمثيلات الفرعية القائمة على الفضاء الفرعي نقل أكثر فعالية من تمثيلات بيرت القياسية في إعداد الطلقة الصفرية، مع تحسينات بين F1 +10.9 و F1 +42.9 على خطوط الأساس عبر الكلاختبرت السيناريوهات أحادية الألوان واللغة اللغوية.
بالنظر إلى لوائح التناقض الاجتماعي الحالية في جميع أنحاء العالم، أصبحت وسائل التواصل الاجتماعي الوضع الأساسي للتواصل لمعظم الناس. وقد عزل هذا الملايين الذين يعانون من الأمراض العقلية الذين لا يستطيعون الحصول على المساعدة شخصيا. لقد تحولوا بشكل متزايد إلى المنصات عبر الإنترنت للتعبير عن أنفسهم والبحث عن إرشادات في التعامل مع أمراضهم. مع مراعاة ذلك، نقترح حلا لتصنيف وظائف المرض العقلي على وسائل التواصل الاجتماعي مما يتيح للمستخدمين طلب المساعدة المناسبة. في هذا العمل، صنف خمسة أنواع بارزة من الأمراض العقلية - الاكتئاب والقلق والاضطراب الثنائي القطبية و ADHD و PTSD عن طريق تحليل بيانات المستخدم غير منظم على Reddit. بالإضافة إلى ذلك، نشارك بيانات DataSet1 جديدة عالية الجودة لدفع البحث في هذا الموضوع. تتكون DataSet من عنوان ونصوص نشرها من 17159 وظيفة و 13 Subreddits كل واحد مرتبط بأحد الأمراض العقلية الخمس المذكورة أعلاه أو بدون فئة تشير إلى عدم وجود أي مرض عقلي. يتم تدريب النموذج الخاص بنا على بيانات Reddit ولكنه قابل للتوسيع بسهولة لمنصات وسائل التواصل الاجتماعي الأخرى وكذلك أظهرت في نتائجنا. نعتقد أن عملنا هو أول نموذج متعدد الطبقات يستخدم بنية تحويل محولات مثل روبرتا لتحليل عواطف الناس و علم النفس. نحن نوضح أيضا كيف نشدد اختبار نموذجنا باستخدام الاختبار السلوكي. تتوفر DataSet علنا ​​علنا ​​ونشجع الباحثين على الاستفادة من ذلك لتحقيق البحث في هذه الساحة. نأمل أن يساهم هذا العمل في نظام الصحة العامة بأتمتة بعض عمليات الكشف وتنبيه السلطات المختصة عن المستخدمين الذين يحتاجون إلى مساعدة فورية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا