ترغب بنشر مسار تعليمي؟ اضغط هنا

لغة مسيئة على وسائل التواصل الاجتماعي من خلال الزجاج المظهر القانوني

Abusive Language on Social Media Through the Legal Looking Glass

668   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

اللغة المسيئة هي ظاهرة متزايدة على منصات وسائل التواصل الاجتماعي. يمكن أن تصل آثارها إلى ما بعد السياق عبر الإنترنت، والمساهمة في الضغط العقلي أو العاطفي على المستخدمين. يمكن للأدوات التلقائية للكشف عن سوء المعاملة تخفيف المشكلة. في الممارسة العملية، تعتمد تطوير طرق تلقائية للكشف عن لغة مسيئة على بيانات ذات نوعية جيدة. ومع ذلك، هناك حاليا نقص المعايير لإنشاء مجموعات البيانات في هذا المجال. وتشمل هذه المعايير تعريفات لما يعتبر لغة مسيئة وإرشادات التوضيحية والإبلاغ عن العملية. تقدم هذه الورقة إطارا شرحا مستوحى من المفاهيم القانونية لتحديد اللغة المسيئة في سياق المضايقات عبر الإنترنت. يستخدم الإطار مقياسا Likert 7 نقاط للوضع العلامات بدلا من التسميات الفئة. نحن نقود أيضا Alyt - مجموعة بيانات من لغة مسيئة على YouTube. يتضمن Alyt تعليقات YouTube باللغة الإنجليزية من مقاطع الفيديو حول موضوعات مختلفة مثيرة للجدل ومسمى طلاب القانون. تم أخذ عينات من التعليقات من البيانات التي تم جمعها فعليا، دون أساليب اصطناعية لزيادة المحتوى المسيء. تصف الورقة عملية التوضيحية بدقة، بما في ذلك جميع المبادئ التوجيهية وخطوات التدريب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة مساهمة Helsinki - Ljubljana المهمة المشتركة في عام 2021 في مجال تحديد الموقع الجغرافي للوسائط الجغرافية الاجتماعية.بعد مشاركتنا الناجحة في 32020، اقترحنا مرة أخرى أنظمة مقيدة وغير مقيدة بناء على بنية بيرت.في هذه الورقة، نقوم بالإبلاغ ع ن تجارب مع إعدادات التكوين المختلفة ونماذج مختلفة تم تدريبها مسبقا، وننظر إلى نهج الانحدار الخالي من المعلمة مع مخططات التصنيف المختلفة التي اقترحها المشاركين الآخرون في كل من التعليمات الفاردة 2020. كل من التعليمات البرمجية وأفضل أداء مسبقا مسبقايتم تقديم النماذج بحرية المتاحة.
غالبا ما تحتوي نصوص وسائل التواصل الاجتماعي مثل منشورات المدونة والتعليقات والتغريدات بلغات هجومية بما في ذلك تعليقات خطاب الكراهية العنصرية والهجمات الشخصية والتحرش الجنسي.لذلك اكتشاف الاستخدام غير المناسب للغة هو أهمية قصوى لسلامة المستخدمين وكذلك لقمع السلوك البغيض والعدوان.الأساليب الحالية لهذه المشكلة متاحة في الغالب لغات غنية بالموارد مثل الإنجليزية والألمانية.في هذه الورقة، نميز اللغة المسيئة في النيبالية، وهي لغة موارد منخفضة، تسليط الضوء على التحديات التي يجب معالجتها لمعالجة نص وسائل الإعلام الاجتماعية النيبالية.نقدم أيضا تجارب للكشف عن اللغة المسيئة باستخدام تعلم الآلات الخاضعة للإشراف.إلى جانب المساهمة في أول مناهج خط الأساس في الكشف عن اللغة الهجومية في النيبالية، نطلق أيضا على مجموعات البيانات المشروح البشرية لتشجيع البحث في المستقبل على هذا الموضوع الحاسم.
إسناد التأليف المتبادل هو المهمة الصعبة المتمثلة في تصنيف المستندات من قبل المؤلفين ثنائي اللغة حيث تتم كتابة وثائق التدريب بلغة مختلفة عن وثائق التقييم. تعتمد الحلول التقليدية على أي ترجمة لتمكين استخدام ميزات اللغة الواحدة أو طرق استخراج الميزات ال مستقلة من اللغة. في الآونة الأخيرة، يمكن أيضا تدريب نماذج اللغة القائمة على المحولات مثل Bert مسبقا على لغات متعددة، مما يجعلها مرشحا بديهيا للصفوفات المصنوعة من اللغة عبر اللغات التي لم يتم استخدامها لهذه المهمة بعد. نقوم بإجراء تجارب مكثفة لقياس أداء ثلاث نهج مختلفة لتجربة إسناد التأليف الصغير باللغة الصغيرة: (1) استخدام الميزات المستقلة للغات مع نماذج التصنيف التقليدية (2) باستخدام نماذج لغة مدربة مسبقا متعددة اللغات، و (3) استخدام الترجمة الآلية للسماح بتصنيف اللغة الفردي. بالنسبة للميزات المستقلة باللغة، فإننا نستخدم ميزات النحوية العالمية مثل علامات جزء من الكلام ورسم الرسوم البيانية التبعية، ومبرز متعدد اللغات كنموذج لغة مدرب مسبقا. نحن نستخدم تعليقات البيانات الاجتماعية الصغيرة على نطاق واسع، مما يعكس بشكل وثيق السيناريوهات العملية. نظهر أن تطبيق الترجمة الآلية يزيد بشكل كبير من أداء جميع الأساليب تقريبا، وأن الميزات الأساسية في تركيبة مع خطوة الترجمة تحقق أفضل أداء التصنيف الكلي. على وجه الخصوص، نوضح أن نماذج اللغة المدربة مسبقا متفوقة من قبل النماذج التقليدية في مشاكل إسناد التأليف الصغيرة على نطاق صغير لكل مزيج لغة تم تحليلها في هذه الورقة.
يمكن أن تؤثر تأطير القضايا السياسية على السياسة والرأي العام.على الرغم من أن الجمهور يلعب دورا رئيسيا في إنشاء وإلقاء الإطارات، إلا أن القليل يعرف عن كيفية القضايا السياسية للأشخاص العاديين في إطار وسائل الإعلام الاجتماعية.من خلال إنشاء مجموعة بيانات جديدة من تغريدات التغريدات المتعلقة بالهجرة المسمى لنصائح تأطير متعددة من نظرية الاتصال السياسية، نقوم بتطوير النماذج الخاضعة للإشراف للكشف عن الإطارات.نوضح كيف تؤثر أيديولوجية المستخدمين وتأثير اختيارات التأطير، وكيف تؤثر تأطير الرسائل على استجابات الجمهور.نجد أن إطارات العدد الأكثر شيوعا المستخدمة الإطارات الإيديولوجية والإقليمية المهمة التي يتم الكشف عنها إلا عن طريق الإطارات الخاصة بالهجرة.علاوة على ذلك، ترتبط الإطارات الموجهة نحو المصالح الإنسانية والثقافة والسياسة بمشاركة المستخدم الأعلى.هذا التحليل الواسع النطاق لظاهرة اجتماعية وملغوية معقدة يسهم في كل من البحوث المركزية والعلوم الاجتماعية.
في هذه الورقة ندرس لغة Pejorative، موضوعا غير متوقع في اللغويات الحسابية.على عكس النماذج الحالية من اللغة الهجومية وكلاب الكراهية، تظهر لغة Pejorative نفسها في المقام الأول على المستوى المعجمي، وتوضح كلمة تستخدم مع دلالة سلبية، مما يجعلها مختلفة عن ا للغة المسيئة أو الفئات الأخرى التي تمت دراستها.يعتمد Pejorativity أيضا على السياق: يمكن استخدام نفس الكلمة مع أو بدون دلالات Pejorative، وبالتالي فإن الكشف عن Pejorativity هو أساسا مشكلة مماثلة ل Disambiguation Sense Word.نستفيد بين القواميس عبر الإنترنت لبناء معجم متعدد اللغات من شروط Pejorative للغة الإنجليزية والإسبانية والإيطالية والرومانية.كلفنا تحرير مجموعة بيانات من تغريدات المشروح لاستخدام Pejorative.بناء على هذه الموارد، نقدم تحليلا لاستخدام وحدوث كلمات Pejorative في وسائل التواصل الاجتماعي، وتقديم محاولة لإفساد استخدام Pejorative تلقائيا في مجموعة بياناتنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا