في هذه الورقة نناقش العديد من التحديات المتعلقة بتطوير لعبة ثلاثية الأبعاد، تهدف هدفها إلى زيادة الوعي بالتبريد الإلكتروني أثناء جمع التوضيح اللغوي في اللغة الهجومية.من المفترض أن تستخدم اللعبة من قبل المراهقين، وبالتالي رفع عدد من القضايا التي يجب معالجتها أثناء التنمية.على سبيل المثال، يجب أن تكون جماليات اللعبة جذابة للاعبين الذين ينتمون إلى هذه الفئة العمرية، ولكن في الوقت نفسه يجب تنفيذ جميع الحلول الممكنة لتلبية متطلبات الخصوصية.أيضا، ينبغي إخفاء مهمة الشروح اللغوية مخفية، وتبني ما يسمى ميكانيكا اللعبة المتعامدة، دون التأثير على جودة البيانات التي تم جمعها.في حين أن بعض هذه التحديات يتم تناولها في تطوير اللعبة، نناقش بعض الآخرين في هذه الورقة ولكن لا يزال يفتقر إلى حل نهائي.
In this paper we discuss several challenges related to the development of a 3D game, whose goal is to raise awareness on cyberbullying while collecting linguistic annotation on offensive language. The game is meant to be used by teenagers, thus raising a number of issues that need to be tackled during development. For example, the game aesthetics should be appealing for players belonging to this age group, but at the same time all possible solutions should be implemented to meet privacy requirements. Also, the task of linguistic annotation should be possibly hidden, adopting so-called orthogonal game mechanics, without affecting the quality of collected data. While some of these challenges are being tackled in the game development, some others are discussed in this paper but still lack an ultimate solution.
المراجع المستخدمة
https://aclanthology.org/
تولد نماذج اللغة الكبيرة (LM) نص بطلاقة بشكل ملحوظ ويمكن تكييفها بكفاءة عبر مهام NLP. قياس وضمان جودة النص الذي تم إنشاؤه من حيث السلامة أمر ضروري لنشر LMS في العالم الحقيقي؛ تحقيقا لهذه الغاية، غالبا ما يعتمد العمل السابق على التقييم التلقائي لسمية
الملخص على الرغم من التقدم المحرز في السنوات الأخيرة في معالجة تحديات فهم اللغة الطبيعية (NLU)، فإن غالبية هذا التقدم لا يزال يتركز على اللغات الغنية بالموارد مثل اللغة الإنجليزية. يركز هذا العمل على اللغة الفارسية، واحدة من اللغات المنطوقة على نطاق
تقدم هذه الورقة العديد من التحديات التي تواجهها عند إشراف Treebanks التركية وفقا للمبادئ التوجيهية للتبض الشامل (UD) وتقترح الحلول لمعالجتها.معظم هذه التحديات تنبع من الافتقار إلى الدعم الكافي في إطار UD إلى بدقة تمثل مورفيمز البادئة والاشتقامات المع
نقدم HATEBERT، نموذج BERT الذي تم تدريبه على إعادة تدريب للكشف عن اللغة المسيئة باللغة الإنجليزية.تم تدريب النموذج على RAL-E، وهي مجموعة بيانات واسعة النطاق من تعليقات Reddit باللغة الإنجليزية من المجتمعات المحظورة لكونها مسيئة أو بغيضة حيث قمنا بإتا
يتناول البحث تعليم اللغةِ العربيةِ للناطقين بغيرها كلغةٍ ثانيةٍ، و يتحدث عن
طبيعةِ الدارسين و جنسياتِهم المختلفة، ما أهدافهم و أغراضهم من دراسةِ العربيةِ، لأخذها بالحسبان عند بناءِ المنهاجِ الخاصِ بهم و تصميمه الذي يتم على محورين:
لغوي و وظيفي، و ي