تصف هذه الورقة تطوير مورد معجمي عبر الإنترنت للمساعدة في تنظيم أنظمة الكشف وكبح استخدام الكلمات الهجومية عبر الإنترنت.مع انتشار نمو منصات وسائل التواصل الاجتماعي، يتم الآن إجراء العديد من المحادثات عند الخط.أدت زيادة المحادثات عبر الإنترنت للترفيه والعمل والتواصل الاجتماعي إلى زيادة المضايقة.على وجه الخصوص، نقوم بإنشاء مفردات متخصصة في الإحساس بالكلمات الهجومية اليابانية للكلمات المفتوحة متعددة اللغات.يتوسع هذا المفردات على قائمة موجودة من الكلمات اليابانية الناتجة وتوفر التصنيف والربط السليم بالاتصالات داخل Wordnet متعددة اللغات.ثم تناقش هذه الورقة تقييم المفردات كمورد لتمثيل التصنيف والكلمات الهجومية وكخلاصا محتملا لاستخدام الكلمة الهجومية في وسائل التواصل الاجتماعي.
This paper describes the development of an online lexical resource to help detection systems regulate and curb the use of offensive words online. With the growing prevalence of social media platforms, many conversations are now conducted on- line. The increase of online conversations for leisure, work and socializing has led to an increase in harassment. In particular, we create a specialized sense-based vocabulary of Japanese offensive words for the Open Multilingual Wordnet. This vocabulary expands on an existing list of Japanese offen- sive words and provides categorization and proper linking to synsets within the multilingual wordnet. This paper then discusses the evaluation of the vocabulary as a resource for representing and classifying offensive words and as a possible resource for offensive word use detection in social media.
المراجع المستخدمة
https://aclanthology.org/
حاليا، هناك نوعان من الوصمات المتاحة للتركية: TR-Wordnet of Balkanet و Kenet.كما يتضمن Wordnet الأكثر شمولية للتركية، تشمل Kenet 76،757 عملية عملية.لدى Kenet العلاقات الدلالية المعدلة وترتبط ب Pwn من خلال العلاقات المتداخلة.في هذه الورقة، نقدم الإجرا
تقدم الورقة شبكة الدلالية المشروع مع مجموعة واسعة من العلاقات الدلالية وإنجازاتها الرئيسية.الهدف النهائي للمشروع هو توسيع Princeton Wordnet مع الإطارات المفاهيمية التي تحدد العلاقات الجزيئية من عمليات التملائم الفعل والفئات الدلالية من الأسماء المرسل
WordNet هو الموارد المعجمية الأكثر استخداما على نطاق واسع للغة الإنجليزية، في حين أن ويكيداتا هي واحدة من أكبر الرسوم البيانية للمعرفة للمفاهيم والمفاهيم المتاحة.في حين أن هناك اختلاف واضح في تركيز هذين الموارد، فهناك أيضا تداخل كبير وعلى هذا النحو ا
تطبق الغالبية العظمى من الأساليب الحالية لتخصيص التصنيفات في تطبق Adgeddings Word لأنها أثبتت تجميع السياقات (بمعنى واسع) المستخرجة من النصوص التي تكفي إرفاق الكلمات الأيتام بالتصنيف.من ناحية أخرى، وبصرف النظر عن كونها الموارد الكبيرة المعجمية واللال
نماذج اللغة العصبية، بما في ذلك النماذج القائمة على المحولات، والتي تدرب مسبقا على كوربورا كبيرة جدا أصبحت وسيلة شائعة لتمثيل النص في مهام مختلفة، بما في ذلك الاعتراف بالعلاقات الدلالية النصية، على سبيل المثال نظرية هيكل الوثائق عبر المستندات. عادة م