تطبق الغالبية العظمى من الأساليب الحالية لتخصيص التصنيفات في تطبق Adgeddings Word لأنها أثبتت تجميع السياقات (بمعنى واسع) المستخرجة من النصوص التي تكفي إرفاق الكلمات الأيتام بالتصنيف.من ناحية أخرى، وبصرف النظر عن كونها الموارد الكبيرة المعجمية واللاللالية، فإن التصنيفات هي هياكل رسم بيانية.يمكن أن يكون الجمع بين تدمير Word مع هيكل الرسم البياني للتصنيف موضع التنبؤ بالتنبؤ بالعلاقات التصنيفية.في هذه الورقة، نقارن العديد من النهج لإرفاق كلمات جديدة بالتصنيف الموجود القائمة على تمثيلات الرسم البياني مع تلك التي تعتمد على ASTTEXT AGEDDINGS.نختبر جميع الأساليب على مجموعات البيانات الروسية والإنجليزية، ولكن يمكن تطبيقها أيضا على الكلمات واللغات الأخرى.
The vast majority of the existing approaches for taxonomy enrichment apply word embeddings as they have proven to accumulate contexts (in a broad sense) extracted from texts which are sufficient for attaching orphan words to the taxonomy. On the other hand, apart from being large lexical and semantic resources, taxonomies are graph structures. Combining word embeddings with graph structure of taxonomy could be of use for predicting taxonomic relations. In this paper we compare several approaches for attaching new words to the existing taxonomy which are based on the graph representations with the one that relies on fastText embeddings. We test all methods on Russian and English datasets, but they could be also applied to other wordnets and languages.
المراجع المستخدمة
https://aclanthology.org/
استخدام الوعود هو سائق معروف لتغيير اللغة. وقد اقترح أن تستخدم النساء النساء أكثر من الرجال. على الرغم من وجود العديد من الدراسات التي تحقق في الاختلافات بين الجنسين في اللغة، إلا أن المطالبة المتعلقة باستخدام الاستحمام لم يتم اختبارها بشكل شامل عبر
تصف هذه الورقة تطوير مورد معجمي عبر الإنترنت للمساعدة في تنظيم أنظمة الكشف وكبح استخدام الكلمات الهجومية عبر الإنترنت.مع انتشار نمو منصات وسائل التواصل الاجتماعي، يتم الآن إجراء العديد من المحادثات عند الخط.أدت زيادة المحادثات عبر الإنترنت للترفيه وا
أخبار وهمية تسبب أضرارا كبيرة في المجتمع.للتعامل مع هذه الأخبار المزيفة، تم إجراء العديد من الدراسات حول نماذج كشف البناء وترتيب مجموعات البيانات.معظم مجموعات بيانات الأخبار المزيفة تعتمد على فترة زمنية محددة.وبالتالي، فإن نماذج الكشف المدربة على مثل
حاليا، هناك نوعان من الوصمات المتاحة للتركية: TR-Wordnet of Balkanet و Kenet.كما يتضمن Wordnet الأكثر شمولية للتركية، تشمل Kenet 76،757 عملية عملية.لدى Kenet العلاقات الدلالية المعدلة وترتبط ب Pwn من خلال العلاقات المتداخلة.في هذه الورقة، نقدم الإجرا
في هذه الورقة، نقدم تحديثا كبيرا إلى أول بيانات كيكة مجرية مسماة، The Szeged Ner Corpus.استخدمنا النقل الصفر - النار عبر اللغات لتهيئة تخصيب أنواع الكيان المشروح في الجسر باستخدام ثلاث نماذج NER العصبية: اثنان منها بناء على Corpus English Ontonotes و