Wikineural: مجتمعة خلق بيانات الفضة المصنوعة من الفضة العصبي والمعرفة لتعدد اللغات


الملخص بالعربية

التعرف على الكيان المسمى متعدد اللغات (NER) هي مهمة متوسطة رئيسية مطلوبة في العديد من مجالات NLP.في هذه الورقة، نتعلم القضية المعروفة من ندرة البيانات في NER، خاصة ذات الصلة عند الانتقال إلى سيناريو متعدد اللغات، وتتجاوز النهج الحالية لإنشاء بيانات فضية متعددة اللغات للمهمة.نستفصل نصوص ويكيبيديا وإدخال منهجية جديدة تستند إلى المزيج الفعال من الأساليب القائمة على المعرفة والنماذج العصبية، إلى جانب تقنية تكيف مجال الرواية، لإنتاج شركة تدريبية عالية الجودة ل NER.نقوم بتقييم مجموعات البيانات الخاصة بنا على نطاق واسع على المعايير القياسية الخاصة ب NER، مما يؤدي إلى تحسينات كبيرة تصل إلى 6 نقاط F1-Score تستند إلى 6 نقاط على أنظمة الحالة السابقة لإنشاء البيانات.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث