التدريب على السياق، تدرب الخصومة اسم الانتظام التحيز في التعرف على الكيان المسمى


الملخص بالعربية

الملخص في هذا العمل، ندرس قدرة نماذج NER لاستخدام المعلومات السياقية عند التنبؤ بنوع كيان غامض.نقدم NRB، اختبار جديد مصمم بعناية لتشخيص تحيز الانتظام من النماذج NER.تشير نتائجنا إلى أن جميع النماذج الحديثة التي اختبرناها إظهار مثل هذا التحيز؛نماذج Bert Tuned Tunded بشكل كبير تفوقها بشكل كبير (LSTM-CRF) على NRB، على الرغم من وجود أداء قابلة للمقارنة (أحيانا أقل) على المعايير القياسية.لتخفيف هذا التحيز، نقترح طريقة تدريب نموذجية نماذج جديدة تضيف الضوضاء المخدرة القابلة للتعلم إلى بعض الكيانات، وبالتالي فرض النماذج للتركيز بقوة أكبر على الإشارة السياقية، مما يؤدي إلى مكاسب كبيرة على NRB.الجمع بينه مع استراتيجيات تدريبية أخرى، وتعزيز البيانات وتجميد المعلمة، يؤدي إلى مزيد من المكاسب.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث