للتخفيف من ندرة التسمية في مهمة التعرف على الكيان المسمى (NER)، يتم تطبيق أساليب NER التي أشرف بشكل كبير على نطاق واسع على البيانات التسمية تلقائيا وتحديد الكيانات.على الرغم من انخفاض الجهود البشرية، فإن التعليقات التوضيحية غير المكتملة والصعار الناتجة تشكل تحديات جديدة لتعلم النماذج العصبية الفعالة.في هذه الورقة، نقترح طريقة تمديد القاموس الرواية التي تستخرج كيانات جديدة من خلال النموذج الموسع من النوع.علاوة على ذلك، نقوم بتصميم شبكة تدرك حدود متعددة التحبيب التي تكتشف حدود الكيان من وجهات النظر المحلية والعالمية.نقوم بإجراء تجارب على أنواع مختلفة من مجموعات البيانات، تظهر النتائج أن طرازنا تتفوق على الأنظمة السابقة للإشراف المستمرة، وحتى تجاوز النماذج الخاضعة للإشراف.
To alleviate label scarcity in Named Entity Recognition (NER) task, distantly supervised NER methods are widely applied to automatically label data and identify entities. Although the human effort is reduced, the generated incomplete and noisy annotations pose new challenges for learning effective neural models. In this paper, we propose a novel dictionary extension method which extracts new entities through the type expanded model. Moreover, we design a multi-granularity boundary-aware network which detects entity boundaries from both local and global perspectives. We conduct experiments on different types of datasets, the results show that our model outperforms previous state-of-the-art distantly supervised systems and even surpasses the supervised models.
المراجع المستخدمة
https://aclanthology.org/
يدل العمل الحالي في التعرف على الكيان المسمى (NER) أن تقنيات تكبير البيانات يمكن أن تنتج نماذج أكثر قوة.ومع ذلك، تركز معظم التقنيات الموجودة على زيادة البيانات داخل المجال في سيناريوهات الموارد المنخفضة حيث تكون البيانات المشروحة محدودة للغاية.في هذا
تم دراسة التعرف على الكيان المسمى Nestate (NNER) على نطاق واسع، تهدف إلى تحديد جميع الكيانات المتداخلة من تمديدات محتملة (I.E.، واحد أو أكثر من الرموز المستمرة). ومع ذلك، فإن الدراسات الحديثة لأي نانر إما التركيز على مخططات العلامات الشاقة أو الاستفا
الملخص نتخذ خطوة نحو معالجة تمثيل القارة الأفريقية في أبحاث NLP من خلال جلب مختلف أصحاب المصلحة من أصحاب المصلحة في إنشاء بيانات كبيرة متاحة للجمهور وعالية الجودة للتعرف على الكيان المسمى (NER) في عشرة لغات أفريقية.إننا نقوم بالتفصيل خصائص هذه اللغات
الملخص في هذا العمل، ندرس قدرة نماذج NER لاستخدام المعلومات السياقية عند التنبؤ بنوع كيان غامض.نقدم NRB، اختبار جديد مصمم بعناية لتشخيص تحيز الانتظام من النماذج NER.تشير نتائجنا إلى أن جميع النماذج الحديثة التي اختبرناها إظهار مثل هذا التحيز؛نماذج Be
الملخص ندرس التعلم التعرف على الكيان المسمى في وجود التعليقات التوضيحية في الكيان المفقود.نحن نقترب من هذا الإعداد باسم وضع علامات مع المتغيرات الكامنة واقتراح خسارة جديدة، ونسبة الكيان المتوقعة، لتعلم النماذج بحضور العلامات المفقودة بشكل منهجي.نظرا