التعرف على الكيان المسمى متعدد اللغات (NER) هي مهمة متوسطة رئيسية مطلوبة في العديد من مجالات NLP.في هذه الورقة، نتعلم القضية المعروفة من ندرة البيانات في NER، خاصة ذات الصلة عند الانتقال إلى سيناريو متعدد اللغات، وتتجاوز النهج الحالية لإنشاء بيانات فضية متعددة اللغات للمهمة.نستفصل نصوص ويكيبيديا وإدخال منهجية جديدة تستند إلى المزيج الفعال من الأساليب القائمة على المعرفة والنماذج العصبية، إلى جانب تقنية تكيف مجال الرواية، لإنتاج شركة تدريبية عالية الجودة ل NER.نقوم بتقييم مجموعات البيانات الخاصة بنا على نطاق واسع على المعايير القياسية الخاصة ب NER، مما يؤدي إلى تحسينات كبيرة تصل إلى 6 نقاط F1-Score تستند إلى 6 نقاط على أنظمة الحالة السابقة لإنشاء البيانات.
Multilingual Named Entity Recognition (NER) is a key intermediate task which is needed in many areas of NLP. In this paper, we address the well-known issue of data scarcity in NER, especially relevant when moving to a multilingual scenario, and go beyond current approaches to the creation of multilingual silver data for the task. We exploit the texts of Wikipedia and introduce a new methodology based on the effective combination of knowledge-based approaches and neural models, together with a novel domain adaptation technique, to produce high-quality training corpora for NER. We evaluate our datasets extensively on standard benchmarks for NER, yielding substantial improvements up to 6 span-based F1-score points over previous state-of-the-art systems for data creation.
المراجع المستخدمة
https://aclanthology.org/
تستند معظم طرق تحليل البنية الخطابية السابقة (RST) إلى التعلم الخاضع للإشراف مثل الشبكات العصبية، والتي تتطلب وجعة مشروح من الحجم والجودة الكافية. ومع ذلك، فإن Treebank Treebank RST RST (RST-DT)، والجورباس القياسي للحل الصادر باللغة الإنجليزية، وهو ص
استخدمت كسارة زجاج مضافا إليها كربونات المغنيزيوم MgCO3 كمادة مولدة لطور غازي لتحضير الزجاج المسامي. درس الزجاج المشوب ببروميد الفضة بطريقة الزجاج المسامي بالطيوف المرئية و الفوق بنفسجية و نفوذيتها الضوئية و كذلك باستخدام تقنية انعراج الاشعة السينية (XRD).
في معظم سيناريوهات جهاز التقطير أو سرقة الترجمة الآلية العصبية، يتم استخدام فرضية التسجيل أعلى النموذج المستهدف (المعلم) لتدريب نموذج جديد (طالب).إذا كانت الترجمات المرجعية متاحة أيضا، فيمكن إظهار الفرضيات الأفضل (فيما يتعلق بالمراجع) وفرضيات فقراء إ
لقد استخدمنا في هذا البحث تقنية الغزل الكهربائي للحصول على شبكات لا منسوجة من
الألياف النانوية من بولي فينيل الكحول و جزيئات الفضة النانوية حيث قمنا بإذابة بوليمير
بولي فينيل الكحول في مذيبه الماء لتشكيل محلول بوليميري يتم شحنه بشحنة كهربائية موجبة
تستخدم حبيبات الفضة النانوية (NPs) في العديد من التطبيقات، و يعود ذلك إلى
خصائصها المميزة الكهربائية و الضوئية و الكيميائية و البيولوجية (مضادة للبكتريا). و في
وقتنا الراهن فقد استخدمت تقنية الطباعة بالأحبار المحضرة من حبيبات الفضة النانوية
في تصنيع دارات الكترونية بتكلفة منخفضة.