يعرف تطبيق المتخصص في مجال التعرف على الكيان المسمى (ner) باسم الطيوميدي (Bioner)، الذي يهدف إلى تحديد وتصنيف المفاهيم الطبية الحيوية التي تهم الباحثين، مثل الجينات والبروتينات والمركبات الكيميائية والمخدرات والطفرات والأمراض ، وما إلى ذلك وهلم جرا. تشبه المهمة Bioner إلى حد كبير عام NER ولكن الاعتراف بالكيانات الطبية الحيوية المسماة (BNES) أكثر تحديا من الاعتراف بالأسماء المناسبة من الصحف بسبب خصائص التسميات الطبية الحيوية. من أجل معالجة التحديات التي تطرحها Bioner، تم تنفيذ سبع نماذج تعليمية في سبع آلات مقارنة نهج تعلم النقل بناء على برت ضبط صقل مع النماذج العصبية التي تعتمد عليها BI-LSTM وطراز CRF يستخدم كناسما أساسيا. تم استخدام الدقة والتذكر و F1-Score نظرا لأن درجات الأداء التي تقوم بتقييم النماذج على اثنين من الأطباق الطبية الحيوية المعروفة: Jnlpba و Biocreative IV (BC-IV). تعتبر مطابقة صارمة جزئية معايير تقييم. تشير النتائج المبلغ عنها إلى أن نهج التعلم عبر النقل يعتمد على بيرت المصنفات التي تم ضبطها تتفوق جميع أساليب الآخرين على تحقيق أعلى درجات لجميع المقاييس على كلا الشريعة.
The domain-specialised application of Named Entity Recognition (NER) is known as Biomedical NER (BioNER), which aims to identify and classify biomedical concepts that are of interest to researchers, such as genes, proteins, chemical compounds, drugs, mutations, diseases, and so on. The BioNER task is very similar to general NER but recognising Biomedical Named Entities (BNEs) is more challenging than recognising proper names from newspapers due to the characteristics of biomedical nomenclature. In order to address the challenges posed by BioNER, seven machine learning models were implemented comparing a transfer learning approach based on fine-tuned BERT with Bi-LSTM based neural models and a CRF model used as baseline. Precision, Recall and F1-score were used as performance scores evaluating the models on two well-known biomedical corpora: JNLPBA and BIOCREATIVE IV (BC-IV). Strict and partial matching were considered as evaluation criteria. The reported results show that a transfer learning approach based on fine-tuned BERT outperforms all others methods achieving the highest scores for all metrics on both corpora.
المراجع المستخدمة
https://aclanthology.org/
إن إزالة الكيانات المسماة (NED)، والتي تنطوي على رسم الخرائط النصية للكيانات الهيكلية، تحديا بشكل خاص في المجال الطبي بسبب وجود كيانات نادرة.تقتصر الأساليب الحالية بوجود الموارد الهيكلية الخشونة في قواعد المعرفة الطبية الحيوية وكذلك استخدام مجموعات ا
يزداد عدد الوثائق الطبية الحيوية بسرعة.وفقا لذلك، يتزايد الطلب على استخراج المعرفة من النصوص الطبية الحيوية على نطاق واسع.تعرف النماذج القائمة على بيرت بأدائها عالية في المهام المختلفة.ومع ذلك، غالبا ما يكون باهظ الثمن بشكل حسابي.بيئة GPU متطورة غير
ينقل التعرف على الكيان المسمى عبر المجال (NER) المعرفة NER من مجالات الموارد العالية إلى المجال المستهدف منخفض الموارد. نظرا للموارد المحدودة المسمى وانعكاف المجال، تعد Nor Cross-Domain مهمة صعبة. لمعالجة هذه التحديات، نقترح نهج تقطير المعرفة في مجال
يدل العمل الحالي في التعرف على الكيان المسمى (NER) أن تقنيات تكبير البيانات يمكن أن تنتج نماذج أكثر قوة.ومع ذلك، تركز معظم التقنيات الموجودة على زيادة البيانات داخل المجال في سيناريوهات الموارد المنخفضة حيث تكون البيانات المشروحة محدودة للغاية.في هذا
التعرف على الكيانات المسماة الحالية في النص هو خطوة مهمة نحو استخراج المعلومات وفهم اللغة الطبيعية.يعرض هذا العمل نظام التعرف على الكيان المسمى للنشاط القانوني الروماني.يستفيد النظام من Corpus Gold Legalnero المشروح.علاوة على ذلك، يجمع النظام بين الع