نظرا لعدد كبير من الكيانات في قواعد المعرفة الطبية الحيوية، فإن جزء بسيط من الكيانات الصغيرة فقط بيانات التدريب المسمى. وهذا يستلزم كيان ربط النماذج التي يمكن أن تصل إلى ربط تذكر الكيانات غير المرئية باستخدام التمثيلات المستفادة للكيانات. يتذكر كل منهما السابقة بشكل مستقل، وتجاهل العلاقات داخل الوثائق وعبر الوثائق بين الكيان. يمكن أن تكون هذه العلاقات مفيدة للغاية لربط الذكور في النص الطبي الطبيعي حيث غالبا ما تذكر القرارات ذات الصلة وجود نموذج عام أو متخصص للغاية. في هذه الورقة، نقدم نموذجا يمكن فيه إلقاء النموذج الذي يمكن فيه اتخاذ قرارات مرتبطة فقط بالربط بالكيان الأساسي المعرفي ولكن أيضا من خلال تجميع تذكر معا عبر التجميع والاشتراك في ربط التوقعات. في تجارب في أكبر مجموعة بيانات بيئية متوفرة للجمهور، نحسن أفضل التنبؤ المستقل للكيان الذي يربط بمقدار 3.0 نقطة من الدقة، ويحسن نموذج الاستدلال القائم على التجميع كيان يربط بمقدار 2.3 نقطة.
Due to large number of entities in biomedical knowledge bases, only a small fraction of entities have corresponding labelled training data. This necessitates entity linking models which are able to link mentions of unseen entities using learned representations of entities. Previous approaches link each mention independently, ignoring the relationships within and across documents between the entity mentions. These relations can be very useful for linking mentions in biomedical text where linking decisions are often difficult due mentions having a generic or a highly specialized form. In this paper, we introduce a model in which linking decisions can be made not merely by linking to a knowledge base entity but also by grouping multiple mentions together via clustering and jointly making linking predictions. In experiments on the largest publicly available biomedical dataset, we improve the best independent prediction for entity linking by 3.0 points of accuracy, and our clustering-based inference model further improves entity linking by 2.3 points.
المراجع المستخدمة
https://aclanthology.org/
يعرف تطبيق المتخصص في مجال التعرف على الكيان المسمى (ner) باسم الطيوميدي (Bioner)، الذي يهدف إلى تحديد وتصنيف المفاهيم الطبية الحيوية التي تهم الباحثين، مثل الجينات والبروتينات والمركبات الكيميائية والمخدرات والطفرات والأمراض ، وما إلى ذلك وهلم جرا.
إن إزالة الكيانات المسماة (NED)، والتي تنطوي على رسم الخرائط النصية للكيانات الهيكلية، تحديا بشكل خاص في المجال الطبي بسبب وجود كيانات نادرة.تقتصر الأساليب الحالية بوجود الموارد الهيكلية الخشونة في قواعد المعرفة الطبية الحيوية وكذلك استخدام مجموعات ا
يمكن إلقاء العديد من الأسئلة المفتوحة على المشكلات بمثابة مهمة استقامة نصية، حيث يتم تسليم الإجابات السؤال والمرشح لتشكيل الفرضيات. ثم يحدد نظام ضمان الجودة إذا كان قواعد المعرفة الداعمة، التي تعتبر مباني محتملة، تنطوي على الفرضيات. في هذه الورقة، نح
يستخدم تطبيع المفهوم الطبي الحيوي (BCN) على نطاق واسع في معالجة النص الطبية الحيوية كوحدة أساسية.بسبب العديد من المتغيرات السطحية للمفاهيم الطبية الحيوية، لا يزال BCN صعبا وغير مستمر.في هذه الورقة، نمستحم فرطيات المفهوم الطبية الحيوية لتسهيل BCN.نقتر
إن الاستدلال اللغوي الطبيعي (NLI) هي مهمة تحديد ما إذا كان جزء من النص ينطوي أو يتناقض أو لا علاقة له بقطعة أخرى من النص.في هذه الورقة، نحقق في كيفية ندف الاستنتاجات المنهجية (أي، العناصر التي يتفق بها الناس على تسمية NLI) بصرف النظر عن عناصر الخلاف