التنبؤ بالعلامة المستنيرة عن مجموعة من النصوص وقواعد المعرفة المنوية، يجمع بين إكمال الرسوم البيانية المعرفة مع استخراج العلاقات، هي مهمة درس صغيرة نسبيا.النظام الذي يمكن أن يؤدي هذه المهمة له القدرة على تمديد مجموعة تعسفية من جداول قاعدة البيانات العلائقية مع المعلومات المستخرجة من Corpus Document.يتناول OpenKi [1] هذه المهمة من خلال استخراج الكيانات المسماة ويستند عبر أدوات Openie، ثم تعلم تضمين العلاقات من الرسم البياني لعلاقة الكيانات الناتجة عن التنبؤ بالعلاقة، مما يتفوق على النهج السابقة.نقدم امتدادا من Openki الذي يشتمل على مذكرات من التمثيلات القائمة على النصوص للكيانات والعلاقات.نوضح أن هذا يؤدي إلى زيادة كبيرة في الأداء على نظام دون هذه المعلومات.
Relation prediction informed from a combination of text corpora and curated knowledge bases, combining knowledge graph completion with relation extraction, is a relatively little studied task. A system that can perform this task has the ability to extend an arbitrary set of relational database tables with information extracted from a document corpus. OpenKi[1] addresses this task through extraction of named entities and predicates via OpenIE tools then learning relation embeddings from the resulting entity-relation graph for relation prediction, outperforming previous approaches. We present an extension of OpenKi that incorporates embeddings of text-based representations of the entities and the relations. We demonstrate that this results in a substantial performance increase over a system without this information.
المراجع المستخدمة
https://aclanthology.org/
عادة ما تعتبر التشفير العصبي للأسماء الطبية الحيوية قوية إذا تم استغلال التمثيلات بشكل فعال لمختلف مهام NLP المصب المختلفة. لتحقيق ذلك، تحتاج المشفر إلى نموذج الدلالات الطبية الحيوية خاصة بالمجال مع تنافس التطبيق العالمي للتطبيق العالمي للإشراف على ا
اعتمدت نهج استخراج المعلومات الحديثة على تدريب النماذج العصبية العميقة. ومع ذلك، يمكن أن تتجاوز هذه النماذج بسهولة الملصقات الصاخبة وتعاني من تدهور الأداء. في حين أنه من المكلف للغاية تصفية الملصقات الصاخبة في موارد تعليمية كبيرة، فإن الدراسات الحديث
أدت النجاحات الأخيرة في النمذجة التوليدية العميقة إلى تقدم كبير في توليد اللغة الطبيعية (NLG).أظهرت دمج الكيانات في نماذج الجيل العصبي تحسينات كبيرة من خلال المساعدة في استنتاج الموضوع الموجز وإنشاء محتوى متماسك.لتعزيز دور الكيان في NLG، في هذه الورق
في حين أن الكثير من الأبحاث قد تم في توليف الرسائل النصية إلى صورة، فقد تم إجراء القليل من العمل لاستكشاف استخدام الهيكل اللغوي لنص المدخلات. هذه المعلومات أكثر أهمية بالنسبة لتصور القصة لأن مدخلاتها لها هيكل سرد صريح يحتاج إلى ترجمة إلى تسلسل الصورة
تعتمد أنظمة استرجاع المعلومات الكلاسيكية مثل BM25 على المباراة المعجمية الدقيقة ويمكنها تنفيذ البحث بكفاءة مع فهرس قائمة مقلوب.تتحول نماذج الأشعة تحت الحديثة الأخيرة نحو ناعم مطابقة شروط مستندات الاستعلام، لكنها تفقد كفاءة حساب أنظمة المطابقة الدقيقة