أصبحت الرسوم البيانية المعرفة (KGS) شعبية بشكل متزايد في السنوات الأخيرة. ومع ذلك، نظرا لأن المعرفة تنمو باستمرار وتغييرات، فمن المحتم أن تمتد KGS الموجودة مع الكيانات التي ظهرت أو أنها ذات صلة بنطاق كجم بعد إنشائها. تعتمد البحث في تحديث KGS عادة على استخراج الكيانات المسماة والعلاقات من النص. ومع ذلك، لا يمكن لهذه الأساليب استنتاج كيانات أو علاقات غير مذكورة صراحة. بدلا من ذلك، استغلال نماذج التضمين الانتظار الهيكلية الضمنية للتنبؤ بالعلاقات المفقودة، ولكن لا يمكن التنبؤ بالكيانات المفقودة. في هذه المقالة، نقدم طريقة جديدة لإثراء KG مع كيانات جديدة بالنظر إلى وصفها النصي. لدينا طريقة ترفع نماذج تضمين مشتركة، وبالتالي لا تتطلب كيانات أو علاقات يمكن تسميتها صراحة. نظرا لأن نهجنا يمكن أن تحدد مفاهيم جديدة في كوربوس وثيقة ونقلها إلى كجم، ونجد أن أداء طريقتنا يحسن بشكل كبير عند تمديده مع تقنيات من تعدين حكم الرابطة، والتعدين النصي، والتعلم النشط.
Knowledge Graphs (KGs) have become increasingly popular in the recent years. However, as knowledge constantly grows and changes, it is inevitable to extend existing KGs with entities that emerged or became relevant to the scope of the KG after its creation. Research on updating KGs typically relies on extracting named entities and relations from text. However, these approaches cannot infer entities or relations that were not explicitly stated. Alternatively, embedding models exploit implicit structural regularities to predict missing relations, but cannot predict missing entities. In this article, we introduce a novel method to enrich a KG with new entities given their textual description. Our method leverages joint embedding models, hence does not require entities or relations to be named explicitly. We show that our approach can identify new concepts in a document corpus and transfer them into the KG, and we find that the performance of our method improves substantially when extended with techniques from association rule mining, text mining, and active learning.
المراجع المستخدمة
https://aclanthology.org/
يهدف كتابة كيان الرسم البياني للمعرفة إلى أن ينتج أنواع الكيانات المفقودة في الرسوم البيانية المعرفة التي تعد قضية مهمة ولكنها غير مستحقة.تقترح هذه الورقة طريقة رواية لهذه المهمة من خلال الاستفادة من المعلومات السياقية للكيانات.على وجه التحديد، نقوم
الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن
تستخدم الرسوم البيانية المعرفة (KGS) على نطاق واسع لتخزين المعلومات والوصول إليها حول الكيانات وعلاقاتها.بالنظر إلى استفسار، تهدف مهمة استرجاع الكيانات من KG إلى تقديم قائمة في المرتبة ذات الصلة بالاستعلام.في الآونة الأخيرة، أظهر عدد متزايد من النماذ
مع زيادة الطفرة الأخيرة في التطبيقات الاجتماعية التي تعتمد على الرسوم البيانية المعرفة، أصبحت الحاجة إلى التقنيات لضمان الإنصاف في الأساليب القائمة على KG واضحة بشكل متزايد. أظهرت الأعمال السابقة أن كلية كجمها عرضة للحيوانات الاجتماعية المختلفة، وقد
أحدثت النماذج المدربة (E2E) مؤخرا (E2E) لصالح الإجابة على الرسوم البيانية المعرفة (KGQA) نتائج واعدة تستخدم فقط مجموعة بيانات خاضعة للإشراف.ومع ذلك، يتم تدريب هذه النماذج وتقييمها في وضع يتم فيه توفير كيانات سؤال مشروح يدوية للنموذج، مما يترك المهمة