ترغب بنشر مسار تعليمي؟ اضغط هنا

تنبؤ الكيان في الرسوم البيانية المعرفة مع Adgeddings مشترك

Entity Prediction in Knowledge Graphs with Joint Embeddings

298   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أصبحت الرسوم البيانية المعرفة (KGS) شعبية بشكل متزايد في السنوات الأخيرة. ومع ذلك، نظرا لأن المعرفة تنمو باستمرار وتغييرات، فمن المحتم أن تمتد KGS الموجودة مع الكيانات التي ظهرت أو أنها ذات صلة بنطاق كجم بعد إنشائها. تعتمد البحث في تحديث KGS عادة على استخراج الكيانات المسماة والعلاقات من النص. ومع ذلك، لا يمكن لهذه الأساليب استنتاج كيانات أو علاقات غير مذكورة صراحة. بدلا من ذلك، استغلال نماذج التضمين الانتظار الهيكلية الضمنية للتنبؤ بالعلاقات المفقودة، ولكن لا يمكن التنبؤ بالكيانات المفقودة. في هذه المقالة، نقدم طريقة جديدة لإثراء KG مع كيانات جديدة بالنظر إلى وصفها النصي. لدينا طريقة ترفع نماذج تضمين مشتركة، وبالتالي لا تتطلب كيانات أو علاقات يمكن تسميتها صراحة. نظرا لأن نهجنا يمكن أن تحدد مفاهيم جديدة في كوربوس وثيقة ونقلها إلى كجم، ونجد أن أداء طريقتنا يحسن بشكل كبير عند تمديده مع تقنيات من تعدين حكم الرابطة، والتعدين النصي، والتعلم النشط.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يهدف كتابة كيان الرسم البياني للمعرفة إلى أن ينتج أنواع الكيانات المفقودة في الرسوم البيانية المعرفة التي تعد قضية مهمة ولكنها غير مستحقة.تقترح هذه الورقة طريقة رواية لهذه المهمة من خلال الاستفادة من المعلومات السياقية للكيانات.على وجه التحديد، نقوم بتصميم آليات الاستدلال: I) N2T: استخدام كل جار كل جار بشكل مستقل لاستنتاج نوعه؛2) AGG2T: إجمالي جيران كيان لاستنتاج نوعها.ستنتج هذه الآليات نتائج الاستدلال المتعددة، وتستخدم طريقة تجميع مضاعفة بشكل كبير لتوليد نتيجة الاستدلال النهائي.علاوة على ذلك، نقترح وظيفة خسارة جديدة لتخفيف المشكلة السلبية الخاطئة أثناء التدريب.تجارب على اثنين من كلغ العالم الحقيقي توضح فعالية طريقتنا.يمكن الحصول على شفرة المصدر وبيانات هذه الورقة من https://github.com/cciiplab/cet.
الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن تكون بمثابة آلية ذاكرة الوكيل في مهام IMRC.نستكشف أربع فئات مختلفة من الرسوم البيانية التي يمكنها التقاط معلومات نصية على مختلف المستويات.نحن تصف الأساليب التي تقوم ببناء وتحديث هذه الرسوم البيانية هذه ديناميكيا أثناء جمع المعلومات، وكذلك النماذج العصبية لتشفير تمثيلات الرسم البياني في وكلاء RL.تشير تجارب واسعة النطاق على ISquad إلى أن تمثيلات الرسم البياني يمكن أن تؤدي إلى تحسينات كبيرة في الأداء لعوامل RL.
تستخدم الرسوم البيانية المعرفة (KGS) على نطاق واسع لتخزين المعلومات والوصول إليها حول الكيانات وعلاقاتها.بالنظر إلى استفسار، تهدف مهمة استرجاع الكيانات من KG إلى تقديم قائمة في المرتبة ذات الصلة بالاستعلام.في الآونة الأخيرة، أظهر عدد متزايد من النماذ ج لاسترجاع الكيان تحسنا كبيرا على الأساليب التقليدية.هذه النماذج، ومع ذلك، تم تطويرها للكلية الإنجليزية.في هذا العمل، نبني على نظام واحد من هذا القبيل، يدعى Kewer، لاقتراح Serag (استرجاع الكيانات الدلالي من الرسوم البيانية المعرفة العربية).مثل Kewer، يستخدم Serag مناحي عشوائي لتوليد embeddings للكياء.تعتبر DBPedia-Entity V2 مجموعة الاختبار القياسية لاسترجاع الكيان.نناقش تحديات استخدامها للغات غير الإنجليزية بشكل عام والعربية على وجه الخصوص.نحن نقدم نسخة عربية من هذه المجموعة القياسية، واستخدامها لتقييم Serag.يظهر Serag أنه يتفوق بشكل كبير على نموذج BM25 الشهير بفضل التفكير المتعدد القفز.
مع زيادة الطفرة الأخيرة في التطبيقات الاجتماعية التي تعتمد على الرسوم البيانية المعرفة، أصبحت الحاجة إلى التقنيات لضمان الإنصاف في الأساليب القائمة على KG واضحة بشكل متزايد. أظهرت الأعمال السابقة أن كلية كجمها عرضة للحيوانات الاجتماعية المختلفة، وقد اقترحت طرق متعددة لدخاناتها. ومع ذلك، في مثل هذه الدراسات، كان التركيز على تقنيات deviasing، في حين يتم تحديد العلاقات التي ستكون degiased يدويا من قبل المستخدم. نظرا لأن المواصفات اليدوية هي نفسها عرضة للتحيز الإدراكي البشري، فهناك حاجة إلى نظام قادر على قياس وفضح التحيزات، التي يمكن أن تدعم قرارات أكثر استنارة بشأن ما له ديبي. لمعالجة هذه الفجوة في الأدب، وصفنا إطارا لتحديد التحيزات الموجودة في Adments Graph Admings، بناء على مقاييس BIAS الرقمية. نوضح الإطار بثلاث تدابير تحيز مختلفة حول مهمة التنبؤ بالمهنة، ويمكن امتدت بمرونة لتعريفات وتطبيقات إضافية. يمكن بعد ذلك تسليم العلاقات التي يتم تمييزها على أنها منحازة إلى صانعي القرار للحكم على الدخل اللاحق.
أحدثت النماذج المدربة (E2E) مؤخرا (E2E) لصالح الإجابة على الرسوم البيانية المعرفة (KGQA) نتائج واعدة تستخدم فقط مجموعة بيانات خاضعة للإشراف.ومع ذلك، يتم تدريب هذه النماذج وتقييمها في وضع يتم فيه توفير كيانات سؤال مشروح يدوية للنموذج، مما يترك المهمة المهمة وغير التافهة لقرار الكيان (ER) خارج نطاق تعلم E2E.في هذا العمل، نقوم بتوسيع حدود التعلم E2E ل KGQA لتضمين تدريب مكون ER.يحتاج النموذج الخاص بنا فقط إلى نص الأسئلة والكيانات الإجابة لتدريب، وتوفر نموذج ضمان الجودة المستقل لا يتطلب توفير مكون إضافي ER أثناء وقت التشغيل.نهجنا هو قابل له تماما، وذلك بفضل اعتماده على طريقة حديثة لبناء KGS الفائقة (كوهين وآخرون، 2020).نقوم بتقييم نموذج E2E المدربين على مجموعة بيانات عامين وإظهار أنه يقترب من النماذج الأساسية التي تستخدم الكيانات المشروح اليدوية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا