غالبا ما تتكون قواعد المعرفة من الحقائق التي يتم حصادها من مجموعة متنوعة من المصادر، وكثير منها صاخبة وبعضها يتزاعل، مما يؤدي إلى مستوى عدم اليقين لكل ثلاثة أضعاف. ومع ذلك، غالبا ما تكون قواعد المعرفة في كثير من الأحيان غير مكتملة، مما يدفع استخدام طرق التضمين إلى التعميم من الحقائق المعروفة، ومع ذلك، فإن أساليب التضمين الحالية فقط من عدم اليقين على المستوى الثلاثي النموذجي، وتفتقر نتائج المنطق إلى الاتساق العالمي. لمعالجة هذه العيوب، نقترح Beurre، وهي طريقة تضمين مخطط المعرفة غير المؤكدة مع دلالات الاحتمالية المعايرة. نماذج Beurre كل كيان كمربع (أي فرط محاذاة محاذاة المحور) والعلاقات بين كيانين يتحولان إلى صناديق الرأس والذيل. يسمح هندسة الصناديق بحساب فعاليات التقاطعات والأحجام، وينصب النموذج مع دلالات الاحتمال المعايرة وتسهيل دمج القيود العلائقية. تظهر تجارب واسعة على مجموعة من مجموعات البيانات القياسية أن البورصة تتفوق باستمرار على خطوط الأساس حول تنبؤ الثقة وترتيب الحقائق بسبب معايرةها الاحتمالية وقدرتها على التقاط تبعيات عالية النظام بين الحقائق.
Knowledge bases often consist of facts which are harvested from a variety of sources, many of which are noisy and some of which conflict, resulting in a level of uncertainty for each triple. Knowledge bases are also often incomplete, prompting the use of embedding methods to generalize from known facts, however, existing embedding methods only model triple-level uncertainty, and reasoning results lack global consistency. To address these shortcomings, we propose BEUrRE, a novel uncertain knowledge graph embedding method with calibrated probabilistic semantics. BEUrRE models each entity as a box (i.e. axis-aligned hyperrectangle) and relations between two entities as affine transforms on the head and tail entity boxes. The geometry of the boxes allows for efficient calculation of intersections and volumes, endowing the model with calibrated probabilistic semantics and facilitating the incorporation of relational constraints. Extensive experiments on two benchmark datasets show that BEUrRE consistently outperforms baselines on confidence prediction and fact ranking due to its probabilistic calibration and ability to capture high-order dependencies among facts.
المراجع المستخدمة
https://aclanthology.org/
الحوار المرئي هو مهمة الإجابة على سلسلة من الأسئلة التي تأسست في صورة باستخدام سجل الحوار السابق كسياق. في هذه الورقة، ندرس كيفية معالجة تحديين أساسيين لهذه المهمة: (1) التفكير في الهياكل الدلالية الأساسية بين جولات الحوار و (2) تحديد العديد من الإجا
يعمل العمل المسبق على جيل البيانات إلى النص، ومهمة تحويل الكلام الرسم البياني (KG) ثلاث مرات إلى نص طبيعي، يركز على مجموعات البيانات القياسية الخاصة بالمجال. ومع ذلك، في هذه الورقة، فإننا ننفذنا اللغة الإنجليزية بأكملها Wikidata KG، ومناقشة التحديات
يعرض التفكير في المعلومات الجدولي تحديات فريدة من نوعها إلى نهج NLP الحديثة تعتمد إلى حد كبير على تضمينات النص المدربة مسبقا للنص.في هذه الورقة، ندرس هذه التحديات من خلال مشكلة الاستدلال اللغوي الطبيعي الجدول.نقترح تعديلات سهلة وفعالة على كيفية تقديم
تعكس العلاقات في معظم الرسوم البيانية المعارف التقليدية (KGS) فقط الاتصالات الثابتة والواقعية، ولكنها تفشل في تمثيل الأنشطة الديناميكية وتغير الدولة حول الكيانات. في هذه الورقة، نؤكد على أهمية دمج الأحداث في تعلم تمثيل KG، واقتراح نموذج Eventke Event
أدت نماذج اللغة المدربة مسبقا إلى مكاسب كبيرة على مجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP)، ولكنها تبين أن قيود لمهام توليد اللغة الطبيعية مع متطلبات عالية الجودة على الإخراج، مثل جيل العمولة والإعلان توليد الكلمات الرئيسية. في هذا العمل، نقد