ترغب بنشر مسار تعليمي؟ اضغط هنا

فتح استخراج العلاقات الهرمية

Open Hierarchical Relation Extraction

407   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تهدف استخراج العلاقات المفتوحة (Openre) إلى استخراج أنواع العلاقات الجديدة من Open-Domain Corpora، والذي يلعب دورا مهما في إكمال مخططات العلاقات لقواعد المعرفة (KBS). يلقي معظم طرق Openre بأنواع العلاقات المختلفة بمعزلات دون النظر في الاعتماد الهرمي. نقول أن OPETRE هو بطبيعته في اتصال وثيق مع التسلسلات الهرمية العلاقة. لإنشاء اتصالات ثنائية الاتجاه بين التسلسل الهرمي للفينت والعلاقة، نقترح مهمة استخراج العلاقات الهرمية المفتوحة وتقديم إطار رواية OHRE للمهمة. نقترح نماذج تدريبية تدريبية هرمية هرمية ديناميكية وتسلسل تدرس تدرس تدريسيا، لإدماج معلومات التسلسل الهرمي بشكل فعال في تمثيلات العلاقة لاستخراج العلاقات الأفضل أفضل. نقدم أيضا خوارزمية للتوسع التسلسل الهرمي من أعلى إلى أسفل لإضافة العلاقات المستخرجة إلى التسلسلات الهرمية الموجودة مع إمكانية الترجمة الترجمة الشاملة. تظهر تجارب شاملة أن OHRE تتفوق على النماذج الحديثة من خلال هامش كبير على كل من تجميع العلاقات والتوسع التسلسل الهرمي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

استخراج العلاقات غير المدعومة من قبل أزواج كيان التجمع التي لها نفس العلاقات في النص. تقوم بعض الأساليب المتنوعة (VAE) المتنوعة (VAE) بتدريب نموذج استخراج العلاقة كترفيه يولد تصنيفات العلاقة. يتم تدريب وحدة فك الترميز جنبا إلى جنب مع التشفير لإعادة ب ناء إدخال التشفير بناء على تصنيفات العلاقة التي يتم إنشاؤها المشن. هذه التصنيفات هي متغير كامن حتى يطلب منهم اتباع توزيع مسبق محدد مسبقا يؤدي إلى تدريب غير مستقر. نقترح تقنية استخراج العلاقات التي تعتمد عليها VAE تقوم بتغيير هذا القيد باستخدام التصنيفات كمتغير متوسط ​​بدلا من متغير كامن. على وجه التحديد، تكون التصنيفات مشروطة بإدخال الجملة، في حين أن المتغير الكامن مشروط على كل من التصنيفات وإدخال الجملة. يتيح ذلك نموذجنا لتوصيل وحدة فك الترميز مع التشفير دون وضع قيود على توزيع التصنيف؛ الذي يحسن استقرار التدريب. يتم تقييم نهجنا على بيانات DataSet NYT وتفوق الطرق الحديثة.
إن استخراج العلاقات على مستوى المستند هو مهمة صعبة، تتطلب التفكير في جمل متعددة للتنبؤ بمجموعة من العلاقات في وثيقة.في هذه الورقة، نقترح إطار رواية E2GRE (الكيان والأدلة استخراج التعادل الموجود) التي تستخرج العلاقات بشكل مشترك وعمليات الأدلة الأساسية باستخدام نموذج اللغة المسبق الكبير (LM) كمشفر مدخلات.أولا، نقترح توجيه آلية انتباه LM مسبقا للتركيز على السياق ذي الصلة باستخدام احتمالات الاهتمام كميزات إضافية لتنبؤ الأدلة.علاوة على ذلك، بدلا من إطعام المستند بأكمله إلى LMS محداس للحصول على تمثيل كيان، نسلسل نص المستندات مع كيانات رئيسية للمساعدة في تركيز LMS على أجزاء من الوثيقة التي ترتبط أكثر بكيان الرأس.تتعلم E2GRE لدينا بشكل مشترك استخراج العلاقة والتنبؤ بالأدلة بفعالية، مما يدل على مكاسب كبيرة على كل من هذه المهام، والتي نجدها مرتبطة بشدة.
لتخفيف الجهود البشرية من الحصول على شروح واسعة النطاق، تهدف أساليب استخراج العلاقات شبه الإشراف إلى الاستفادة من البيانات غير المسبقة بالإضافة إلى التعلم من عينات محدودة. تعاني أساليب التدريب الذاتي الحالية من مشكلة الانجراف التدريجي، حيث يتم دمج تسم يات زائفة صاخبة على البيانات غير المسبقة أثناء التدريب. لتخفيف الضوضاء في الملصقات الزائفة، نقترح طريقة تسمى METASRE، حيث تقوم شبكة توليد علامات العلاقة بإنشاء تقييم دقيق للجودة على التسميات الزائفة من خلال (META) التعلم من المحاولات الناجحة والفاشية على شبكة تصنيف العلاقة كهدف META إضافي. لتقليل تأثير الملصقات الزائفة الصاخبة، يعتمد METASRE مخطط استغلال ومستودعات زائفة تقيم جودة تسمية الزائفة على العينات غير المستمرة وتستغل فقط تسميات الزائفة عالية الجودة في أزياء التدريب الذاتي لزيادة العينات المصنفة بشكل تدريجي لكل من المتانة والدقة وبعد النتائج التجريبية على مجموعة بيانات عامة تثبت فعالية النهج المقترح.
النماذج الخاضعة للإشراف المستمرة تحظى بشعبية كبيرة بالنسبة لاستخراج العلاقة لأنه يمكننا الحصول على كمية كبيرة من البيانات التدريبية باستخدام طريقة الإشراف البعيدة دون شرح بشري.في الإشراف البعيد، تعتبر الجملة بمثابة مصدر Tuple إذا كانت الجملة تحتوي عل ى كيانا من Tuple.ومع ذلك، فإن هذه الحالة متساهلة للغاية ولا يضمن وجود معلومات خاصة بالعلاقة ذات الصلة في الجملة.على هذا النحو، تحتوي بيانات التدريب الإشراف على الكثير من الضوضاء التي تؤثر سلبا على أداء النماذج.في هذه الورقة، نقترح آلية تصفية الفرقة الذاتية لتصفية العينات الصاخبة أثناء عملية التدريب.نقيم إطار عملنا المقترح في مجموعة بيانات نيويورك تايمز التي تم الحصول عليها عبر إشراف بعيد.تجاربنا مع العديد من نماذج استخراج العلاقات العصبية متعددة الحديثة تظهر أن آلية التصفية المقترحة تعمل على تحسين متانة النماذج ويزيد من درجات F1 الخاصة بهم.
نقترح نهجا متعدد المهام، وهو نهج احتمالي لتسهيل استخراج العلاقات بالإشراف المستمر عن طريق إحضار أوثق تمثيل الجمل التي تحتوي على نفس أزواج قاعدة المعرفة.لتحقيق ذلك، نحن نحيز المساحة الكامنة من الجمل عبر السيارات الآلية (VAE) التي يتم تدريبها بشكل مشتر ك مع مصنف العلاقة.يرشد القانون الكامن تمثيلات الزوج وتؤثر إعادة إعمار الجملة.تشير النتائج التجريبية إلى مجموعة البيانات التي تم إنشاؤها عبر الإشراف البعيد إلى أن التعلم متعدد المهام ينتج عن فوائد الأداء.يكشف الاستكشاف الإضافي لتوظيف برايورس قاعدة المعارف في TheVAE أن مساحة الجملة يمكن أن تتحول نحو قاعدة المعرفة، وتقديم الترجمة الترجمة الترجمة

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا