ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج العلاقات بشكل مسيير باستخدام شبكة مراجعة متعددة الطبقات والتعلم المتعدد للمثيل الثقة

Distantly Supervised Relation Extraction using Multi-Layer Revision Network and Confidence-based Multi-Instance Learning

378   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

استخراج العلاقات الإشراف على نطاق واسع يستخدم على نطاق واسع في بناء قواعد المعرفة بسبب كفاءته العالية.ومع ذلك، فإن الحالات التي تم الحصول عليها تلقائيا ذات جودة منخفضة مع العديد من الكلمات غير ذات الصلة.بالإضافة إلى ذلك، يؤدي الافتراض القوي للإشراف البعيد إلى وجود جمل صاخبة في أكياس الجملة.في هذه الورقة، نقترح شبكة مراجعة متعددة الطبقات رواية (MLRN) التي تخفف من آثار ضوضاء مستوى الكلمات من خلال التأكيد على علاقات الجملة الداخلية قبل استخراج المعلومات ذات الصلة داخل الجمل.بعد ذلك، نركز طريقة تعليمية متعددة الاستخدامات متعددة الاستخدامات ومقاومة للضوضاء مقاومة للضوضاء لتصفية الجمل الصاخبة وكذلك تعيين الأوزان المناسبة إلى تلك ذات الصلة.تجارب واسعة على مجموعة بيانات اثنين نيويورك تايمز (NYT) تثبت أن نهجنا يحقق تحسينات كبيرة على الأساس.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح نهجا متعدد المهام، وهو نهج احتمالي لتسهيل استخراج العلاقات بالإشراف المستمر عن طريق إحضار أوثق تمثيل الجمل التي تحتوي على نفس أزواج قاعدة المعرفة.لتحقيق ذلك، نحن نحيز المساحة الكامنة من الجمل عبر السيارات الآلية (VAE) التي يتم تدريبها بشكل مشتر ك مع مصنف العلاقة.يرشد القانون الكامن تمثيلات الزوج وتؤثر إعادة إعمار الجملة.تشير النتائج التجريبية إلى مجموعة البيانات التي تم إنشاؤها عبر الإشراف البعيد إلى أن التعلم متعدد المهام ينتج عن فوائد الأداء.يكشف الاستكشاف الإضافي لتوظيف برايورس قاعدة المعارف في TheVAE أن مساحة الجملة يمكن أن تتحول نحو قاعدة المعرفة، وتقديم الترجمة الترجمة الترجمة
النماذج الخاضعة للإشراف المستمرة تحظى بشعبية كبيرة بالنسبة لاستخراج العلاقة لأنه يمكننا الحصول على كمية كبيرة من البيانات التدريبية باستخدام طريقة الإشراف البعيدة دون شرح بشري.في الإشراف البعيد، تعتبر الجملة بمثابة مصدر Tuple إذا كانت الجملة تحتوي عل ى كيانا من Tuple.ومع ذلك، فإن هذه الحالة متساهلة للغاية ولا يضمن وجود معلومات خاصة بالعلاقة ذات الصلة في الجملة.على هذا النحو، تحتوي بيانات التدريب الإشراف على الكثير من الضوضاء التي تؤثر سلبا على أداء النماذج.في هذه الورقة، نقترح آلية تصفية الفرقة الذاتية لتصفية العينات الصاخبة أثناء عملية التدريب.نقيم إطار عملنا المقترح في مجموعة بيانات نيويورك تايمز التي تم الحصول عليها عبر إشراف بعيد.تجاربنا مع العديد من نماذج استخراج العلاقات العصبية متعددة الحديثة تظهر أن آلية التصفية المقترحة تعمل على تحسين متانة النماذج ويزيد من درجات F1 الخاصة بهم.
في استخراج العلاقة، يستخدم الإشراف البعيد على نطاق واسع لتسمية مجموعة بيانات تدريبية واسعة النطاق عن طريق محاذاة قاعدة المعرفة بالنص غير منظم. افترضت أن معظم الدراسات الموجودة في هذا المجال هناك قدر كبير من النص المركزي غير منظم. ومع ذلك، في الممارسة العملية، يتم توزيع النصوص عادة على منصات مختلفة ولا يمكن أن تكون مركزية بسبب قيود الخصوصية. لذلك، من المفيد التحقيق في الإشراف البعيد في نموذج التعلم الفيدرالي، الذي يقوم بتشغيل النموذج من الحاجة إلى الوصول المباشر إلى النصوص الخام. ومع ذلك، يصبح التغلب على ضجيج الملصق للإشراف البعيد أكثر صعوبة في الإعدادات الفيدرالية، لأن النصوص التي تحتوي على نفس زوج الكيان مبعثر حول منصات مختلفة. في هذه الورقة، نقترح إطار دنيوي مخصص لإقناع الضوضاء التسمية في الإعدادات الفيدرالية. مفتاح هذا الإطار هو طريقة مستندة في حالة التعلم التي تعتمد على التعليم غير قادر على تحديد جمل موثوقة عبر التعاون عبر النظام الأساسي. تجارب مختلفة على بيانات DataSet New York Times و Mirna Gene Lination DataSet تثبت فعالية الطريقة المقترحة.
لتخفيف الجهود البشرية من الحصول على شروح واسعة النطاق، تهدف أساليب استخراج العلاقات شبه الإشراف إلى الاستفادة من البيانات غير المسبقة بالإضافة إلى التعلم من عينات محدودة. تعاني أساليب التدريب الذاتي الحالية من مشكلة الانجراف التدريجي، حيث يتم دمج تسم يات زائفة صاخبة على البيانات غير المسبقة أثناء التدريب. لتخفيف الضوضاء في الملصقات الزائفة، نقترح طريقة تسمى METASRE، حيث تقوم شبكة توليد علامات العلاقة بإنشاء تقييم دقيق للجودة على التسميات الزائفة من خلال (META) التعلم من المحاولات الناجحة والفاشية على شبكة تصنيف العلاقة كهدف META إضافي. لتقليل تأثير الملصقات الزائفة الصاخبة، يعتمد METASRE مخطط استغلال ومستودعات زائفة تقيم جودة تسمية الزائفة على العينات غير المستمرة وتستغل فقط تسميات الزائفة عالية الجودة في أزياء التدريب الذاتي لزيادة العينات المصنفة بشكل تدريجي لكل من المتانة والدقة وبعد النتائج التجريبية على مجموعة بيانات عامة تثبت فعالية النهج المقترح.
ينطوي تحليل المعنويات المستندة إلى جانب الجسیلاء بشكل أساسي على ثلاث مجموعات فرعية: استخراج الأجل في الجانب، واستخراج الأجل رأي، وتصنيف المعنويات على مستوى الجانب، والذي يتم التعامل معه عادة بطريقة منفصلة أو مشتركة. ومع ذلك، فإن النهج السابقة لا تستغ ل العلاقات التفاعلية بين ثلاث مجموعات فرعية ولا تستفيد بشكل متفيد على مستوى الوثيقة / المعروفة المسمى المسمى المستندات المتوفرة بسهولة، مما يقيد أدائه. لمعالجة هذه المشكلات، نقترح شبكة نقل المعرفة متعددة المعرفة متعددة الرواية (IMKTN) ل AND-LITE ABSA. لشيء واحد، من خلال الارتباطات التفاعلية بين المهن الفرعية ABASA، تقوم IMKTN بتحويل المعرفة الخاصة بمهام المهام من أي اثنين من المهام الفرعية الثلاثة إلى واحدة أخرى على مستوى الرمز المميز من خلال الاستفادة من خوارزمية التوجيه المصممة جيدا، أي أي اثنين من سيساعد المهن الفرعية الثلاثة الثالث. بالنسبة لآخر، تقوم IMKTN بتحويل المعرفة على مستوى المستند، I.E.، المعرفة ذات الصلة بالمجال والمعنويات، إلى التسكال الفرعية على مستوى الجانب لتعزيز الأداء المقابل. النتائج التجريبية على ثلاثة مجموعات بيانات معيار توضح فعالية وتفوق نهجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا