استخراج العلاقات الإشراف على نطاق واسع يستخدم على نطاق واسع في بناء قواعد المعرفة بسبب كفاءته العالية.ومع ذلك، فإن الحالات التي تم الحصول عليها تلقائيا ذات جودة منخفضة مع العديد من الكلمات غير ذات الصلة.بالإضافة إلى ذلك، يؤدي الافتراض القوي للإشراف البعيد إلى وجود جمل صاخبة في أكياس الجملة.في هذه الورقة، نقترح شبكة مراجعة متعددة الطبقات رواية (MLRN) التي تخفف من آثار ضوضاء مستوى الكلمات من خلال التأكيد على علاقات الجملة الداخلية قبل استخراج المعلومات ذات الصلة داخل الجمل.بعد ذلك، نركز طريقة تعليمية متعددة الاستخدامات متعددة الاستخدامات ومقاومة للضوضاء مقاومة للضوضاء لتصفية الجمل الصاخبة وكذلك تعيين الأوزان المناسبة إلى تلك ذات الصلة.تجارب واسعة على مجموعة بيانات اثنين نيويورك تايمز (NYT) تثبت أن نهجنا يحقق تحسينات كبيرة على الأساس.
Distantly supervised relation extraction is widely used in the construction of knowledge bases due to its high efficiency. However, the automatically obtained instances are of low quality with numerous irrelevant words. In addition, the strong assumption of distant supervision leads to the existence of noisy sentences in the sentence bags. In this paper, we propose a novel Multi-Layer Revision Network (MLRN) which alleviates the effects of word-level noise by emphasizing inner-sentence correlations before extracting relevant information within sentences. Then, we devise a balanced and noise-resistant Confidence-based Multi-Instance Learning (CMIL) method to filter out noisy sentences as well as assign proper weights to relevant ones. Extensive experiments on two New York Times (NYT) datasets demonstrate that our approach achieves significant improvements over the baselines.
المراجع المستخدمة
https://aclanthology.org/
نقترح نهجا متعدد المهام، وهو نهج احتمالي لتسهيل استخراج العلاقات بالإشراف المستمر عن طريق إحضار أوثق تمثيل الجمل التي تحتوي على نفس أزواج قاعدة المعرفة.لتحقيق ذلك، نحن نحيز المساحة الكامنة من الجمل عبر السيارات الآلية (VAE) التي يتم تدريبها بشكل مشتر
النماذج الخاضعة للإشراف المستمرة تحظى بشعبية كبيرة بالنسبة لاستخراج العلاقة لأنه يمكننا الحصول على كمية كبيرة من البيانات التدريبية باستخدام طريقة الإشراف البعيدة دون شرح بشري.في الإشراف البعيد، تعتبر الجملة بمثابة مصدر Tuple إذا كانت الجملة تحتوي عل
في استخراج العلاقة، يستخدم الإشراف البعيد على نطاق واسع لتسمية مجموعة بيانات تدريبية واسعة النطاق عن طريق محاذاة قاعدة المعرفة بالنص غير منظم. افترضت أن معظم الدراسات الموجودة في هذا المجال هناك قدر كبير من النص المركزي غير منظم. ومع ذلك، في الممارسة
لتخفيف الجهود البشرية من الحصول على شروح واسعة النطاق، تهدف أساليب استخراج العلاقات شبه الإشراف إلى الاستفادة من البيانات غير المسبقة بالإضافة إلى التعلم من عينات محدودة. تعاني أساليب التدريب الذاتي الحالية من مشكلة الانجراف التدريجي، حيث يتم دمج تسم
ينطوي تحليل المعنويات المستندة إلى جانب الجسیلاء بشكل أساسي على ثلاث مجموعات فرعية: استخراج الأجل في الجانب، واستخراج الأجل رأي، وتصنيف المعنويات على مستوى الجانب، والذي يتم التعامل معه عادة بطريقة منفصلة أو مشتركة. ومع ذلك، فإن النهج السابقة لا تستغ