ساهمت نماذج اللغة الملثمين (MLMS) في تحسينات أداء جذرية فيما يتعلق بدقة anaphora الصفر (ZAR).لتعزيز هذا النهج، في هذه الدراسة، قدمنا مقترحين.الأول هو مهمة محتملة جديدة تدرب MLMS على علاقات الاستعمارية مع الإشراف الصريح، والاقتراح الثاني هو طريقة أصلية جديدة ستصطدم بمسألة سيئة السمعة، والتناقض في التباين المؤمنأظهرت تجاربنا على ZAR اليابانية أن مقترحنا تعزز الأداء الحديثة، وتحليلنا التفصيلي يوفر رؤى جديدة حول التحديات المتبقية.
Masked language models (MLMs) have contributed to drastic performance improvements with regard to zero anaphora resolution (ZAR). To further improve this approach, in this study, we made two proposals. The first is a new pretraining task that trains MLMs on anaphoric relations with explicit supervision, and the second proposal is a new finetuning method that remedies a notorious issue, the pretrain-finetune discrepancy. Our experiments on Japanese ZAR demonstrated that our two proposals boost the state-of-the-art performance, and our detailed analysis provides new insights on the remaining challenges.
المراجع المستخدمة
https://aclanthology.org/
منذ فترة طويلة تم حل الضمائر إلى مراحلها كمشكلة فهم لغة طبيعية أساسية.تعمل سابقا على قرار الضمير (PCR) في الغالب على حل الضمائر للإشارة في النص أثناء تجاهل السيناريو الإيفهور.الضمائر Exophoric شائعة في الاتصالات اليومية، حيث قد يستخدم المتحدثون بشكل
تحسنت أنسورية واحدة على أساس الأساس، والتي تحسنت بشكل كبير إلى الأساسي، في السنوات الأخيرة. لذلك بدأ الباحثون في إيلاء المزيد من الاهتمام لحالات أنشفورية أكثر تعقيدا مثل Anaphora غير المعقدة، كما هو الحال في Time-Warner يفكر في تحد قانوني لخطة اتصالا
بالنسبة للترجمة اليابانية إلى الإنجليزية، تشكل الضمائر الصفرية في اليابانية تحديا، نظرا لأن النموذج يحتاج إلى استنتاج النموذج وإنتاج الضمير المقابل في الجانب المستهدف من الجملة الإنجليزية.ومع ذلك، على الرغم من أن حل الضمائر الصفرية بالكامل غالبا ما ت
من المعروف أن مهام توليد اللغة الطبيعية (NLG) على اللغات المؤيدة للإسقاط تعاني من مشاكل ضمير Zero (ZP)، وتظل المشكلات تحديا بسبب ندرة NLG Corpora المشروح من ZP.في هذه الحالة، نقترح نهجا للغاية على مرحلتين على مرحلتين للغاية على نمذجة السياق الزوجي مع
الكيانات المتعلقة بالأحداث والأحداث في النص هي مكون رئيسي لفهم اللغة الطبيعية.دقة Coreference Coreference، على وجه الخصوص، أمر مهم بالنسبة للمصلحة المتزايدة بمهام تحليل المستندات متعددة الوثائق.في هذا العمل، نقترح نموذجا جديدا يمتد نموذج التنبؤ المتس