ترغب بنشر مسار تعليمي؟ اضغط هنا

قرار الضمير exophoric في الحوارات مع تنظيم موضوع

Exophoric Pronoun Resolution in Dialogues with Topic Regularization

101   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

منذ فترة طويلة تم حل الضمائر إلى مراحلها كمشكلة فهم لغة طبيعية أساسية.تعمل سابقا على قرار الضمير (PCR) في الغالب على حل الضمائر للإشارة في النص أثناء تجاهل السيناريو الإيفهور.الضمائر Exophoric شائعة في الاتصالات اليومية، حيث قد يستخدم المتحدثون بشكل مباشر الضمائر للإشارة إلى بعض الكائنات الموجودة في البيئة دون إدخال الكائنات أولا.على الرغم من عدم ذكر هذه الكائنات في نص الحوار، إلا أنها غالبا ما يتم ترحيلها من قبل الموضوعات العامة للحوار.بدافع من ذلك، نقترح الاستفادة بشكل مشترك السياق المحلي والمواضيع العالمية للحوارات لحل مشكلة PCR خارج النص.توضح تجارب واسعة فعالية إضافة موضوع تنظيم الموضوع لحل الضمائر الإيفولية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

ساهمت نماذج اللغة الملثمين (MLMS) في تحسينات أداء جذرية فيما يتعلق بدقة anaphora الصفر (ZAR).لتعزيز هذا النهج، في هذه الدراسة، قدمنا مقترحين.الأول هو مهمة محتملة جديدة تدرب MLMS على علاقات الاستعمارية مع الإشراف الصريح، والاقتراح الثاني هو طريقة أصلي ة جديدة ستصطدم بمسألة سيئة السمعة، والتناقض في التباين المؤمنأظهرت تجاربنا على ZAR اليابانية أن مقترحنا تعزز الأداء الحديثة، وتحليلنا التفصيلي يوفر رؤى جديدة حول التحديات المتبقية.
من المعروف أن مهام توليد اللغة الطبيعية (NLG) على اللغات المؤيدة للإسقاط تعاني من مشاكل ضمير Zero (ZP)، وتظل المشكلات تحديا بسبب ندرة NLG Corpora المشروح من ZP.في هذه الحالة، نقترح نهجا للغاية على مرحلتين على مرحلتين للغاية على نمذجة السياق الزوجي مع استعادة ZP لتخفيف مشكلة ZP في مهام NLG.وخاصة، نحن نؤيد عملية الاسترداد في أزياء تحت إشراف المهمة حيث يتم تعلم إمكانية استعادة تمثيل ZP أثناء عملية تعلم المهام NLG، وبالتالي فإن طريقتنا لا تتطلب مشروحة NLG Corpora مع ZPS.بالنسبة لتعزيز النظام، نتعلم بوت عدوى لضبط مخرجاتنا النموذجية لتخفيف انتشار الخطأ الناجم عن نظام ZPS المسترد.تظهر التجارب في ثلاثة مهام NLG على مستوى الوثيقة، أي الترجمة الآلية، الإجابة على الأسئلة، والتلخيص، أن نهجنا يمكن أن يحسن الأداء إلى حد كبير، وتحسين الترجمة الضميرة مثيرة للإعجاب للغاية.
تجزئة موضوع الحوار أمر بالغ الأهمية في العديد من مشاكل نموذج الحوار.ومع ذلك، فإن النهج الشائعة غير المعينة الشائعة لاستغلال الميزات السطحية فقط في تقييم التماسك الموضعي بين الكلام.في هذا العمل، نتعامل مع هذا القيد من خلال الاستفادة من الإشارات الإشرا فية من مهمة التسجيل في اتساق زوج الكلام.أولا، نقدم استراتيجية بسيطة ولكنها فعالة لتوليد كوربوس التدريب لتسجيلات التماسك زوج الكلام.بعد ذلك، ندرب نموذج متماسك نطق برت مقره برت مع Corpus التدريب الذي تم الحصول عليه.أخيرا، يتم استخدام هذا النموذج لقياس الملاءمة الموضعية بين الكلام، والتصرف كأساس لاستدلال التجزئة.تجارب على ثلاث مجموعات بيانات عامة باللغة الإنجليزية والصينية توضح أن اقتراحنا يتفوق على خطوط الأساس الحديثة.
تعتمد تمثيلات إعادة ربط متعددة اللغات عموما على خوارزميات تجزئة الكلمات الفرعية لإنشاء مفردات مشتركة متعددة اللغات. ومع ذلك، غالبا ما تؤدي خوارزميات المثيرة العادية في كثير من الأحيان إلى تجزئة فرعية مثالية، خاصة للغات ذات كميات محدودة من البيانات. ف ي هذه الورقة، نأخذ خطوتين رئيسيتين نحو تخفيف هذه المشكلة. أولا، نوضح تجريبيا أن تطبيق طرق تنظيم الكلمات الفرعية الحالية (KUDO، 2018؛ ProviLkov et al.، 2020)، 2020) أثناء ضبط التوصيلات المتعددة اللغات المدربة مسبقا يحسن فعالية التحويل عبر اللغات. ثانيا، للاستفادة الكاملة من مختلف تجزئة المدخلات المحتملة، نقترح تنظيم الكلمات الفرعية المتعددة للنظر (MVR)، وهي طريقة تطبق تناسق التنبؤ بين استخدام المدخلات التي يتم تخصيصها من خلال تجزئة المعيار والاحتمالية. النتائج على مرجع Xtreme متعدد اللغات (هو وآخرون، 2020) تظهر أن MVR يجلب تحسينات ثابتة تصل إلى 2.5 نقطة باستخدام خوارزميات تجزئة قياسية.
لا يزال التقييم التلقائي للحوارات المفتوحة للحوالات تحديا ملحوظا إلى حد كبير.على الرغم من وفرة العمل المنجز في هذا المجال، يتعين على القضاة البشري تقييم جودة الحوارات.نتيجة لذلك، يؤدي أداء هذه التقييمات على نطاق واسع مكلفة.يحقق هذا العمل في استخدام ن موذج تعليمي عميق مدرب على التقييم التقييم في اللغة العامة (الغراء) بمثابة إشارة عالية الجودة للحوارات المفتوحة للنطاق.الهدف من ذلك هو استخدام مهام الغراء المختلفة كوجهات نظر مختلفة بشأن الحكم على جودة المحادثة، وبالتالي تقليل الحاجة إلى بيانات تدريبية إضافية أو ردود تعمل بمثابة مراجع جودة.نظرا لهذه الطبيعة، يمكن للطريقة استنتاج مختلف مقاييس الجودة ويمكن أن تستمد النتيجة الإجمالية القائمة على المكونات.نحن نحقق معاملات الارتباط ذات دلالة إحصائية تصل إلى 0.7.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا