للمساعدين الصوتيين مثل Alexa ومساعد Google و SIRI ويزويف نوايا المستخدمين بشكل صحيح أهمية قصوى.ومع ذلك، يعاني المستخدمون في بعض الأحيان الاحتكاك مع هؤلاء المساعدين، بسبب الأخطاء من مكونات النظام المختلفة أو أخطاء المستخدمين مثل زلات اللسان.يميل المستخدمون إلى إعادة صياغة استفساراتهم حتى يحصلون على استجابة مرضية.يستخدم الكشف عن صياغة إعادة صياغة لتحديد إعادة التسلياع وتم التعامل معها منذ فترة طويلة كمهمة مع مدخلات الزوجية، والتي لا تستخدم بالكامل المعلومات السياقية (E.G. المستخدمين الضمنية).تحقيقا لهذه الغاية، نقترح نموذج اكتشاف صياغة صياغة حديثة لتحديد إعادة التسليح تلقائيا من الحوارات متعددة الدوران.نعرض كيفية الاستفادة من سياق الحوار وإشارات التفاعل وكيل المستخدم، بما في ذلك ملاحظات المستخدم الضمنية والفجوة الزمنية بين المنعطفات المختلفة، والتي يمكن أن تساعد بشكل كبير بشكل كبير في نماذج الكشف عن إعادة صياغة الزوجية.
For voice assistants like Alexa, Google Assistant, and Siri, correctly interpreting users' intentions is of utmost importance. However, users sometimes experience friction with these assistants, caused by errors from different system components or user errors such as slips of the tongue. Users tend to rephrase their queries until they get a satisfactory response. Rephrase detection is used to identify the rephrases and has long been treated as a task with pairwise input, which does not fully utilize the contextual information (e.g. users' implicit feedback). To this end, we propose a contextual rephrase detection model ContReph to automatically identify rephrases from multi-turn dialogues. We showcase how to leverage the dialogue context and user-agent interaction signals, including the user's implicit feedback and the time gap between different turns, which can help significantly outperform the pairwise rephrase detection models.
المراجع المستخدمة
https://aclanthology.org/
يعد عدم وجود بيانات تدريبية المسمى للميزات الجديدة مشكلة شائعة في أنظمة الحوار في العالم الحقيقي المتغيرة بسرعة.كحل، نقترح نموذج توليد إعادة صياغة متعددة اللغات يمكن استخدامه لإنشاء كلمات جديدة للميزة المستهدفة واللغة المستهدفة.يمكن استخدام الكلام ال
تعلم أنظمة الحوار الموجهة نحو المهمة الحديثة نموذجا من الحوارات المشروح، وتحول هذه الحوارات بدورها يتم جمعها وتفاحها بحيث تكون متسقة مع معرفة مجال معينة. ومع ذلك، في السيناريوهات الحقيقية، تخضع معارف المجال للتغييرات المتكررة، وقد تصبح حوارات التدريب
يقتصر معظم العمل المسبق على أنظمة الحوار الموجهة نحو المهام على دعم واجهات برمجة التطبيقات في المجال.ومع ذلك، قد يكون لدى المستخدمين طلبات خارج نطاق واجهات برمجة التطبيقات هذه.يركز هذا العمل على تحديد طلبات المستخدمين هذه.تعتمد الطرق الحالية لهذه الم
تعد القدرة على اتخاذها بطريقة بطلاقة (أي تأخير طويل للاستجابة أو الانقطاعات المتكررة) جوانب أساسية من أي نظام حوار منطوق.ومع ذلك، فإن خدمات التعرف على الكلام العملي تحفز عادة تأخير استجابة طويل، حيث يستغرق الأمر وقتا قبل معالجة كلام المستخدم.هناك قدر
إن تحديد المعرفة ذات الصلة التي سيتم استخدامها في أنظمة المحادثة التي تستند إلى وثائق طويلة أمر بالغ الأهمية لتوليد الاستجابة الفعال.نقدم نموذج تعريف المعرفة الذي يرفع بنية المستند إلى توفير ترميزات مرور محكوم بحري للحوار ومعرفة تحديد المواقع ذات الص