تقترح هذه الورقة تصنيفا من الأخطاء في أنظمة الحوار الموجهة للدردشة.سابقا، تم اقتراح اختصاصين؛واحد هو النظرية مدفوعة والبيانات الأخرى مدفوعة.السابق يعاني من حقيقة أن نظريات الحوار للمحادثة البشرية غالبا ما تكون مناسبة لتصنيف الأخطاء التي قدمها أنظمة الحوار الموجهة نحو الدردشة.هذا الأخير لديه قيود في أنه لا يمكن إلا أن يتعامل مع أخطاء النظم التي لدينا بيانات.تدمج هذه الورقة هذين تصنيفين لخلق تصنيف شامل للأخطاء في أنظمة الحوار الموجهة نحو الدردشة.وجدنا أنه، مع تصنيفنا المتكامل لدينا، يمكن تفاح أخطاء بشكل موثوق بموثوقية مع KAPPA أعلى من Fleiss 'Kappa مقارنة بالتصنيف المقترح سابقا.
This paper proposes a taxonomy of errors in chat-oriented dialogue systems. Previously, two taxonomies were proposed; one is theory-driven and the other data-driven. The former suffers from the fact that dialogue theories for human conversation are often not appropriate for categorizing errors made by chat-oriented dialogue systems. The latter has limitations in that it can only cope with errors of systems for which we have data. This paper integrates these two taxonomies to create a comprehensive taxonomy of errors in chat-oriented dialogue systems. We found that, with our integrated taxonomy, errors can be reliably annotated with a higher Fleiss' kappa compared with the previously proposed taxonomies.
المراجع المستخدمة
https://aclanthology.org/
تعلم أنظمة الحوار الموجهة نحو المهمة الحديثة نموذجا من الحوارات المشروح، وتحول هذه الحوارات بدورها يتم جمعها وتفاحها بحيث تكون متسقة مع معرفة مجال معينة. ومع ذلك، في السيناريوهات الحقيقية، تخضع معارف المجال للتغييرات المتكررة، وقد تصبح حوارات التدريب
يسمح التعلم المستمر في أنظمة الحوار الموجهة نحو المهام للنظام بإضافة مجالات ووظائف جديدة للعمل الإضافي بعد النشر، دون تكبد التكلفة العالية لإعادة النظر في النظام بأكمله في كل مرة. في هذه الورقة، نقترح أول معيار تعلم مستمر على الإطلاق لأنظمة الحوار ال
يتطلب تحسين سياسة الحوار عبر التعلم التعزيز عددا كبيرا من التفاعلات التدريبية، مما يجعل التعلم مع المستخدمين الحقيقيين الوقت المستهلكة ومكلفة. لذلك يعتمد العديد من الإعدادات على محاكاة المستخدم بدلا من البشر. لدى محاكاة المستخدم هذه مشاكلهم الخاصة. ف
في أنظمة الحوار الموجهة نحو الأهداف، يقدم المستخدمون المعلومات من خلال قيم الفتحة لتحقيق أهداف محددة. عمليا، يمكن أن تكون بعض مجموعات قيم الفتحة غير صالحة وفقا للمعرفة الخارجية. على سبيل المثال، مزيج من بيتزا الجبن "(عنصر القائمة) وملفات تعريف الارتب
تهدف هذه الورقة إلى تقديم نظرة عامة شاملة للتطورات الأخيرة في تتبع حكمة الحوار (DST) لأنظمة المحادثات الموجهة نحو المهام.نقدم المهمة، وخاصة البيانات الرئيسية التي تم استغلالها وكذلك مقاييس تقييمها، ونحن نحلل العديد من النهج المقترحة.نحن نميز بين نماذ