تعد القدرة على اتخاذها بطريقة بطلاقة (أي تأخير طويل للاستجابة أو الانقطاعات المتكررة) جوانب أساسية من أي نظام حوار منطوق.ومع ذلك، فإن خدمات التعرف على الكلام العملي تحفز عادة تأخير استجابة طويل، حيث يستغرق الأمر وقتا قبل معالجة كلام المستخدم.هناك قدر كبير من الأبحاث التي تشير إلى أن البشر يحققون أوقات الاستجابة السريعة من خلال إظهار ما سيقوله المحاور ويقدر إكمال الدورات المقبلة.في هذا العمل، نقوم بتنفيذ هذه الآلية في نظام حوار منطوق تدريجي، باستخدام نموذج لغة يولد العقود المستقبلية المحتملة لمشروع نقاط الإنجاز القادمة.من الناحية النظرية، قد يجعل هذا النظام أكثر استجابة، في حين لا يزال الوصول إلى المعلومات الدلالية التي لم تتم معالجتها بعد بواسطة التعرف على الكلام.نقوم بإجراء دراسة صغيرة تشير إلى أن هذا نهج قابل للحياة لأنظمة الحوار العملية، وأن هذا اتجاه واعد للبحث في المستقبل.
The ability to take turns in a fluent way (i.e., without long response delays or frequent interruptions) is a fundamental aspect of any spoken dialog system. However, practical speech recognition services typically induce a long response delay, as it takes time before the processing of the user's utterance is complete. There is a considerable amount of research indicating that humans achieve fast response times by projecting what the interlocutor will say and estimating upcoming turn completions. In this work, we implement this mechanism in an incremental spoken dialog system, by using a language model that generates possible futures to project upcoming completion points. In theory, this could make the system more responsive, while still having access to semantic information not yet processed by the speech recognizer. We conduct a small study which indicates that this is a viable approach for practical dialog systems, and that this is a promising direction for future research.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقول أن أنظمة الحوار قادرة على شرح قراراتها بنشاط يمكنها الاستفادة من المنطق المعني.نحن نحفز سبب هذه الاستراتيجية المناسبة ودمجها ضمن إطار مدير الحوار المؤخري الخاص بنا على أساس المنطق الخطي.على وجه الخصوص، يتيح ذلك نظام الحوار تقديم إ
فهم اللغة المنطوقة، عادة بما في ذلك اكتشاف النوايا وملء الفتحات، هو مكون أساسي لبناء نظام حوار منطوق. تظهر الأبحاث الحديثة نتائج واعدة من خلال التعلم المشترك بين هذين المهامتين بناء على حقيقة أن ملء الفتحة والكشف عن النوايا تشارك المعرفة الدلالية. عل
يقتصر معظم العمل المسبق على أنظمة الحوار الموجهة نحو المهام على دعم واجهات برمجة التطبيقات في المجال.ومع ذلك، قد يكون لدى المستخدمين طلبات خارج نطاق واجهات برمجة التطبيقات هذه.يركز هذا العمل على تحديد طلبات المستخدمين هذه.تعتمد الطرق الحالية لهذه الم
تقترح هذه الورقة تصنيفا من الأخطاء في أنظمة الحوار الموجهة للدردشة.سابقا، تم اقتراح اختصاصين؛واحد هو النظرية مدفوعة والبيانات الأخرى مدفوعة.السابق يعاني من حقيقة أن نظريات الحوار للمحادثة البشرية غالبا ما تكون مناسبة لتصنيف الأخطاء التي قدمها أنظمة ا
تعلم أنظمة الحوار الموجهة نحو المهمة الحديثة نموذجا من الحوارات المشروح، وتحول هذه الحوارات بدورها يتم جمعها وتفاحها بحيث تكون متسقة مع معرفة مجال معينة. ومع ذلك، في السيناريوهات الحقيقية، تخضع معارف المجال للتغييرات المتكررة، وقد تصبح حوارات التدريب