غالبا ما تكون أنظمة المحادثة الموجودة في معظمها، مما يفترض أن تصطب المستخدمين سيتبعون عن كثب نظام ontology. ومع ذلك، في سيناريوهات العالم الواقعي، من المستحسن للغاية أن يستخدم المستخدمون التحدث بحرية وبطبيعة الحال. في هذا العمل، نحاول بناء نظام حوار تركز على المستخدمين لتوصية المحادثة. نظرا لعدم وجود رسم خرائط نظيفة لنكل النموذج المجاني للمستخدم لعلاج الأطباق، فإننا نقوم أولا بنموذج تفضيلات المستخدمين كتوزيعات مقدرة على نظام OnTology ونصوص المستخدمين على هذه التوزيعات. إن تعلم مثل هذه الرسوم الخرائط يشكل تحديات جديدة على التفكير في أنواع مختلفة من المعرفة، بدءا من المعرفة العفاهية، ومعرفة المنطقية لحالات المستخدمين الخاصة. تحقيقا لهذه الغاية، نبني مجموعة بيانات جديدة تسمى الدقيقة التي تركز على هذه الإعدادات الواقعية، مع حوارات 5.1k، تتحول 26 ألفا إلى ردود المستخدم عالية الجودة. نقوم بإجراء تجارب، مما يدل على حد سواء فائدة وتحديات إعداد مشكلتنا. نعتقد أن الدقة يمكن أن يكون بمثابة مورد قيمة لدفع الأبحاث الحالية من النظام المركزي للعميل إلى النظام المركزي للمستخدم. الرمز والبيانات متاح علنا.
Existing conversational systems are mostly agent-centric, which assumes the user utterances will closely follow the system ontology. However, in real-world scenarios, it is highly desirable that users can speak freely and naturally. In this work, we attempt to build a user-centric dialogue system for conversational recommendation. As there is no clean mapping for a user's free form utterance to an ontology, we first model the user preferences as estimated distributions over the system ontology and map the user's utterances to such distributions. Learning such a mapping poses new challenges on reasoning over various types of knowledge, ranging from factoid knowledge, commonsense knowledge to the users' own situations. To this end, we build a new dataset named NUANCED that focuses on such realistic settings, with 5.1k dialogues, 26k turns of high-quality user responses. We conduct experiments, showing both the usefulness and challenges of our problem setting. We believe NUANCED can serve as a valuable resource to push existing research from the agent-centric system to the user-centric system. The code and data are publicly available.
المراجع المستخدمة
https://aclanthology.org/
التعليق التوضيحي المعرفي العالمي (UCCA) هو مخطط توضيحي دلالي ينظم النصوص في هيكل الوسائد الخشن، مما يوفر تغطية واسعة من الظواهر الدلالية.في الوقت نفسه، لا تزال هناك حاجة إلى علاج محمظ من العديد من الفئات.فئة الإعلان ذات أهمية خاصة، حيث تغطي مجموعة وا
المواد الحيوية هي المواد الاصطناعية أو الطبيعية المستخدمة لبناء الأعضاء الاصطناعية، أو تصنيع الأطراف الاصطناعية، أو استبدال الأنسجة. شهد القرن الماضي تطور الآلاف من المواد الحيوية الجديدة، ونتيجة لذلك، زيادة أسية في المنشورات العلمية في هذا المجال. ي
يعد Growdsourcing من غير الخبراء أحد أكثر الطرق شيوعا لجمع البيانات والشروح في NLP. على الرغم من أن هذه الأداة الأساسية في NLP، إلا أن استخدام الجماعة الجماعية يسترشد إلى حد كبير بالممارسات المشتركة والخبرة الشخصية للباحثين. يظل تطوير نظرية الاستخدام
يمكن أن تلعب الموارد الحسابية مثل سورانيا المشروح الدولى دورا مهما في تمكين المتحدثين لغات الأقليات الأصلية للمشاركة في الحكومة والتعليم ومجالات الحياة العامة في لغتهم العامة.ومع ذلك، فإن العديد من اللغات - بشكل رئيسي أولئك الذين لديهم سكان متكلمون أ
يمكن أن أنظمة البحث عن المحادثة الناجحة تجربة تسوق طبيعية وتكيفية وتفاعلية لعملاء التسوق عبر الإنترنت. ومع ذلك، فإن بناء هذه الأنظمة من الصفر تواجه تحديات الكلمة الحقيقية من كل من مخطط المنتج / المعرفة غير الصحيحة ونقص بيانات حوار التدريب. في هذا الع