نقدم إطار جيل الحوار الاصطناعي، Velocidapter، الذي يعالج مشكلة توافر Corpus لفهم الحوار. DEVERSITS VELOCIDAPTER DEDASTS من خلال محاكاة المحادثات الاصطناعية مجال حوار موجه نحو المهام، تتطلب كمية صغيرة من أعمال Bootstrapping لكل مجال جديد. نحن نقيم فعالية إطار عملنا على DataSet من فهم الحوار الموجهة نحو المهام، MRCWOZ، الذي نحرشه من خلال التخلص من الأسئلة للحصول على فتحات في المطعم وسيارات الأجرة ومجالات الفنادق من مجموعة بيانات MultiWoz 2.2 (Zang et al.، 2020). نحن ندير تجارب ضمن إعداد موارد منخفضة، حيث نقعمنا نموذجا على الفريق، قم بضبطها على بيانات أصلية صغيرة أو على البيانات الاصطناعية الناتجة عن طريق الإطار الخاص بنا. يظهر VeloCidapter تحسينات كبيرة في استخدام Bertbase والمادة المستندة إلى المحولات كطرازات أساسية. نظل كذلك أن الإطار سهل الاستخدام من قبل مستخدمي المبتدئين واختتموا أن Velocidaper يمكن أن يساعد بشكل كبير في التدريب على الحوارات الموجهة نحو المهام، خاصة بالنسبة لمجالات الناشئة المنخفضة الموارد.
We introduce a synthetic dialogue generation framework, Velocidapter, which addresses the corpus availability problem for dialogue comprehension. Velocidapter augments datasets by simulating synthetic conversations for a task-oriented dialogue domain, requiring a small amount of bootstrapping work for each new domain. We evaluate the efficacy of our framework on a task-oriented dialogue comprehension dataset, MRCWOZ, which we curate by annotating questions for slots in the restaurant, taxi, and hotel domains of the MultiWOZ 2.2 dataset (Zang et al., 2020). We run experiments within a low-resource setting, where we pretrain a model on SQuAD, fine-tuning it on either a small original data or on the synthetic data generated by our framework. Velocidapter shows significant improvements using both the transformer-based BERTBase and BiDAF as base models. We further show that the framework is easy to use by novice users and conclude that Velocidapter can greatly help training over task-oriented dialogues, especially for low-resourced emerging domains.
References used
https://aclanthology.org/
Recent task-oriented dialogue systems learn a model from annotated dialogues, and such dialogues are in turn collected and annotated so that they are consistent with certain domain knowledge. However, in real scenarios, domain knowledge is subject to
Dialogue policy optimisation via reinforcement learning requires a large number of training interactions, which makes learning with real users time consuming and expensive. Many set-ups therefore rely on a user simulator instead of humans. These user
Spoken language understanding, usually including intent detection and slot filling, is a core component to build a spoken dialog system. Recent research shows promising results by jointly learning of those two tasks based on the fact that slot fillin
There has been significant progress in dialogue systems research. However, dialogue systems research in the healthcare domain is still in its infancy. In this paper, we analyse recent studies and outline three building blocks of a task-oriented dialo
A reliable clustering algorithm for task-oriented dialogues can help developer analysis and define dialogue tasks efficiently. It is challenging to directly apply prior normal text clustering algorithms for task-oriented dialogues, due to the inheren