نقدم إطار جيل الحوار الاصطناعي، Velocidapter، الذي يعالج مشكلة توافر Corpus لفهم الحوار. DEVERSITS VELOCIDAPTER DEDASTS من خلال محاكاة المحادثات الاصطناعية مجال حوار موجه نحو المهام، تتطلب كمية صغيرة من أعمال Bootstrapping لكل مجال جديد. نحن نقيم فعالية إطار عملنا على DataSet من فهم الحوار الموجهة نحو المهام، MRCWOZ، الذي نحرشه من خلال التخلص من الأسئلة للحصول على فتحات في المطعم وسيارات الأجرة ومجالات الفنادق من مجموعة بيانات MultiWoz 2.2 (Zang et al.، 2020). نحن ندير تجارب ضمن إعداد موارد منخفضة، حيث نقعمنا نموذجا على الفريق، قم بضبطها على بيانات أصلية صغيرة أو على البيانات الاصطناعية الناتجة عن طريق الإطار الخاص بنا. يظهر VeloCidapter تحسينات كبيرة في استخدام Bertbase والمادة المستندة إلى المحولات كطرازات أساسية. نظل كذلك أن الإطار سهل الاستخدام من قبل مستخدمي المبتدئين واختتموا أن Velocidaper يمكن أن يساعد بشكل كبير في التدريب على الحوارات الموجهة نحو المهام، خاصة بالنسبة لمجالات الناشئة المنخفضة الموارد.
We introduce a synthetic dialogue generation framework, Velocidapter, which addresses the corpus availability problem for dialogue comprehension. Velocidapter augments datasets by simulating synthetic conversations for a task-oriented dialogue domain, requiring a small amount of bootstrapping work for each new domain. We evaluate the efficacy of our framework on a task-oriented dialogue comprehension dataset, MRCWOZ, which we curate by annotating questions for slots in the restaurant, taxi, and hotel domains of the MultiWOZ 2.2 dataset (Zang et al., 2020). We run experiments within a low-resource setting, where we pretrain a model on SQuAD, fine-tuning it on either a small original data or on the synthetic data generated by our framework. Velocidapter shows significant improvements using both the transformer-based BERTBase and BiDAF as base models. We further show that the framework is easy to use by novice users and conclude that Velocidapter can greatly help training over task-oriented dialogues, especially for low-resourced emerging domains.
المراجع المستخدمة
https://aclanthology.org/
تعلم أنظمة الحوار الموجهة نحو المهمة الحديثة نموذجا من الحوارات المشروح، وتحول هذه الحوارات بدورها يتم جمعها وتفاحها بحيث تكون متسقة مع معرفة مجال معينة. ومع ذلك، في السيناريوهات الحقيقية، تخضع معارف المجال للتغييرات المتكررة، وقد تصبح حوارات التدريب
يتطلب تحسين سياسة الحوار عبر التعلم التعزيز عددا كبيرا من التفاعلات التدريبية، مما يجعل التعلم مع المستخدمين الحقيقيين الوقت المستهلكة ومكلفة. لذلك يعتمد العديد من الإعدادات على محاكاة المستخدم بدلا من البشر. لدى محاكاة المستخدم هذه مشاكلهم الخاصة. ف
فهم اللغة المنطوقة، عادة بما في ذلك اكتشاف النوايا وملء الفتحات، هو مكون أساسي لبناء نظام حوار منطوق. تظهر الأبحاث الحديثة نتائج واعدة من خلال التعلم المشترك بين هذين المهامتين بناء على حقيقة أن ملء الفتحة والكشف عن النوايا تشارك المعرفة الدلالية. عل
كان هناك تقدم كبير في أبحاث أنظمة الحوار.ومع ذلك، فإن أبحاث أنظمة الحوار في مجال الرعاية الصحية لا تزال في مهدها.في هذه الورقة، نقوم بتحليل الدراسات الحديثة ومخطط لها ثلاثة لبنات بناء نظام حوار موجه نحو المهام في مجال الرعاية الصحية: I) جمع البيانات
يمكن أن تساعد خوارزمية تجميع موثوقة للحوارات الموجهة نحو المهام في تحليل المطور وتحديد مهام الحوار بكفاءة.من الصعب مباشرة تطبيق خوارزميات تجميع النص العادي المسبق للحوارات الموجهة نحو المهام، بسبب الاختلافات الكامنة بينهما، مثل COMERELER، إغفال وتعبي