يحتوي الحوار البشري على مفاهيم متطورة، ومكبرات الصوت تربط بشكل طبيعي مفاهيم متعددة لإثبات استجابة.ومع ذلك، فإن طرازات الحوار الحالية مع إطار SEQ2SEQ تفتقر إلى القدرة على إدارة مفهوم المفهوم بفعالية ويمكن أن تعد بالكاد مفاهيم متعددة للردود بطريقة فك التشفير المتسلسلة.لتسهيل حوار قابل للتحكم ومتماسك، في هذا العمل، نركض نموذجا غير مرشد من المفاهيم (CG-NAR) لتوليد الحوار مفتوح المجال.يشتمل النموذج المقترح على وحدة تخطيط متعددة المفاهيم يتعلم تحديد مفاهيم متعددة مرتبطة من الرسم البياني للمفهوم ومحول الإدراج المخصص يؤدي جيل غير توجيهي من المفاهيم إلى إكمال استجابة.تظهر النتائج التجريبية على مجموعة بيانات عامة أن CG-NAR يمكن أن ينتج استجابات متنوعة ومتماسكة، مما يتفوق على خطوط خطوط خطوط أساسية في كل من التقييمات التلقائية والإنسانية مع سرعة الاستدلال بشكل كبير.
Human dialogue contains evolving concepts, and speakers naturally associate multiple concepts to compose a response. However, current dialogue models with the seq2seq framework lack the ability to effectively manage concept transitions and can hardly introduce multiple concepts to responses in a sequential decoding manner. To facilitate a controllable and coherent dialogue, in this work, we devise a concept-guided non-autoregressive model (CG-nAR) for open-domain dialogue generation. The proposed model comprises a multi-concept planning module that learns to identify multiple associated concepts from a concept graph and a customized Insertion Transformer that performs concept-guided non-autoregressive generation to complete a response. The experimental results on two public datasets show that CG-nAR can produce diverse and coherent responses, outperforming state-of-the-art baselines in both automatic and human evaluations with substantially faster inference speed.
المراجع المستخدمة
https://aclanthology.org/
البحث في أنظمة الحوار مفتوح المجال التي تسمح بمواضيع مجانية صعبة في مجال معالجة اللغات الطبيعية (NLP). تم تحسين أداء نظام الحوار مؤخرا من خلال الطريقة التي تستخدم المعرفة المتعلقة بالحوار؛ ومع ذلك، فإن أنظمة الحوار غير الإنجليزية تعاني من إعادة إنتاج
على الرغم من تحقيق أداء ملحوظ، عادة ما تستخدم أعمال المعرفة المعززة بالمعرفة عادة قاعدة معرفة متجانسة واحدة متجانسة من تغطية المعرفة المحدودة. وبالتالي، فإنهم غالبا ما ينضون في الأساليب التقليدية لأنه لا يمكن ربط جميع الحوارات بإدخالات المعرفة. تقترح
تزايد نماذج اللغة المدربة مسبقا للمحولات أداء أنظمة حوار المجال المفتوح. Works Prefer Works Simply القائمة على تحويلات قائمة مدربة مسبقا لتوليد النصوص ذات السمات المرغوبة في نهجين عامين: (1) الأساليب القائمة على التدرج: تحديث جميع التمثيلات الكامنة ل
إن دمج مصادر المعرفة الخارجية بفعالية في المحادثات هي مشكلة طويلة الأمد في أبحاث الحوار مفتوح المجال. إن الأدبيات الموجودة على اختيار المعرفة المفتوحة للمجال محدود ويقتصر بعض الافتراضات الهشة على مصادر المعرفة لتبسيط المهمة الشاملة، مثل وجود عقوبة مع
لقد أثبت العمل الحديث في وكلاء المحادثة المفتوحة على أن التحسينات الكبيرة في الإنسانية وتفضيل المستخدم يمكن تحقيقها عبر التحجيم الضخم في كل من بيانات التدريب المسبق وحجم النموذج (Adiwardana et al.، 2020؛ الأسطوانة وآخرون، 2020). ومع ذلك، إذا كنا نريد