يعد تطوير آليات تكييف أنظمة الحوار المرنة للمهام والمجالات غير المرئية تحديا كبيرا في أبحاث الحوار.تحفظ النماذج العصبية ضمنيا سياسات الحوار الخاصة بمهام المهام من بيانات التدريب.نؤخر أن هذه الحفظ الضمنية قد حظرت التعلم تحويل الصفر بالرصاص.تحقيقا لهذه الغاية، نستفيد من النموذج الموجه المخطط، حيث يتم توفير سياسة الحوار الخاصة بمهام المهام بشكل صريح للنموذج.نقدم نموذج اهتمام المخطط (SAM) وتحسين تمثيلات المخطط للحصول على ستار كوربوس.يحصل SAM على تحسين كبير في إعدادات طلقة صفرية، مع تحسن درجة +22 F1 على العمل السابق.هذه النتائج التحقق من صحة جدوى عملية التعميم الصفري في مربع الحوار.يتم أيضا تقديم تجارب الاجتثاث لإظهار فعالية SAM.
Developing mechanisms that flexibly adapt dialog systems to unseen tasks and domains is a major challenge in dialog research. Neural models implicitly memorize task-specific dialog policies from the training data. We posit that this implicit memorization has precluded zero-shot transfer learning. To this end, we leverage the schema-guided paradigm, wherein the task-specific dialog policy is explicitly provided to the model. We introduce the Schema Attention Model (SAM) and improved schema representations for the STAR corpus. SAM obtains significant improvement in zero-shot settings, with a +22 F1 score improvement over prior work. These results validate the feasibility of zero-shot generalizability in dialog. Ablation experiments are also presented to demonstrate the efficacy of SAM.
المراجع المستخدمة
https://aclanthology.org/
تركز توليد اللغة الطبيعية (NLG) لأنظمة الحوار الموجهة نحو المهام على توصيل محتوى معين بدقة، بطلاقة، وتطافق. في حين أن هذه السمات أمر حاسم للحوار الناجح، فمن المستحسن أيضا تحقيق أهداف أسلوبية محددة في وقت واحد، مثل طول الاستجابة، وجهة النظر، وصفي، وال
تم إثبات المشفرات المستندة إلى المحولات المسبدة مسبقا مثل بيرت لتحقيق الأداء الحديث في العديد من مهام NLP العديدة. على الرغم من نجاحهم، فإن ترميز نمط بيرت كبير الحجم ولديها زمن بيانات عالية أثناء الاستدلال (خاصة في آلات وحدة المعالجة المركزية) مما يج
يمكن للبشر التمييز بين فئات جديدة بكفاءة للغاية مع عدد قليل من الأمثلة، إلى حد كبير بسبب حقيقة أن البشر يمكنهم الاستفادة من المعرفة التي تم الحصول عليها من المهام ذات الصلة.ومع ذلك، يميل نموذج تصنيف النص في التعلم العميق إلى الكفاح لتحقيق أداء مرض عن
تمكننا تتبع حالة الحوار عبر المجال الصفرية (DST) من التعامل مع المجالات غير المرئية دون حساب جمع البيانات داخل المجال.في هذه الورقة، نقترح وصفات فتحة معززة النهج الإداري المعزز ل DST الصفرية عبر DST.على وجه التحديد، يقوم نموذجنا أولا بتشميز سياق الحو
إلى جانب توفر مجموعات بيانات واسعة النطاق، مكنت هياكل التعلم العميق التقدم السريع في مهمة الإجابة على السؤال.ومع ذلك، فإن معظم مجموعات البيانات هذه باللغة الإنجليزية، وأدائيات النماذج متعددة اللغات الحديثة أقل بكثير عند تقييمها على البيانات غير الإنج