ترغب بنشر مسار تعليمي؟ اضغط هنا

معالجة تغييرات قيمة الفتحة في أنظمة الحوار الموجهة نحو المهام من خلال التكيف مجال الحوار

Addressing Slot-Value Changes in Task-oriented Dialogue Systems through Dialogue Domain Adaptation

340   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعلم أنظمة الحوار الموجهة نحو المهمة الحديثة نموذجا من الحوارات المشروح، وتحول هذه الحوارات بدورها يتم جمعها وتفاحها بحيث تكون متسقة مع معرفة مجال معينة. ومع ذلك، في السيناريوهات الحقيقية، تخضع معارف المجال للتغييرات المتكررة، وقد تصبح حوارات التدريب الأولي قد تصبح عفا عليها الزمن، مما يؤدي إلى انخفاض كبير في الأداء النموذجي. في هذه الورقة، نحقق في العلاقة بين الحوارات التدريبية ومعرفة المجال، واقتراح تكيف مجال الحوار، وهي منهجية تهدف إلى تكييف حوارات التدريب الأولي للتغييرات تدخلت في معرفة المجال. نحن نركز على تغييرات قيمة الفتحة (على سبيل المثال، عندما تتوفر قيم فتحة جديدة لوصف كيانات المجال) وتحديد إعداد تجريبي لتتكيف مع نطاق الحوار. أولا، نوضح أن النماذج الحالية للحالة لتتبع حالة الحوار لا تزال قوية تقريبا للتغيرات ذات قيمة الفتحة لمعرفة المجال. بعد ذلك، نقارن استراتيجيات مختلفة التكيف عن نطاق التكيف، مما يدل على أن التقنيات البسيطة فعالة لتقليل الفجوة بين حوارات التدريب ومعرفة المجال.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يتطلب تحسين سياسة الحوار عبر التعلم التعزيز عددا كبيرا من التفاعلات التدريبية، مما يجعل التعلم مع المستخدمين الحقيقيين الوقت المستهلكة ومكلفة. لذلك يعتمد العديد من الإعدادات على محاكاة المستخدم بدلا من البشر. لدى محاكاة المستخدم هذه مشاكلهم الخاصة. ف ي حين أن محاكاة المستخدمين المشفرة باليد، فقد ثبت أن محاكاة المستخدمين الذين يعتمدون على القواعد كافية في المجالات الصغيرة والبسيطة، لأن عدد القواعد المعقدة بسرعة أصلي. لا تزال محاكاة المستخدم التي يحركها بيانات البيانات، من ناحية أخرى، تعتمد على المجال. هذا يعني أن التكيف مع كل مجال جديد يتطلب إعادة تصميم وإعادة التدريب. في هذا العمل، نقترح محاكاة للمستخدم المستقل المستقل للمجال (TUS). لا يتم ربط هيكل TUS مجال معين، وتمكين تعميم المجال وتعلم سلوك المستخدم عبر المجال من البيانات. نحن نقارن TUS مع أحدث التقيمات التلقائية وكذلك الإنسان. يمكن أن يتنافس TUS مع محاكاة المستخدمين المستند إلى القواعد على المجالات المحددة مسبقا ويمكن أن يعممون إلى المجالات غير المرئية في أزياء صفرية.
في أنظمة الحوار الموجهة نحو الأهداف، يقدم المستخدمون المعلومات من خلال قيم الفتحة لتحقيق أهداف محددة. عمليا، يمكن أن تكون بعض مجموعات قيم الفتحة غير صالحة وفقا للمعرفة الخارجية. على سبيل المثال، مزيج من بيتزا الجبن "(عنصر القائمة) وملفات تعريف الارتب اط OREO" (تتصدر) من كلام الإدخال يمكن أن أطلب بيتزا جبنة مع ملفات تعريف الارتباط Oreo على القمة؟ "تعويضات مثل هذه المجموعات غير الصالحة وفقا للقائمة من مطعم العمل. تسمح أنظمة الحوار التقليدية بإعدام قواعد التحقق من الصحة كخطوة بعد المعالجة بعد أن تم ملء الفتحات التي يمكن أن تؤدي إلى تراكم الخطأ. في هذه الورقة، نقوم بإضفاء الطابع الرسمي على قيود فتحة مدفوعة بالمعرفة وتقديم مهمة جديدة من اكتشاف انتهاك القيد مصحوبة ببيانات معايير. ثم نقترح طرق لإدماج المعرفة الخارجية في الكشف عن انتهاك الانتهاك في النظام والنموذج كمركز تصنيف نهاية إلى نهج ومقارنته لنهج خط أنابيب القواعد التقليدي. تجرب التجارب على مجاليين من مجموعة بيانات متعددة الأوجه من تحديات الكشف عن انتهاك القيود وتضع المرحلة للعمل في المستقبل والتحسينات.
يسمح التعلم المستمر في أنظمة الحوار الموجهة نحو المهام للنظام بإضافة مجالات ووظائف جديدة للعمل الإضافي بعد النشر، دون تكبد التكلفة العالية لإعادة النظر في النظام بأكمله في كل مرة. في هذه الورقة، نقترح أول معيار تعلم مستمر على الإطلاق لأنظمة الحوار ال موجهة نحو المهام مع أن يتم تعلم 37 نطما بشكل مستمر في إعدادات التعلم المعدلة والنهاية. بالإضافة إلى ذلك، نقوم بتنفيذ ومقارنة خطوط أساسيات التعلم المستمرة المتعددة، ونقترحنا طريقة معمارية بسيطة ولكنها فعالة تعتمد على المحولات المتبقية. نشير أيضا إلى أن الأداء العلوي للتعلم المستمر يجب أن يكون يعادل التعلم المتعدد المهام عند توفر البيانات من جميع المجال في وقت واحد. توضح تجاربنا أن الطريقة المعمارية المقترحة وإجراءات استراتيجية تستند إلى إعادة التشغيل بسيطة تؤدي بشكل أفضل، من خلال هامش كبير، مقارنة بتقنيات التعلم المستمرة الأخرى، وأسوأ قليلا قليلا من العلوي المتعدد التعلم العلوي أثناء كونه 20x بشكل أسرع في تعلم النطاقات الجديدة. نحن نبلغ أيضا العديد من المفاضلات من حيث استخدام المعلمة وحجم الذاكرة ووقت التدريب، وهي مهمة في تصميم نظام حوار موجه نحو المهام. يتم إصدار المعيار المقترح لتعزيز المزيد من البحث في هذا الاتجاه.
تهدف هذه الورقة إلى تقديم نظرة عامة شاملة للتطورات الأخيرة في تتبع حكمة الحوار (DST) لأنظمة المحادثات الموجهة نحو المهام.نقدم المهمة، وخاصة البيانات الرئيسية التي تم استغلالها وكذلك مقاييس تقييمها، ونحن نحلل العديد من النهج المقترحة.نحن نميز بين نماذ ج DST غير الثابتة، والتي تتنبأ بمجموعة ثابتة من دول الحوار، ونماذج الأطباق الديناميكية، والتي يمكن أن تتنبؤ حوار الحوار حتى عندما تتغير عملية الأونولوجيا.ونناقش أيضا قدرة النموذج على تتبع النطاقات الفردية أو المتعددة والقياس إلى مجالات جديدة، سواء من حيث نقل المعرفة والتعلم الصفر.نحن نغطي فترة من عام 2013 إلى 2020، مما يدل على زيادة كبيرة في أساليب مجال متعددة، ومعظمها باستخدام نماذج اللغة المدربة مسبقا.
نقدم إطار جيل الحوار الاصطناعي، Velocidapter، الذي يعالج مشكلة توافر Corpus لفهم الحوار. DEVERSITS VELOCIDAPTER DEDASTS من خلال محاكاة المحادثات الاصطناعية مجال حوار موجه نحو المهام، تتطلب كمية صغيرة من أعمال Bootstrapping لكل مجال جديد. نحن نقيم فعا لية إطار عملنا على DataSet من فهم الحوار الموجهة نحو المهام، MRCWOZ، الذي نحرشه من خلال التخلص من الأسئلة للحصول على فتحات في المطعم وسيارات الأجرة ومجالات الفنادق من مجموعة بيانات MultiWoz 2.2 (Zang et al.، 2020). نحن ندير تجارب ضمن إعداد موارد منخفضة، حيث نقعمنا نموذجا على الفريق، قم بضبطها على بيانات أصلية صغيرة أو على البيانات الاصطناعية الناتجة عن طريق الإطار الخاص بنا. يظهر VeloCidapter تحسينات كبيرة في استخدام Bertbase والمادة المستندة إلى المحولات كطرازات أساسية. نظل كذلك أن الإطار سهل الاستخدام من قبل مستخدمي المبتدئين واختتموا أن Velocidaper يمكن أن يساعد بشكل كبير في التدريب على الحوارات الموجهة نحو المهام، خاصة بالنسبة لمجالات الناشئة المنخفضة الموارد.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا