مجردة نحن ندرس التعلم المستمر لتوليد تعليم اللغة الطبيعي، من خلال مراقبة تنفيذ تعليمات المستخدمين البشري.نحن نركز على سيناريو تعاوني، حيث يقوم النظام على كلا من كل من المهام التي يقوم بها المستخدمون البشريون الذين يستخدمون اللغة الطبيعية.نقارن تنفيذ المستخدم للحصول على التعليمات التي تم إنشاؤها إلى النظام الأصلي نية كإشارة إلى نجاح النظام في توصيل نيتها.نوضح كيفية استخدام هذه الإشارة لتحسين قدرة النظام على إنشاء تعليمات عبر تعلم الشرط السياقي.في التفاعل مع المستخدمين الحقيقيين، يوضح نظامنا تحسينات دراماتيكية في قدرتها على توليد اللغة بمرور الوقت.
Abstract We study continual learning for natural language instruction generation, by observing human users' instruction execution. We focus on a collaborative scenario, where the system both acts and delegates tasks to human users using natural language. We compare user execution of generated instructions to the original system intent as an indication to the system's success communicating its intent. We show how to use this signal to improve the system's ability to generate instructions via contextual bandit learning. In interaction with real users, our system demonstrates dramatic improvements in its ability to generate language over time.
المراجع المستخدمة
https://aclanthology.org/
نماذج الترجمة الآلية العصبية (NMT) هي مدفوعة بالبيانات وتتطلب كوربوس تدريب واسع النطاق. في التطبيقات العملية، عادة ما يتم تدريب نماذج NMT على مجال مجال عام ثم يتم ضبطه بشكل جيد من خلال التدريب المستمر على Corpus في المجال. ومع ذلك، فإن هذا يحمل خطر ا
يسمح التعلم المستمر في أنظمة الحوار الموجهة نحو المهام للنظام بإضافة مجالات ووظائف جديدة للعمل الإضافي بعد النشر، دون تكبد التكلفة العالية لإعادة النظر في النظام بأكمله في كل مرة. في هذه الورقة، نقترح أول معيار تعلم مستمر على الإطلاق لأنظمة الحوار ال
نقترح مخطط تكييف المفردات المباشر لتوسيع نطاق القدرة اللغوية لنماذج الترجمة متعددة اللغات، مما يمهد الطريق نحو التعلم المستمر الفعال للترجمة الآلية متعددة اللغات.نهجنا مناسب لمجموعات البيانات واسعة النطاق، ينطبق على اللغات البعيدة مع البرامج النصية غ
لقد أثبتت التعلم المناهج الدراسية، وهي استراتيجية تدريب الآلة التي تغذي حالات التدريب على النموذج من سهولة الصعب، لتسهيل مهمة توليد الحوار. وفي الوقت نفسه، يمكن أن تسفر عن طريقة تقطير المعرفة، منهجية تحويل المعرفة بين المعلمين وشبكات الطلاب دفعة كبير
تدرس هذه الورقة التعلم المستمر (CL) من تسلسل مهام تصنيف معنويات الجانب (ASC) في إعداد CL معين يسمى التعلم الإضافي للمجال (DIL).كل مهمة هي من مجال أو منتج مختلف.يعد إعداد DIL مناسبا بشكل خاص للأشعة السوداء لأنه في اختبار لا يحتاج النظام إلى معرفة المه