لقد ثبت أن التدريبات متعددة المهام مع المهام الإضافية يمكن أن تحسن جودة المهمة المستهدفة من خلال نقل المهام العابر.ومع ذلك، من المحتمل أن تكون أهمية كل مهمة مساعدة للمهمة الأساسية غير معروفة مسبقا.في حين أن أهمية الأثقال ذات المهام الإضافية يمكن ضبطها يدويا، إلا أنها تصبح عمليا غير قابلة للتنفيذ مع عدد المهام.لمعالجة هذا، نقترح طريقة بحث تقوم تلقائيا بتعيين الأوزان الأهمية.نقوم بصياغة ذلك كمشكلة تعليمية للتعزيز وتعلم جدول أخذ عينات من المهام بناء على دقة تقييم النموذج متعدد المهام.يوضح تقييمنا التجريبي على XNLI والغراء أن أسلوبنا تتفوق على أخذ العينات الموحدة والساعي الأساسي المهمة الموحدة المقابلة.
It has been shown that training multi-task models with auxiliary tasks can improve the target task quality through cross-task transfer. However, the importance of each auxiliary task to the primary task is likely not known a priori. While the importance weights of auxiliary tasks can be manually tuned, it becomes practically infeasible with the number of tasks scaling up. To address this, we propose a search method that automatically assigns importance weights. We formulate it as a reinforcement learning problem and learn a task sampling schedule based on the evaluation accuracy of the multi-task model. Our empirical evaluation on XNLI and GLUE shows that our method outperforms uniform sampling and the corresponding single-task baseline.
المراجع المستخدمة
https://aclanthology.org/
نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن
تستكشف هذه الورقة تأثير استخدام التعلم المتعدد التواجد لتلخيص الجماع في سياق كورسا التدريب الصغيرة.على وجه الخصوص، نحن ندمج أربع مهام مختلفة (تلخيص استخراجي، ونمذجة اللغة، والكشف عن المفهوم، والكشف عن الصياغة على حد سواء بشكل فردي ومزيج، بهدف تعزيز ا
تعد مهمة الطلاقة اللفظية الدلالية (SVF) أداة للفحص الفعال والغازي في الكلام من أجل ضعف المعرفي المعتدل (MCI). في SVF، يتعين على الشاشات إنتاج أكبر عدد ممكن من الكلمات للحصول على فئة دلالية معينة قدر الإمكان في غضون 60 ثانية. من بين النهج الحديثة للتق
تستخدم منتديات سوق Darknet في كثير من الأحيان لتبادل السلع والخدمات غير القانونية بين الأطراف التي تستخدم التشفير لإخفاء هوياتها.يتم استخدام شبكة Tor لاستضافة هذه الأسواق، والتي تضمن إخفاء هويتها الإضافي من IP وتتبع الموقع، مما يجعل من الصعب الارتباط
أظهر تعلم التعزيز العميق إمكانات كبيرة في سياسات الحوار التدريبية. ومع ذلك، فإن أدائها المواتي يأتي بتكلفة العديد من جولات التفاعل. تعتمد معظم أساليب سياسة الحوار الحالية على نظام تعليمي واحد، في حين أن الدماغ البشري يحتوي على نظامين لتعلم وذاكرة متخ