ترغب بنشر مسار تعليمي؟ اضغط هنا

سياسة أخذ عينات مهمة التعلم للتعلم المتعدد

Learning Task Sampling Policy for Multitask Learning

702   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لقد ثبت أن التدريبات متعددة المهام مع المهام الإضافية يمكن أن تحسن جودة المهمة المستهدفة من خلال نقل المهام العابر.ومع ذلك، من المحتمل أن تكون أهمية كل مهمة مساعدة للمهمة الأساسية غير معروفة مسبقا.في حين أن أهمية الأثقال ذات المهام الإضافية يمكن ضبطها يدويا، إلا أنها تصبح عمليا غير قابلة للتنفيذ مع عدد المهام.لمعالجة هذا، نقترح طريقة بحث تقوم تلقائيا بتعيين الأوزان الأهمية.نقوم بصياغة ذلك كمشكلة تعليمية للتعزيز وتعلم جدول أخذ عينات من المهام بناء على دقة تقييم النموذج متعدد المهام.يوضح تقييمنا التجريبي على XNLI والغراء أن أسلوبنا تتفوق على أخذ العينات الموحدة والساعي الأساسي المهمة الموحدة المقابلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن من الصعب أيضا، ويرجع ذلك أساسا إلى كمية محدودة من البيانات التدريبية المتاحة التي كانت فيها أغراض كل الاقتباس يدوياالمسمى، جنبا إلى جنب مع الذاتية لهذه الملصقات.إن دخولنا في المسابقة هو نموذج متعدد المهام يجمع بين وحدات متعددة مصممة للتعامل مع المشكلة من وجهات نظر مختلفة، بما في ذلك الميزات اللغوية التي تم إنشاؤها يدويا، وميزات TF-IDF، ونموذج LSTM- مع الانتباه.كما نقدم دراسة الاجتثاث والتحليل الميزات التي يمكن أن تؤدي رؤيتها إلى العمل في المستقبل.
تستكشف هذه الورقة تأثير استخدام التعلم المتعدد التواجد لتلخيص الجماع في سياق كورسا التدريب الصغيرة.على وجه الخصوص، نحن ندمج أربع مهام مختلفة (تلخيص استخراجي، ونمذجة اللغة، والكشف عن المفهوم، والكشف عن الصياغة على حد سواء بشكل فردي ومزيج، بهدف تعزيز ا لمهمة المستهدفة المتمثلة في تلخيص الجماع عبر التعلم المتعدد.نظرا لأنه بالنسبة للعديد من مجموعات المهام، فإن نموذج مدرب في إعداد متعدد الأيتاكف يتفوق على نموذج مدرب فقط في تلخيص الجماع، مع عدم تقديم بيانات تلخيص إضافية.بالإضافة إلى ذلك، نقوم بعمل بحث شامل والعثور على أن بعض المهام (E.G. الكشف عن الصياغة) تستفيد باستمرار تلخيص الجماعي، ليس فقط عند الجمع مع المهام الأخرى ولكن أيضا عند استخدام بهيئات مختلفة وتدريب كورسا.
تعد مهمة الطلاقة اللفظية الدلالية (SVF) أداة للفحص الفعال والغازي في الكلام من أجل ضعف المعرفي المعتدل (MCI). في SVF، يتعين على الشاشات إنتاج أكبر عدد ممكن من الكلمات للحصول على فئة دلالية معينة قدر الإمكان في غضون 60 ثانية. من بين النهج الحديثة للتق ييم التلقائي ل SVF توظف Word Adgeddings لتحليل أوجه التشابه الدلالي في تسلسل الكلمات هذه. في حين أثبتت هذه الأساليب الواعدة في مجموعة متنوعة من لغات الاختبار، فإن كمية البيانات الصغيرة المتاحة لأي لغة معينة تحد من الأداء. في هذه الورقة، نحن في المرة الأولى التي تحقق فيها مناهج التعلم متعددة اللغات لتصنيف MCI من SVF من أجل مكافحة ندرة البيانات. للسماح للتعميم عبر اللغات، تعتمد هذه الأساليب إما على الترجمة إلى لغة مشتركة، أو الاستفادة من العديد من تضمين كلمة مميزة. في التقييمات في جثة متعددة اللغات من المشاركين الفرنسيين الأكبر سنا والمشاركين الهولنديين والألمانيين (الضوابط = 66، MCI = 66)، نظين أن نهجنا متعددة اللغات تتحسن بوضوح على خطوط خطوط خطوط خطوط وطنية واحدة.
تستخدم منتديات سوق Darknet في كثير من الأحيان لتبادل السلع والخدمات غير القانونية بين الأطراف التي تستخدم التشفير لإخفاء هوياتها.يتم استخدام شبكة Tor لاستضافة هذه الأسواق، والتي تضمن إخفاء هويتها الإضافي من IP وتتبع الموقع، مما يجعل من الصعب الارتباط عبر المستخدمين الخبيثة باستخدام حسابات متعددة (Sybils).بالإضافة إلى ذلك، يهاجر المستخدمون إلى منتديات جديدة عندما يتم إغلاق المرء زيادة زيادة صعوبة ربط المستخدمين عبر منتديات متعددة.نقوم بتطوير نهج تعليم متعدد الأطباق المستند إلى المصممة على أساس التصديق على اللغة الطبيعية والتفاعلات النموذجية باستخدام Asceddings الرسم البياني لإنشاء تمثيلات منخفضة الأبعاد من حلقات قصيرة لنشاط المستخدم لإسناد التأليف.نحن نقدم تقييم شامل لأساليبنا في أربع منتديات Darknet المختلفة التي توضح فعالتها على أحدث من الفن، مع رفع ما يصل إلى 2.5x في مرتبة الاسترجاع المتوسط و 2x على استدعاء @ 10.
أظهر تعلم التعزيز العميق إمكانات كبيرة في سياسات الحوار التدريبية. ومع ذلك، فإن أدائها المواتي يأتي بتكلفة العديد من جولات التفاعل. تعتمد معظم أساليب سياسة الحوار الحالية على نظام تعليمي واحد، في حين أن الدماغ البشري يحتوي على نظامين لتعلم وذاكرة متخ صصين، يدعمان لإيجاد حلول جيدة دون الحاجة إلى أمثلة غزيرة. مستوحاة من الدماغ البشري، تقترح هذه الورقة إطار عمل لتعلم السياسات التكميلي الرواية (CPL)، والتي تستغل المزايا التكميلية لسياسة الذاكرة العرضية (EM) وسياسة شبكة Q-Network (DQN) العميقة لتحقيق تعلم سياسة حوار سريعة وفعالة وبعد من أجل التنسيق بين السياسة، اقترحنا وحدة تحكم الثقة للسيطرة على الوقت التكميلي وفقا لفعولتها النسبية في مراحل مختلفة. علاوة على ذلك، يتم اقتراح اتصال الذاكرة وتقليم الوقت لضمان التعميم المرن والتكيف للسياسة EM في مهام الحوار. تظهر النتائج التجريبية على ثلاث مجموعات بيانات الحوار أن طريقتنا تتفوق بشكل كبير على الطرق الحالية التي تعتمد على نظام تعليمي واحد.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا