يتطلب تدريب نموذج التعلم العميق القوي والموثوق كمية كبيرة من البيانات.في مجال الأزمات، يبني نماذج تعليمية عميقة لتحديد المعلومات القابلة للتنفيذ من التدفق الضخم للبيانات المنشورة من قبل شهود فعاليات الأزمات على وسائل التواصل الاجتماعي، في غضون فترة حرجة، هي مركزية لعمليات الاستجابة السريعة والإغاثة.ومع ذلك، فإن بناء مجموعة بيانات كبيرة ومصفحة لتدريب نماذج التعلم العميق ليست ممكنة دائما في وضع الأزمات.في هذه الورقة، نحقق في نهج تعليمي متعدد المهام لزيارة البيانات المشروحة المتاحة المتاحة لعدة مهام ذات صلة من مجال الأزمات لتحسين الأداء في مهمة رئيسية مع بيانات مخفية محدودة.على وجه التحديد، نركز على استخدام التعلم متعدد المهام لتحسين الأداء في مهمة تحديد الموقع في تغريدات الأزمات.
Training a robust and reliable deep learning model requires a large amount of data. In the crisis domain, building deep learning models to identify actionable information from the huge influx of data posted by eyewitnesses of crisis events on social media, in a time-critical manner, is central for fast response and relief operations. However, building a large, annotated dataset to train deep learning models is not always feasible in a crisis situation. In this paper, we investigate a multi-task learning approach to concurrently leverage available annotated data for several related tasks from the crisis domain to improve the performance on a main task with limited annotated data. Specifically, we focus on using multi-task learning to improve the performance on the task of identifying location mentions in crisis tweets.
المراجع المستخدمة
https://aclanthology.org/
نقترح النموذج الفوري الحدث العصبي الذي يتم فيه تدريب كائن تحرير الحدث بشكل مشترك مع خمس مهام: اكتشاف الزناد، كائن كور السلاح، تصميم المشمول، اكتشاف Realis، استخراج الوسيطة.لتوجيه تعلم هذا النموذج المعقد، فإننا ندمج قيود الاتساق عبر المهام في عملية ال
تقدم هذه الورقة مساهمتنا في تعدين وسائل التواصل الاجتماعي للتطبيقات الصحية المهمة المشتركة 2021. لقد عالجنا جميع المهام الفرعية الثلاثة للمهمة 1: الفرعية (تصنيف التغريدات التي تحتوي على آثار ضارة)، SubTask B (استخراج يمتد النص الذي يحتوي على آثار ضار
تهدف التصنيف متعدد الوسائط واسع النطاق إلى التمييز بين مختلف البيانات متعددة الوسائط، وقد لفت الانتباه بشكل كبير منذ العقد الماضي. في هذه الورقة، نقترح إطارا متعدد المهام في مجال التعلم لمهمة التصنيف المتعدد الوسائط، والتي تتكون من فرعين: فرع متعدد ا
الهوية واللغة القياسية الهوية هي مهام حاسمة للعديد من تطبيقات معالجة اللغة العربية.في هذه الورقة، نقدم نظامنا القائم على التعلم العميق، المقدم إلى المهمة المشتركة الثانية من النادي الثاني لتحديد المستوى القطري على مستوى المحافظة على اللغة العربية الم
نقدم COTEXT، وهو نموذج ترميز ترميز مدرب مسبقا مدرب مسبقا، يتعلم السياق التمثيلي بين اللغة الطبيعية (NL) ولغة البرمجة (PL). باستخدام الإشراف الذاتي، تم تدريب COTEX مسبقا على لغة البرمجة الكبيرة لشركة Corpora لتعلم فهم عام للغة والرمز. يدعم COTEXT مهام