ترغب بنشر مسار تعليمي؟ اضغط هنا

التعلم متعدد المهام لتمكين تحديد الموقع تحديد الهوية في الساعات الأولى من حدث الأزمات

Multi-task Learning to Enable Location Mention Identification in the Early Hours of a Crisis Event

444   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتطلب تدريب نموذج التعلم العميق القوي والموثوق كمية كبيرة من البيانات.في مجال الأزمات، يبني نماذج تعليمية عميقة لتحديد المعلومات القابلة للتنفيذ من التدفق الضخم للبيانات المنشورة من قبل شهود فعاليات الأزمات على وسائل التواصل الاجتماعي، في غضون فترة حرجة، هي مركزية لعمليات الاستجابة السريعة والإغاثة.ومع ذلك، فإن بناء مجموعة بيانات كبيرة ومصفحة لتدريب نماذج التعلم العميق ليست ممكنة دائما في وضع الأزمات.في هذه الورقة، نحقق في نهج تعليمي متعدد المهام لزيارة البيانات المشروحة المتاحة المتاحة لعدة مهام ذات صلة من مجال الأزمات لتحسين الأداء في مهمة رئيسية مع بيانات مخفية محدودة.على وجه التحديد، نركز على استخدام التعلم متعدد المهام لتحسين الأداء في مهمة تحديد الموقع في تغريدات الأزمات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح النموذج الفوري الحدث العصبي الذي يتم فيه تدريب كائن تحرير الحدث بشكل مشترك مع خمس مهام: اكتشاف الزناد، كائن كور السلاح، تصميم المشمول، اكتشاف Realis، استخراج الوسيطة.لتوجيه تعلم هذا النموذج المعقد، فإننا ندمج قيود الاتساق عبر المهام في عملية ال تعلم كقيوب ناعمة من خلال تصميم عقوبة الوظائف.بالإضافة إلى ذلك، نقترح فكرة الرواية المتمثلة في عرض كائن العناية والحقوق الحدث بمهمة كائن تحرير واحدة، والتي نعتقد أنها خطوة نحو نموذج موحد لدق السلاح.ينتج النموذج الناتج نتائج أحدث النتائج في مجموعة بيانات QBP 2017 Aquerence.
تقدم هذه الورقة مساهمتنا في تعدين وسائل التواصل الاجتماعي للتطبيقات الصحية المهمة المشتركة 2021. لقد عالجنا جميع المهام الفرعية الثلاثة للمهمة 1: الفرعية (تصنيف التغريدات التي تحتوي على آثار ضارة)، SubTask B (استخراج يمتد النص الذي يحتوي على آثار ضار ة) وSubTask C (دقة الآثار الضارة).استكشفنا العديد من نماذج اللغة القائمة على المحولات المدربة مسبقا وركزنا على بنية تدريب متعددة المهام.بالنسبة للسبع الأول، طبقنا أيضا تقنيات تكبير الخصومة وتشكل مجموعة نموذجية من أجل تحسين متانة التنبؤ.مرتبة نظامنا في المرتبة الأولى في SubTask B مع 0.51 F1 درجة، 0.514 الدقة واستدعاء 0.514.للحصول على التراكج الفرعية، حصلنا على درجة 0.44 F1، 0.49 دقة و 0.39 استدعاء و For Subtask C حصلنا على 0.16 F1 درجة مع 0.16 دقة و 0.17 تذكر.
تهدف التصنيف متعدد الوسائط واسع النطاق إلى التمييز بين مختلف البيانات متعددة الوسائط، وقد لفت الانتباه بشكل كبير منذ العقد الماضي. في هذه الورقة، نقترح إطارا متعدد المهام في مجال التعلم لمهمة التصنيف المتعدد الوسائط، والتي تتكون من فرعين: فرع متعدد ا لأضوانات متعدد الوسائط وفرع النمذجة متعددة الوسائط المستنتيت بالاهتمام. يمكن أن يتلقى AutoNcoder متعدد الوسائط ميزات متعددة الوسائط والحصول على المعلومات التفاعلية التي تسمى ميزة التشفير متعددة الوسائط، واستخدام هذه الميزة لإعادة تكوين جميع بيانات الإدخال. بالإضافة إلى ذلك، يمكن استخدام ميزة التشفير المتعددة مشروط لإثراء بيانات DataSet RAW، وتحسين أداء مهام المصب (مثل مهمة التصنيف). أما بالنسبة لفرع النمذجة المتعددة الأبعاد القائم على الانتباه، فإننا نوصي أولا آلية الاهتمام لجعل النموذج يركز على الميزات المهمة، ثم نستخدم ميزة التشفير متعددة الوسائط لإثراء معلومات الإدخال، وتحقيق أداء أفضل. نقوم بإجراء تجارب مكثفة على مجموعة بيانات مختلفة، توضح النتائج فعالية الإطار المقترح.
الهوية واللغة القياسية الهوية هي مهام حاسمة للعديد من تطبيقات معالجة اللغة العربية.في هذه الورقة، نقدم نظامنا القائم على التعلم العميق، المقدم إلى المهمة المشتركة الثانية من النادي الثاني لتحديد المستوى القطري على مستوى المحافظة على اللغة العربية الم عيارية الحديثة (MSA) واللهولية العربية (DA).يعتمد النظام على نموذج تعليمي عميق متعدد الإنهائي (MTL) لمعالجة كلا من الرتبة البلد والمستوى من المستوى MSA / DA.يتكون نموذج MTL الأخير من محولات تمثيل ترميز ترميز مشترك (بيرت)، طبقات اهتمام خاصتين بمهام العمل، واثنين من المصنفين.تتمثل فكرتنا الرئيسية في الاستفادة من كل من التمييز على المهمة والميزات المشتركة بين المهام للبلد والمقاطعة MSA / DA الهوية.تظهر النتائج التي تم الحصول عليها أن نموذج MTL يتفوق على نماذج مهمة واحدة في معظم المهام الفرعية.
نقدم COTEXT، وهو نموذج ترميز ترميز مدرب مسبقا مدرب مسبقا، يتعلم السياق التمثيلي بين اللغة الطبيعية (NL) ولغة البرمجة (PL). باستخدام الإشراف الذاتي، تم تدريب COTEX مسبقا على لغة البرمجة الكبيرة لشركة Corpora لتعلم فهم عام للغة والرمز. يدعم COTEXT مهام NL-PL المصب مثل الرمز الملخص / الوثائق، وتوليد الرموز، والكشف عن العيوب، وتصحيح التعليمات البرمجية. نحن ندرب مشعك على مجموعات مختلفة من Corpus المتوفرة المتوفرة بما في ذلك البيانات BIMODAL 'و Unimodal'. هنا، بيانات BIMODAL هي مزيج من النصوص النصية والنصوص المقابلة، في حين أن البيانات غير المستخدمة هي مجرد مقتطفات رمز. نقيم أولا COTEXT مع التعلم متعدد المهام: نقوم بإجراء تلخيص الكود على 6 لغات برمجة مختلفة وصقل التعليمات البرمجية على كل من الحجم الصغير والمتوسط ​​المميز في DataSet Codexglue. كلنا إجراء تجارب مكثفة للتحقيق في COTEXT على مهام أخرى ضمن DataSet Codexglue، بما في ذلك توليد التعليمات البرمجية والكشف عن العيوب. نحن نتحمل باستمرار نتائج SOTA في هذه المهام، مما يدل على تنوع نماذجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا