تقدم هذه الورقة مساهمتنا في تعدين وسائل التواصل الاجتماعي للتطبيقات الصحية المهمة المشتركة 2021. لقد عالجنا جميع المهام الفرعية الثلاثة للمهمة 1: الفرعية (تصنيف التغريدات التي تحتوي على آثار ضارة)، SubTask B (استخراج يمتد النص الذي يحتوي على آثار ضارة) وSubTask C (دقة الآثار الضارة).استكشفنا العديد من نماذج اللغة القائمة على المحولات المدربة مسبقا وركزنا على بنية تدريب متعددة المهام.بالنسبة للسبع الأول، طبقنا أيضا تقنيات تكبير الخصومة وتشكل مجموعة نموذجية من أجل تحسين متانة التنبؤ.مرتبة نظامنا في المرتبة الأولى في SubTask B مع 0.51 F1 درجة، 0.514 الدقة واستدعاء 0.514.للحصول على التراكج الفرعية، حصلنا على درجة 0.44 F1، 0.49 دقة و 0.39 استدعاء و For Subtask C حصلنا على 0.16 F1 درجة مع 0.16 دقة و 0.17 تذكر.
This paper presents our contribution to the Social Media Mining for Health Applications Shared Task 2021. We addressed all the three subtasks of Task 1: Subtask A (classification of tweets containing adverse effects), Subtask B (extraction of text spans containing adverse effects) and Subtask C (adverse effects resolution). We explored various pre-trained transformer-based language models and we focused on a multi-task training architecture. For the first subtask, we also applied adversarial augmentation techniques and we formed model ensembles in order to improve the robustness of the prediction. Our system ranked first at Subtask B with 0.51 F1 score, 0.514 precision and 0.514 recall. For Subtask A we obtained 0.44 F1 score, 0.49 precision and 0.39 recall and for Subtask C we obtained 0.16 F1 score with 0.16 precision and 0.17 recall.
المراجع المستخدمة
https://aclanthology.org/
تهدف التصنيف متعدد الوسائط واسع النطاق إلى التمييز بين مختلف البيانات متعددة الوسائط، وقد لفت الانتباه بشكل كبير منذ العقد الماضي. في هذه الورقة، نقترح إطارا متعدد المهام في مجال التعلم لمهمة التصنيف المتعدد الوسائط، والتي تتكون من فرعين: فرع متعدد ا
نقدم COTEXT، وهو نموذج ترميز ترميز مدرب مسبقا مدرب مسبقا، يتعلم السياق التمثيلي بين اللغة الطبيعية (NL) ولغة البرمجة (PL). باستخدام الإشراف الذاتي، تم تدريب COTEX مسبقا على لغة البرمجة الكبيرة لشركة Corpora لتعلم فهم عام للغة والرمز. يدعم COTEXT مهام
تحليل المعنويات الفئة في الأساس (ACSA)، والتي تهدف إلى تحديد أساور المشاعر المحبوبة من فئات الارتفاع المناقشات في مراجعات المستخدمين. ACSA صعبة ومكلفة عند إجراءها في تطبيقات عالمية حقيقية، والتي ترجع بشكل رئيسي إلى الأسباب التالية: 1.) وعلم بيانات AC
نقترح النموذج الفوري الحدث العصبي الذي يتم فيه تدريب كائن تحرير الحدث بشكل مشترك مع خمس مهام: اكتشاف الزناد، كائن كور السلاح، تصميم المشمول، اكتشاف Realis، استخراج الوسيطة.لتوجيه تعلم هذا النموذج المعقد، فإننا ندمج قيود الاتساق عبر المهام في عملية ال
يتطلب تدريب نموذج التعلم العميق القوي والموثوق كمية كبيرة من البيانات.في مجال الأزمات، يبني نماذج تعليمية عميقة لتحديد المعلومات القابلة للتنفيذ من التدفق الضخم للبيانات المنشورة من قبل شهود فعاليات الأزمات على وسائل التواصل الاجتماعي، في غضون فترة ح