تصف هذه الورقة تقديم فريقنا من أجل تعدين وسائل التواصل الاجتماعي للصحة (SMM4H) 2021 المهمة المشتركة.شاركنا في ثلاث مجموعات فرعية: تصنيف تأثير المخدرات السلبي، والتقرير الذاتي Covid-19، وأعراض Covid-19.يعتمد نظامنا على نموذج Bert المدرب مسبقا على النص الخاص بالمجال.بالإضافة إلى ذلك، نقوم بإجراء تنظيف البيانات والتكبير، بالإضافة إلى تحسين فرط التنفس وفرقة نموذجية لتعزيز أداء بيرت.حققنا الرتبة الأولى في كل من تأثيرات المخدرات الضارة ومهام التقرير الذاتي CovID-19.
This paper describes our team's submission for the Social Media Mining for Health (SMM4H) 2021 shared task. We participated in three subtasks: Classifying adverse drug effect, COVID-19 self-report, and COVID-19 symptoms. Our system is based on BERT model pre-trained on the domain-specific text. In addition, we perform data cleaning and augmentation, as well as hyperparameter optimization and model ensemble to further boost the BERT performance. We achieved the first rank in both classifying adverse drug effects and COVID-19 self-report tasks.
المراجع المستخدمة
https://aclanthology.org/
قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا
عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة
تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء
مثل الاعلانات و الروابط و ع
الكشف عن اللغة الهجومية على Twitter لديها العديد من التطبيقات التي تتراوح من الكشف / التنبؤ بالتنبؤ لقياس الاستقطاب.في هذه الورقة، نركز على بناء مجموعة بيانات تغريدة عربية كبيرة.نقدم طريقة لبناء مجموعة بيانات غير متحيزة حسب الموضوع أو اللهجة أو الهدف
كانت الانتخابات الأمريكية 2020، أكثر من أي وقت مضى، تتميز بحملات وسائل التواصل الاجتماعي والاتهامات المتبادلة. نحن نحقق في هذه الورقة إذا كان هذا يتجلى أيضا في الاتصالات عبر الإنترنت من مؤيدي المرشحين بايدن وترامب، من خلال نطق التواصل البغيض والهجومي
من المعروف أن طريقة المزيج (تشانغ وآخرون، 2017)، واحدة من أساليب تكبير البيانات، من المعروف أنها سهلة التنفيذ والفعالة للغاية. على الرغم من أن طريقة المزيج مخصصة لتحديد الصور، إلا أنه يمكن تطبيقه أيضا على معالجة اللغة الطبيعية. في هذه الورقة، نحاول ت
يطلب عملاء أنظمة التعلم الآلية المساءلة من الشركات التي توظف هذه الخوارزميات لمهام التنبؤ المختلفة. تتطلب المساءلة فهم حدود النظام وحالة التنبؤات الخاطئة، حيث غالبا ما يهتم العملاء بفهم التنبؤات غير الصحيحة، يتم امتصاص المطورين النموذجيين في العثور ع