العثور على مشاركات Covid-19 Information في مجرى تغريدات مفيدة للغاية لمراقبة التحديثات المتعلقة بالصحة.يعمل العمل السابق على إعداد بيانات متوازن وعلى اللغة الإنجليزية، ولكن تغريدات مفيدة نادرة، والإنجليزية ليست سوى واحدة من العديد من اللغات التي يتحدث بها في العالم.في هذا العمل، نقدم مجموعة بيانات جديدة تبلغ 5000 تغريدات للعثور على تغريدات Covid-19 مفيدة لدنماركي.على عكس العمل المسبق، الذي يوازن بين توزيع الملصقات، نقوم بالنماذج المشكلة عن طريق الحفاظ على توزيعها الطبيعي.نحن ندرس مدى أداء نموذج الاحتمالية البسيط والشبكة العصبية التنافسية (CNN) في هذه المهمة.نجد CNN مرجح للعمل بشكل جيد ولكنها حساسة لتضمين وخيارات HyperParameter.نأمل أن تكون DataSet المساهمة نقطة انطلاق لمزيد من العمل في هذا الاتجاه.
Finding informative COVID-19 posts in a stream of tweets is very useful to monitor health-related updates. Prior work focused on a balanced data setup and on English, but informative tweets are rare, and English is only one of the many languages spoken in the world. In this work, we introduce a new dataset of 5,000 tweets for finding informative COVID-19 tweets for Danish. In contrast to prior work, which balances the label distribution, we model the problem by keeping its natural distribution. We examine how well a simple probabilistic model and a convolutional neural network (CNN) perform on this task. We find a weighted CNN to work well but it is sensitive to embedding and hyperparameter choices. We hope the contributed dataset is a starting point for further work in this direction.
المراجع المستخدمة
https://aclanthology.org/
خلال الأشهر القليلة الماضية، كانت هناك أعداد هائلة من التغريدات المتداولة والمناقشات حول Vironavirus (Covid-19) في المنطقة العربية.من المهم لصانعي السياسات والعديد من الأشخاص تحديد أنواع التغريدات المشتركة لفهم السلوك العام بشكل أفضل، ومواضيع المصالح
وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل
نحن تصف نهجنا مباشرة إلى الأمام للمهام 5 و 6 من 2021 وسائل التواصل الاجتماعي Min - المهام المشتركة (SMM4H) المهام المشتركة.يعتمد نظامنا على DILLBERT الدقيقة على كل مهمة، وكذلك أولا ضبط النموذج على المهمة الأخرى.في هذه الورقة، نتكشف بالإضافة إلى ذلك م
ولدت جائحة Covid-19 هيئة متنوعة من الأدبيات العلمية تحديا في التنقل، وتحفيز الاهتمام بالأدوات الآلية للمساعدة في العثور على معرفة مفيدة.نحن نتابع بناء قاعدة المعرفة (KB) من الآليات --- مفهوم أساسي في جميع أنحاء العلوم، والذي يشمل الأنشطة والوظائف وال
SIFting تغريدات فرنسية للتحقيق في تأثير CovID-19 في إثارة القلق الشديد.يمكن الاستفادة من وسائل التواصل الاجتماعي لفهم المشاعر والمشاعر العامة في الوقت الفعلي، وتستهدف رسائل الصحة العامة المستندة إلى اهتمامات المستخدم والعواطف.في هذه الورقة، نحقق في ت