في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7 مليون تغريدات إلى جانب شبكات الانتشار الفرعية الأكثر شعبية منهم (أي معاد تغريدها ومعاد تغريدها). تشمل شبكات الانتشار كلا من إعادة تغريد مؤشرات الترابط المحادثة (I.E.، خيوط الردود). تم تصميم Arcov-19 لتمكين البحث بموجب عدة مجالات بما في ذلك معالجة اللغة الطبيعية واسترجاع المعلومات والحوسبة الاجتماعية. يوضح التحليل الأولي أن ARCOV-19 يلتقط المناقشات المتصاعدة المرتبطة بأول حالات المرض المبلغ عنها حيث ظهرت في العالم العربي. بالإضافة إلى التغريدات المصدر وشبكات الانتشار، نطلق أيضا استعلامات البحث والزاحف المستقلة للغة تستخدم لجمع التغريدات لتشجيع علمن مجموعات البيانات مماثلة.
In this paper, we present ArCOV-19, an Arabic COVID-19 Twitter dataset that spans one year, covering the period from 27th of January 2020 till 31st of January 2021. ArCOV-19 is the first publicly-available Arabic Twitter dataset covering COVID-19 pandemic that includes about 2.7M tweets alongside the propagation networks of the most-popular subset of them (i.e., most-retweeted and -liked). The propagation networks include both retweetsand conversational threads (i.e., threads of replies). ArCOV-19 is designed to enable research under several domains including natural language processing, information retrieval, and social computing. Preliminary analysis shows that ArCOV-19 captures rising discussions associated with the first reported cases of the disease as they appeared in the Arab world.In addition to the source tweets and the propagation networks, we also release the search queries and the language-independent crawler used to collect the tweets to encourage the curation of similar datasets.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقدم شائعات ARCOV19، ومجموعة بيانات عربية Covid-19 Twitter للكشف عن المعلومات الخاطئة المؤلفة من تغريدات تحتوي على مطالبات من 27 يناير حتى نهاية أبريل 2020. قمنا بجمع 138 مطالبات تم التحقق منها، معظمها من مواقع التحقق من الحقائق الشعبي
خلال الأشهر القليلة الماضية، كانت هناك أعداد هائلة من التغريدات المتداولة والمناقشات حول Vironavirus (Covid-19) في المنطقة العربية.من المهم لصانعي السياسات والعديد من الأشخاص تحديد أنواع التغريدات المشتركة لفهم السلوك العام بشكل أفضل، ومواضيع المصالح
نحن نحقق في تنبؤات الكراهية المضادة للآسيوية بين مستخدمي Twitter في جميع أنحاء Covid-19.مع ظهور كره الأجانب والاستقطاب الذي رافق استخدام وسائل التواصل الاجتماعي الواسع النطاق في العديد من الدول، أصبحت الكراهية عبر الإنترنت قضية اجتماعية كبرى، وجذب ال
تقدم هذه الورقة النتائج الأولية للمشروع الجاري الذي يحلل الجسم المتنامي للبحث العلمي الذي نشر حول جائحة CovID-19.في هذا البحث، يتم استخدام نموذج دلالي للأغراض العامة لتعليق دفعة من 500 جمل تم اختيارها يدويا من Cord-19 Corpus.بعد ذلك، تم تصميم وتقييم
كانت الاختلافات الأيديولوجية لها تأثير كبير على الاستجابة الفردية والمجتمعية لوباء Covid-19 في الولايات المتحدة.أظهرت الأبحاث السلوكية المبكرة خلال الوعاء أن المحافظين كانوا أقل عرضة للالتزام بالتوجيهات الصحية، مما يتناقض مع مجموعة عمل يشير إلى أن ال