في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7 مليون تغريدات إلى جانب شبكات الانتشار الفرعية الأكثر شعبية منهم (أي معاد تغريدها ومعاد تغريدها). تشمل شبكات الانتشار كلا من إعادة تغريد مؤشرات الترابط المحادثة (I.E.، خيوط الردود). تم تصميم Arcov-19 لتمكين البحث بموجب عدة مجالات بما في ذلك معالجة اللغة الطبيعية واسترجاع المعلومات والحوسبة الاجتماعية. يوضح التحليل الأولي أن ARCOV-19 يلتقط المناقشات المتصاعدة المرتبطة بأول حالات المرض المبلغ عنها حيث ظهرت في العالم العربي. بالإضافة إلى التغريدات المصدر وشبكات الانتشار، نطلق أيضا استعلامات البحث والزاحف المستقلة للغة تستخدم لجمع التغريدات لتشجيع علمن مجموعات البيانات مماثلة.