ترغب بنشر مسار تعليمي؟ اضغط هنا

Arcov-19: أول مجموعة بيانات عربية Covid-19 Twitter مع شبكات الانتشار

ArCOV-19: The First Arabic COVID-19 Twitter Dataset with Propagation Networks

300   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7 مليون تغريدات إلى جانب شبكات الانتشار الفرعية الأكثر شعبية منهم (أي معاد تغريدها ومعاد تغريدها). تشمل شبكات الانتشار كلا من إعادة تغريد مؤشرات الترابط المحادثة (I.E.، خيوط الردود). تم تصميم Arcov-19 لتمكين البحث بموجب عدة مجالات بما في ذلك معالجة اللغة الطبيعية واسترجاع المعلومات والحوسبة الاجتماعية. يوضح التحليل الأولي أن ARCOV-19 يلتقط المناقشات المتصاعدة المرتبطة بأول حالات المرض المبلغ عنها حيث ظهرت في العالم العربي. بالإضافة إلى التغريدات المصدر وشبكات الانتشار، نطلق أيضا استعلامات البحث والزاحف المستقلة للغة تستخدم لجمع التغريدات لتشجيع علمن مجموعات البيانات مماثلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقدم شائعات ARCOV19، ومجموعة بيانات عربية Covid-19 Twitter للكشف عن المعلومات الخاطئة المؤلفة من تغريدات تحتوي على مطالبات من 27 يناير حتى نهاية أبريل 2020. قمنا بجمع 138 مطالبات تم التحقق منها، معظمها من مواقع التحقق من الحقائق الشعبي ة، وحددنا 9.4K تغريدات ذات صلة مع تلك المطالبات. تم فحص التغريدات يدويا بفحصها يدويا لدعم البحوث حول الكشف عن المعلومات الخاطئة، وهي واحدة من المشاكل الرئيسية التي تواجهها خلال جائحة. تدعم شائعات ARCOV19 مستويين من الكشف عن المعلومات الخاطئة على Twitter: التحقق من مطالبات النص الحر (تسمى التحقق من مستوى المطالبة) والتحقق من المطالبات المعبر عنها في تغريدات (تسمى التحقق من مستوى التغريد). أغطية البيانات الخاصة بنا، بالإضافة إلى الصحة، والمطالبات المتعلقة بالفئات الموضعية الأخرى التي تأثرت بالكوفيد 19، وهي الاجتماعية والسياسة والرياضة والترفيه والدينية. علاوة على ذلك، فإننا نقدم نتائج مرجعية للتحقق من المستوى التغردد على DataSet. جربنا نماذج SOTA من النهج التنوعية التي إما استغلال المحتوى، وميزات ملفات تعريف المستخدمين، والميزات الزمنية وهيكل الانتشار من مؤشرات الترابط المحادثة للتحقق من تغريد التغريد.
خلال الأشهر القليلة الماضية، كانت هناك أعداد هائلة من التغريدات المتداولة والمناقشات حول Vironavirus (Covid-19) في المنطقة العربية.من المهم لصانعي السياسات والعديد من الأشخاص تحديد أنواع التغريدات المشتركة لفهم السلوك العام بشكل أفضل، ومواضيع المصالح ، وطلبات الحكومات، ومصادر التغريدات، وما إلى ذلك. كما أنه من الأهمية بمكان انتشار شائعات وإضاءة في الفيروس أوعلاجات سيئة.تحقيقا لهذه الغاية، نقدم أكبر مجموعة بيانات مشروحة يدويا من تغريدات عربية تتعلق بالكوف (19).نحن تصف إرشادات التوضيحية، وتحليل DataSet لدينا وبناء نماذج التعلم والتحول في الآلات الفعالة للتصنيف.
نحن نحقق في تنبؤات الكراهية المضادة للآسيوية بين مستخدمي Twitter في جميع أنحاء Covid-19.مع ظهور كره الأجانب والاستقطاب الذي رافق استخدام وسائل التواصل الاجتماعي الواسع النطاق في العديد من الدول، أصبحت الكراهية عبر الإنترنت قضية اجتماعية كبرى، وجذب ال عديد من الباحثين.هنا، نطبق تقنيات معالجة اللغة الطبيعية لتوصيف مستخدمي وسائل التواصل الاجتماعي الذين بدأوا في نشر رسائل الكراهية المضادة للآسيوية خلال CovID-19.قارننا مجموعتين من المستخدمين --- أولئك الذين نشروا من المضادة للآسيا وأولئك الذين لم يفعلوا - فيما يتعلق بمجموعة غنية من الميزات المقاسة بالبيانات قبل CovID-19 وإظهار أنه من الممكن التنبؤ الذي في وقت لاحقنشرت المناهضة للآسيا.يؤكد تحليلنا للميزات التنبؤية على التأثير المحتمل لوسائط الإعلام وإعلام المعلومات التي تبلغ عن الكراهية عبر الإنترنت وتدعو إلى مزيد من التحقيق في دور شبكات الاتصالات الاستقطابية وسائط الإعلام.
تقدم هذه الورقة النتائج الأولية للمشروع الجاري الذي يحلل الجسم المتنامي للبحث العلمي الذي نشر حول جائحة CovID-19.في هذا البحث، يتم استخدام نموذج دلالي للأغراض العامة لتعليق دفعة من 500 جمل تم اختيارها يدويا من Cord-19 Corpus.بعد ذلك، تم تصميم وتقييم خط أنابيب تعدين النص الأساسي من خلال مجموعة كبيرة من جمل 100،959.نقدم تحليلا نوعيا للحقائق الأكثر إثارة للاهتمام استخراجها تلقائيا وتسليط الضوء على خطوط التنمية المستقبلية المحتملة.تظهر النتائج الأولية أن النماذج الدلالية للأغراض العامة هي أداة مفيدة لاكتشاف معرفة غرامة المحبوس في كورسا الوثائق العلمية الكبيرة.
كانت الاختلافات الأيديولوجية لها تأثير كبير على الاستجابة الفردية والمجتمعية لوباء Covid-19 في الولايات المتحدة.أظهرت الأبحاث السلوكية المبكرة خلال الوعاء أن المحافظين كانوا أقل عرضة للالتزام بالتوجيهات الصحية، مما يتناقض مع مجموعة عمل يشير إلى أن ال أيديولوجية المحافظة تؤكد على قاعدة مستمرة، نفور الخسائر، والوقاية.نحن نتوقف مع هذا التناقض من خلال تحليل المحتوى الدلالي للإصدارات الصحفية المحلية والإصدارات الصحفية الفيدرالية والتغريدات المحلية خلال الشهر الأول من الاستجابة الحكومية إلى Covid-19 في الولايات المتحدة.السيطرة على العوامل مثل الحالات والوفيات المؤكدة Covid-19 المؤكدة والمؤشرات الاقتصادية المحلية، وأكثر من ذلك، نجد أن التعبيرات عبر الإنترنت من الخوف في المناطق المحافظة تؤدي إلى زيادة في الالتزام بتوصيات الصحة العامة فيما يتعلق بالكوفي - 19، وأن تعبيرات الخوففي البيانات الصحفية الحكومية هي مؤشر كبير للخوف المعبر عنه على تويتر.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا