ترغب بنشر مسار تعليمي؟ اضغط هنا

Arcorona: تحليل تغريدات عربية في الأيام الأولى من فيروس Coronavirus (Covid-19) جائحة

ArCorona: Analyzing Arabic Tweets in the Early Days of Coronavirus (COVID-19) Pandemic

314   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

خلال الأشهر القليلة الماضية، كانت هناك أعداد هائلة من التغريدات المتداولة والمناقشات حول Vironavirus (Covid-19) في المنطقة العربية.من المهم لصانعي السياسات والعديد من الأشخاص تحديد أنواع التغريدات المشتركة لفهم السلوك العام بشكل أفضل، ومواضيع المصالح، وطلبات الحكومات، ومصادر التغريدات، وما إلى ذلك. كما أنه من الأهمية بمكان انتشار شائعات وإضاءة في الفيروس أوعلاجات سيئة.تحقيقا لهذه الغاية، نقدم أكبر مجموعة بيانات مشروحة يدويا من تغريدات عربية تتعلق بالكوف (19).نحن تصف إرشادات التوضيحية، وتحليل DataSet لدينا وبناء نماذج التعلم والتحول في الآلات الفعالة للتصنيف.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7 مليون تغريدات إلى جانب شبكات الانتشار الفرعية الأكثر شعبية منهم (أي معاد تغريدها ومعاد تغريدها). تشمل شبكات الانتشار كلا من إعادة تغريد مؤشرات الترابط المحادثة (I.E.، خيوط الردود). تم تصميم Arcov-19 لتمكين البحث بموجب عدة مجالات بما في ذلك معالجة اللغة الطبيعية واسترجاع المعلومات والحوسبة الاجتماعية. يوضح التحليل الأولي أن ARCOV-19 يلتقط المناقشات المتصاعدة المرتبطة بأول حالات المرض المبلغ عنها حيث ظهرت في العالم العربي. بالإضافة إلى التغريدات المصدر وشبكات الانتشار، نطلق أيضا استعلامات البحث والزاحف المستقلة للغة تستخدم لجمع التغريدات لتشجيع علمن مجموعات البيانات مماثلة.
العثور على مشاركات Covid-19 Information في مجرى تغريدات مفيدة للغاية لمراقبة التحديثات المتعلقة بالصحة.يعمل العمل السابق على إعداد بيانات متوازن وعلى اللغة الإنجليزية، ولكن تغريدات مفيدة نادرة، والإنجليزية ليست سوى واحدة من العديد من اللغات التي يتحد ث بها في العالم.في هذا العمل، نقدم مجموعة بيانات جديدة تبلغ 5000 تغريدات للعثور على تغريدات Covid-19 مفيدة لدنماركي.على عكس العمل المسبق، الذي يوازن بين توزيع الملصقات، نقوم بالنماذج المشكلة عن طريق الحفاظ على توزيعها الطبيعي.نحن ندرس مدى أداء نموذج الاحتمالية البسيط والشبكة العصبية التنافسية (CNN) في هذه المهمة.نجد CNN مرجح للعمل بشكل جيد ولكنها حساسة لتضمين وخيارات HyperParameter.نأمل أن تكون DataSet المساهمة نقطة انطلاق لمزيد من العمل في هذا الاتجاه.
وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل قد جربنا عددا من النماذج التعلم العميقة، بما في ذلك تضمين كلمة مختلفة، مثل القفازات، إلمو، من بين أمور أخرى.حقق نموذج Bertweet أفضل درجة F1 بشكل عام من 0.881 وأمنت المرتبة الثالثة على المهمة المذكورة أعلاه.
في حين أن لقاحات CoviD-19 أصبحت متاحة في النهاية على نطاق واسع، فإن الوباء الثاني الذي يدور حول تداول الأخبار المضادة ل Vaxxer وهمية "قد يعيق الجهود للتعافي من أول واحد.مع وضع ذلك في الاعتبار، أجرينا تحليلا مكثفا للعقائز العربية والإنجليزية حول لقاحا ت CovID-19، مع التركيز على الرسائل المنصولة من قطر.وجدنا أن التغريدات العربية تحتوي على الكثير من المعلومات والشائعات الخاطئة، في حين أن تغريدات اللغة الإنجليزية هي في الغالب واقعية.ومع ذلك، فإن تغريدات اللغة الإنجليزية هي أكثر إثارةا من اللغة العربية.فيما يتعلق بتقنيات الدعاية، فإن حوالي نصف التغريدات العربية تعبر عن الشك، و 1/5 استخدام اللغة المحملة، في حين أن تغريدات اللغة الإنجليزية وفيرة في اللغة المحملة، المبالغة، والخوف، والسمطية بالاسم، والشك، والتلويح العلمي.أخيرا، من حيث التأطير، تعتمد تغريدات عربية منظور صحية وسلامة، بينما تهيمن في المخاوف الاقتصادية الإنجليزية.
نحن تصف نهجنا مباشرة إلى الأمام للمهام 5 و 6 من 2021 وسائل التواصل الاجتماعي Min - المهام المشتركة (SMM4H) المهام المشتركة.يعتمد نظامنا على DILLBERT الدقيقة على كل مهمة، وكذلك أولا ضبط النموذج على المهمة الأخرى.في هذه الورقة، نتكشف بالإضافة إلى ذلك م قدار التوصيل الدقيق ضروري لتصنيف التغريدات بدقة على النحو الذي يحتوي على أعراض Covid-19 المبلغ عنها ذاتيا (المهمة 5) أو ما إذا كانت سقسقة تتعلق Covid-19 هي التقارير الذاتية وغير الشخصية،أو أدب / أخبار ذكر الفيروس (المهمة 6).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا