ترغب بنشر مسار تعليمي؟ اضغط هنا

التنقل مع مشهد من CovID-19 المعلومات الخاطئة باستخدام التعلم العميق

Navigating the Kaleidoscope of COVID-19 Misinformation Using Deep Learning

524   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

بصرف النظر عن نجاح نهج تعلم النطاق المختلط في مجال التعلم العميق لحل المهام المختلفة لمعالجة اللغة الطبيعية، فإنه لا يقرض حل جماعيا للكشف عن المعلومات الخاطئة من بيانات وسائل التواصل الاجتماعي CovID-19. نظرا للتعقيد المتأصل من هذا النوع من البيانات، الناجمة عن ديناميك (سياقه يتطور بسرعة)، ذات الطابع الدقيق (أنواع الخائن غير غامضة في كثير من الأحيان)، ومتنوعة (الفئات المنحيحة، المحبوسة والتداخل) الطبيعة، من الضروري نموذج فعال لالتقاط كل من السياق المحلي والعالمي للمجال المستهدف. من خلال إجراء تحقيق منهجي، نظهر أن: (1) النماذج المدربة مسبقا مسبقا للمحولات العميقة، المستخدمة عبر تعلم نقل المجال المختلط، جيدة فقط في التقاط السياق المحلي، وبالتالي تظهر تعميم ضعيف، و (2) يمكن أن يستخرج مزيج من النماذج الضحلة المستندة إلى الشبكة والشبكات العصبية التنافسية السياق محليا بالإضافة إلى السياق بشكل فعال بالإضافة إلى البيانات المستهدفة بطريقة هرمية بطريقة هرمية، مما يتيح من تقديم حل أكثر تعميما.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل قد جربنا عددا من النماذج التعلم العميقة، بما في ذلك تضمين كلمة مختلفة، مثل القفازات، إلمو، من بين أمور أخرى.حقق نموذج Bertweet أفضل درجة F1 بشكل عام من 0.881 وأمنت المرتبة الثالثة على المهمة المذكورة أعلاه.
نقدم مصنفات التعلم الآلية لتحديد المعلومات الخاطئة COVID-19 تلقائيا على وسائل التواصل الاجتماعي بثلاث لغات: الإنجليزية، البلغارية، والعربية.قمنا بمقارنة 4 نماذج تعليمية متعددة الأيتاكف لهذه المهمة ووجدت أن نموذج مدرب مع بيرت الإنجليزية يحقق أفضل النت ائج للغة الإنجليزية، وتحقق بيرت متعددة اللغات أفضل النتائج عن البلغارية والعربية.لقد جربنا لقطة صفرية، وقلة طرية، والظروف المستهدفة فقط لتقييم تأثير بيانات التدريب على اللغة المستهدفة حول أداء المصنف، وفهم قدرات نماذج مختلفة للتعميم عبر اللغات في الكشف عن المعلومات الخاطئة عبر الإنترنت.تم إجراء هذا العمل كإرسال إلى المهمة المشتركة، NLP4IF 2021: مكافحة المعكرات المعاكسة 19.حققت أفضل طرازاتنا ثاني أفضل نتائج اختبار التقييم في البلغارية والعربية بين جميع الفرق المشاركة وحصلت على درجات تنافسية للغة الإنجليزية.
في هذه الورقة، نقدم شائعات ARCOV19، ومجموعة بيانات عربية Covid-19 Twitter للكشف عن المعلومات الخاطئة المؤلفة من تغريدات تحتوي على مطالبات من 27 يناير حتى نهاية أبريل 2020. قمنا بجمع 138 مطالبات تم التحقق منها، معظمها من مواقع التحقق من الحقائق الشعبي ة، وحددنا 9.4K تغريدات ذات صلة مع تلك المطالبات. تم فحص التغريدات يدويا بفحصها يدويا لدعم البحوث حول الكشف عن المعلومات الخاطئة، وهي واحدة من المشاكل الرئيسية التي تواجهها خلال جائحة. تدعم شائعات ARCOV19 مستويين من الكشف عن المعلومات الخاطئة على Twitter: التحقق من مطالبات النص الحر (تسمى التحقق من مستوى المطالبة) والتحقق من المطالبات المعبر عنها في تغريدات (تسمى التحقق من مستوى التغريد). أغطية البيانات الخاصة بنا، بالإضافة إلى الصحة، والمطالبات المتعلقة بالفئات الموضعية الأخرى التي تأثرت بالكوفيد 19، وهي الاجتماعية والسياسة والرياضة والترفيه والدينية. علاوة على ذلك، فإننا نقدم نتائج مرجعية للتحقق من المستوى التغردد على DataSet. جربنا نماذج SOTA من النهج التنوعية التي إما استغلال المحتوى، وميزات ملفات تعريف المستخدمين، والميزات الزمنية وهيكل الانتشار من مؤشرات الترابط المحادثة للتحقق من تغريد التغريد.
في هذه الورقة، نقدم مجموعة بيانات Arcov-19، وهي مجموعة بيانات عربية Covid-19 Twitter التي تمتد لمدة عام واحد، تغطي الفترة من 27 يناير 2020 حتى 31 يناير 2021. Arcov-19 هي أول مجموعة بيانات عربية تويتر العربية التي تغطي كوفي -19 الوباء يتضمن حوالي 2.7 مليون تغريدات إلى جانب شبكات الانتشار الفرعية الأكثر شعبية منهم (أي معاد تغريدها ومعاد تغريدها). تشمل شبكات الانتشار كلا من إعادة تغريد مؤشرات الترابط المحادثة (I.E.، خيوط الردود). تم تصميم Arcov-19 لتمكين البحث بموجب عدة مجالات بما في ذلك معالجة اللغة الطبيعية واسترجاع المعلومات والحوسبة الاجتماعية. يوضح التحليل الأولي أن ARCOV-19 يلتقط المناقشات المتصاعدة المرتبطة بأول حالات المرض المبلغ عنها حيث ظهرت في العالم العربي. بالإضافة إلى التغريدات المصدر وشبكات الانتشار، نطلق أيضا استعلامات البحث والزاحف المستقلة للغة تستخدم لجمع التغريدات لتشجيع علمن مجموعات البيانات مماثلة.
في هذه الورقة، نصف نظامنا للمهمة المشتركة بشأن مكافحة المعكرية CovID-19 باللغة الإنجليزية.تتألف الهندسة المعمارية المقترحة من نموذج تصنيف متعدد الناتج للمهام السبعة، مع طبقة اهتمام مهام متعددة المهام المتعددة الرأس لمجموع المعلومات المشتركة بين المها م.تم بناء هذا على رأس تمثيل التشفير الثنائي الاتجاه الذي تم الحصول عليه من محول روبرتا.تمكنا من تحقيق درجة F1 متوسط قدرها 0.891 في بيانات الاختبار، مما يؤدي إلى المنصب الثاني في لوحة الاختبار.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا