في هذه الورقة، نقدم Unifiedm2، وهو نموذج معلومات فعال للأغراض العامة نماذج مشتركة مجالات متعددة من المعلومات الخاطئة مع إعداد واحد موحد.يتم تدريب النموذج على التعامل مع أربع مهام: اكتشاف تحيز الأخبار، Clicbait، أخبار وهمية، والتحقق من الشائعات.من خلال تجميع هذه المهام معا، يتعلم Unifiedm2 تمثيلا أكثر ثراء من المعلومات الخاطئة، مما يؤدي إلى أداء أحدث أو أداء مماثل في جميع المهام.علاوة على ذلك، نوضح أن التمثيل الموحد الذي تم تعلمه هو مفيد لعدد قليل من التعلم لمهام / مجموعات البيانات / مجموعات التضليلات غير المرئية وتعميمات النموذج للأحداث غير المرئية.
In this paper, we introduce UnifiedM2, a general-purpose misinformation model that jointly models multiple domains of misinformation with a single, unified setup. The model is trained to handle four tasks: detecting news bias, clickbait, fake news, and verifying rumors. By grouping these tasks together, UnifiedM2 learns a richer representation of misinformation, which leads to state-of-the-art or comparable performance across all tasks. Furthermore, we demonstrate that UnifiedM2's learned representation is helpful for few-shot learning of unseen misinformation tasks/datasets and the model's generalizability to unseen events.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقدم شائعات ARCOV19، ومجموعة بيانات عربية Covid-19 Twitter للكشف عن المعلومات الخاطئة المؤلفة من تغريدات تحتوي على مطالبات من 27 يناير حتى نهاية أبريل 2020. قمنا بجمع 138 مطالبات تم التحقق منها، معظمها من مواقع التحقق من الحقائق الشعبي
نقدم مصنفات التعلم الآلية لتحديد المعلومات الخاطئة COVID-19 تلقائيا على وسائل التواصل الاجتماعي بثلاث لغات: الإنجليزية، البلغارية، والعربية.قمنا بمقارنة 4 نماذج تعليمية متعددة الأيتاكف لهذه المهمة ووجدت أن نموذج مدرب مع بيرت الإنجليزية يحقق أفضل النت
إن انفجار مقالات أخبار الصحة عبر الإنترنت يدير مخاطر انتشار المعلومات ذات الجودة المنخفضة.ضمن العمل الحالي بشأن فحص الحقائق، ومع ذلك، فقد تم إيلاء اهتمام كبير نسبيا للأخبار الطبية.نقدم مهمة تصنيف الأخبار الصحية لتحديد ما إذا كانت المواد الإخبارية الط
بصرف النظر عن نجاح نهج تعلم النطاق المختلط في مجال التعلم العميق لحل المهام المختلفة لمعالجة اللغة الطبيعية، فإنه لا يقرض حل جماعيا للكشف عن المعلومات الخاطئة من بيانات وسائل التواصل الاجتماعي CovID-19. نظرا للتعقيد المتأصل من هذا النوع من البيانات،
وقد رافق انتشار Covid-19 بمعلومات مفاجئة واسعة النطاق بشأن وسائل التواصل الاجتماعي.على وجه الخصوص، شهد Twittercrive زيادة كبيرة في نشر الحقائق والأرقام المشوهة.يهدف هذا العمل الحالي إلى تحديد تغريدات بشأن CovID-19 التي تحتوي على معلومات ضارة وخاطئة.ل