تبدأ معظم الأساليب الموجودة لفحص الحقائق التلقائي مع قائمة مطالبات مسبقة للتحقق منها.نحن نبحث في المشكلة المفهمية لتحديد التصريحات في المقالات الإخبارية تستحق التحقق من الحقيقة.نبحث عن هيكل الوسيطة البالغ 95 مقالة إخبارية في مجال تغير المناخ الذي يتم فحصه من قبل علماء المناخ في ClimateFeedback.org.ونحن نفرج عن أول كائن مشروح متعدد الطبقات لكل من هيكل الخطاب الجدلي (أنواع الوسائط والعلاقات) وعلى البيانات التي تم فحصها في الواقع في المقالات الإخبارية.نناقش العلاقة بين هيكل الوسيطة وتستحق الاختيار البيانات وتطوير العديد من النماذج الأساسية للكشف عن البيانات التي تستحق الاختيار في مجال تغير المناخ.تظهر نتائجنا الأولية أن استخدام معلومات حول هيكل خطاب جدلي يظهر طفيفا ولكن تحسين إحصائيا على خط أساس من هيكل الخطاب المحلي.
Most existing methods for automatic fact-checking start with a precompiled list of claims to verify. We investigate the understudied problem of determining what statements in news articles are worthy to fact-check. We annotate the argument structure of 95 news articles in the climate change domain that are fact-checked by climate scientists at climatefeedback.org. We release the first multi-layer annotated corpus for both argumentative discourse structure (argument types and relations) and for fact-checked statements in news articles. We discuss the connection between argument structure and check-worthy statements and develop several baseline models for detecting check-worthy statements in the climate change domain. Our preliminary results show that using information about argumentative discourse structure shows slight but statistically significant improvement over a baseline of local discourse structure.
المراجع المستخدمة
https://aclanthology.org/
تمنح نماذج اللغة العصبية المدربة مسبقا أداء عال في مهام الاستدلال اللغوي (NLI).ولكن ما إذا كانوا يفهمون فعلا معنى التسلسلات المصنعة لا يزال غير واضح.نقترح جناح اختبار التشخيص الجديد الذي يسمح بتقييم ما إذا كانت مجموعة البيانات تشكل اختبارا جيدا لتقيي
توفر الجداول معرفة قيمة يمكن استخدامها للتحقق من العبارات النصية. في حين أن عددا من الأعمال قد نظر في التحقق من الحقائق القائم على الطاولة، فإن المحاذاة المباشرة للبيانات الجذابية مع الرموز في البيانات النصية نادرا ما توفرها. علاوة على ذلك، فإن تدريب
نقدم إطار منتقدي الممثل للحث على الهياكل الفرعية في مقال إخباري لمجموع خطاب الأخبار.يستخدم النموذج منتقدين متعددين يتصرفون وفقا لهياكل رشية معروفة بينما يهدف الممثل إلى تفوقها.تشكل هياكل المحتوى جمل تمثل حدود رائعة كامنة.ثم، نقدم شبكة عصا هرمية تستخد
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن
نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الور