ترغب بنشر مسار تعليمي؟ اضغط هنا

ما يجب التحقق منه: توجيه التحقق من التحقق من المعلومات جديرة بالتحقق في مقالات إخبارية من خلال هيكل خطاب جدلي

What to Fact-Check: Guiding Check-Worthy Information Detection in News Articles through Argumentative Discourse Structure

166   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تبدأ معظم الأساليب الموجودة لفحص الحقائق التلقائي مع قائمة مطالبات مسبقة للتحقق منها.نحن نبحث في المشكلة المفهمية لتحديد التصريحات في المقالات الإخبارية تستحق التحقق من الحقيقة.نبحث عن هيكل الوسيطة البالغ 95 مقالة إخبارية في مجال تغير المناخ الذي يتم فحصه من قبل علماء المناخ في ClimateFeedback.org.ونحن نفرج عن أول كائن مشروح متعدد الطبقات لكل من هيكل الخطاب الجدلي (أنواع الوسائط والعلاقات) وعلى البيانات التي تم فحصها في الواقع في المقالات الإخبارية.نناقش العلاقة بين هيكل الوسيطة وتستحق الاختيار البيانات وتطوير العديد من النماذج الأساسية للكشف عن البيانات التي تستحق الاختيار في مجال تغير المناخ.تظهر نتائجنا الأولية أن استخدام معلومات حول هيكل خطاب جدلي يظهر طفيفا ولكن تحسين إحصائيا على خط أساس من هيكل الخطاب المحلي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تمنح نماذج اللغة العصبية المدربة مسبقا أداء عال في مهام الاستدلال اللغوي (NLI).ولكن ما إذا كانوا يفهمون فعلا معنى التسلسلات المصنعة لا يزال غير واضح.نقترح جناح اختبار التشخيص الجديد الذي يسمح بتقييم ما إذا كانت مجموعة البيانات تشكل اختبارا جيدا لتقيي م النماذج معنى فهم القدرات.نحن على وجه التحديد تطبيق تحويلات الفساد التي تسيطر عليها إلى المعايير المستخدمة على نطاق واسع (MNLI و Anli)، والتي تنطوي على إزالة فئات الكلمات بأكملها وغالبا ما تؤدي إلى أزواج الجملة غير الحسية.إذا ظلت دقة النموذجية على البيانات التالفة مرتفعة، فمن المحتمل أن تحتوي مجموعة البيانات على تحيزات إحصائية ومصنوعات تصريفات توقع التنبؤ.عكسيا، يشير انخفاض كبير في الدقة النموذجية إلى أن مجموعة البيانات الأصلية توفر تحديا صحيحا لقدرات منطق النماذج.وبالتالي، يمكن أن تكون عناصر التحكم المقترحة لدينا بمثابة اختبار تحطم لتطوير بيانات عالية الجودة لمهام NLI.
توفر الجداول معرفة قيمة يمكن استخدامها للتحقق من العبارات النصية. في حين أن عددا من الأعمال قد نظر في التحقق من الحقائق القائم على الطاولة، فإن المحاذاة المباشرة للبيانات الجذابية مع الرموز في البيانات النصية نادرا ما توفرها. علاوة على ذلك، فإن تدريب نموذج التحقق من الحقائق المعممة يتطلب بيانات تدريبية ملصقة وفيرة. في هذه الورقة، نقترح نظام رواية لمعالجة هذه المشكلات. مستوحاة من السببية المتعددة، يحدد نظامنا من رجال الصمغ على مستوى الرمز في البيان مع تقدير البحار الذي يستند إلى التحقيق. يتيح تقدير Salience التعلم المعزز للتحقق من الحقائق من وجهات نظر. من منظور واحد، يقوم نظامنا بإجراء تنبؤ ممثن بالبرنامج المريح لتعزيز النموذج للمحاذاة والتفكير بين الطاولة والبيان. من المنظور الآخر، ينطبق نظامنا على توضيح تكبير البيانات الإدراك بالاستثناء لإنشاء مجموعة متنوعة من مثيلات التدريب عن طريق استبدال المصطلحات غير البارزة. تظهر النتائج التجريبية على Tabract التحسن الفعال من خلال تقنيات التعلم التي أدركها Carience المقترحة، مما يؤدي إلى أداء Sota الجديد على المعيار.
نقدم إطار منتقدي الممثل للحث على الهياكل الفرعية في مقال إخباري لمجموع خطاب الأخبار.يستخدم النموذج منتقدين متعددين يتصرفون وفقا لهياكل رشية معروفة بينما يهدف الممثل إلى تفوقها.تشكل هياكل المحتوى جمل تمثل حدود رائعة كامنة.ثم، نقدم شبكة عصا هرمية تستخد م الجمل الحدودية الرواعية المحددة إلى نموذج التفاعل متعدد المستويات بين الجمل والسلطة الفرعية والوثيقة.يظهر النتائج التجريبية والتحليلات في Corpiscours على أن نموذج الممثل يتعلم بتفصيل وثيقة بفعالية وثيقة إلى فرعية وتحسين أداء النموذج الهرمي في مهمة تنميط الخطاب الأخبار.
يشكل الاستخدام الواسع للإنترنت والنشر السريع للمعلومات التحدي المتمثل في تحديد صحة محتواه. اكتشف الكشف عن الموقف، الذي تعد مهمة التنبؤ بموقف نص فيما يتعلق بهدف محدد (سؤال المطالبة أو النقاش)، لتحديد صحة المعلومات في مهام مثل تصنيف الشائعات والكشف عن الأخبار المزيفة. في حين أن معظم الأعمال ومجموعات البيانات المتاحة للكشف عن الموقف يعالج النصوص القصيرة مقتطفات مستخرجة من الحوارات النصية، أو منصات وسائل التواصل الاجتماعي، أو عناوين الأخبار مع التركيز القوي على اللغة الإنجليزية، فهناك نقص في الموارد المستهدفة للنصوص الطويلة بلغات أخرى. مساهمتنا في هذه الورقة هي ذات شقين. أولا، نقدم مجموعة بيانات ألمانية من أسئلة النقاش والمقالات الإخبارية التي يتم تفاحها يدويا للكشف عن الموقف والعاطفة. ثانيا، نستفيد من مجموعة البيانات لمعالجة المهمة الخاضعة للإشراف على تصنيف موقف مقال إخباري فيما يتعلق بمسألة النقاش وتوفير نماذج خط الأساس كمرجع للعمل في المستقبل بشأن اكتشاف الموقف في المقالات الإخبارية الألمانية.
نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الور قة، نقوم بفاية استخدام الحل المقترح قد استخدمه هذه المطالبات غير الصحيحة حول ملخصات كرة السلة TEX-Tual في سياق مهمة بدقة في INLG 2021.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا