نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الورقة، نقوم بفاية استخدام الحل المقترح قد استخدمه هذه المطالبات غير الصحيحة حول ملخصات كرة السلة TEX-Tual في سياق مهمة بدقة في INLG 2021.
We present a generic method to compute thefactual accuracy of a generated data summarywith minimal user effort. We look at the prob-lem as a fact-checking task to verify the nu-merical claims in the text. The verification al-gorithm assumes that the data used to generatethe text is available. In this paper, we describehow the proposed solution has been used toidentify incorrect claims about basketball tex-tual summaries in the context of the AccuracyShared Task at INLG 2021.
المراجع المستخدمة
https://aclanthology.org/
تمنح نماذج اللغة العصبية المدربة مسبقا أداء عال في مهام الاستدلال اللغوي (NLI).ولكن ما إذا كانوا يفهمون فعلا معنى التسلسلات المصنعة لا يزال غير واضح.نقترح جناح اختبار التشخيص الجديد الذي يسمح بتقييم ما إذا كانت مجموعة البيانات تشكل اختبارا جيدا لتقيي
لعقود من الزمن، اعتمدت البحوث المنشورة في مجال التحقق الآلي من صحة التواقيع على استخدام مجموعة خصائص واحدة. اختار بعض الباحثين مجموعة الخصائص هذه اعتماداً على خبرتهم في هذا المجال، و اختارها آخرون اعتماداً على خوارزميات انتقاء الخصائص التي تستطيع اخت
تلخص هذه الورقة محاولة ارتكبناها لتلبية تحدي مهمة مشتركة بشأن ملخصات التأريض التي تم إنشاؤها بواسطة الجهاز في مباريات NBA (https://github.com/ehudreiter//accuracysharedtsask.git).في النصف الأول، نناقش الأساليب وفي الثانية، نبلغ عن النتائج، جنبا إلى ج
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب