ترغب بنشر مسار تعليمي؟ اضغط هنا

التحقق التلقائي من ملخصات البيانات

Automatic Verification of Data Summaries

434   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم طريقة عامة لحساب الدقة الملحة لتخفيف البيانات الناتجة عن الحد الأدنى من جهود المستخدم.نحن ننظر إلى Prob-Lem كهامة لفحص الحقائق للتحقق من مطالبات NU-Merical في النص.يفترض التحقق من Gorithm أن البيانات المستخدمة في الحصول على النص متاح.في هذه الورقة، نقوم بفاية استخدام الحل المقترح قد استخدمه هذه المطالبات غير الصحيحة حول ملخصات كرة السلة TEX-Tual في سياق مهمة بدقة في INLG 2021.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تمنح نماذج اللغة العصبية المدربة مسبقا أداء عال في مهام الاستدلال اللغوي (NLI).ولكن ما إذا كانوا يفهمون فعلا معنى التسلسلات المصنعة لا يزال غير واضح.نقترح جناح اختبار التشخيص الجديد الذي يسمح بتقييم ما إذا كانت مجموعة البيانات تشكل اختبارا جيدا لتقيي م النماذج معنى فهم القدرات.نحن على وجه التحديد تطبيق تحويلات الفساد التي تسيطر عليها إلى المعايير المستخدمة على نطاق واسع (MNLI و Anli)، والتي تنطوي على إزالة فئات الكلمات بأكملها وغالبا ما تؤدي إلى أزواج الجملة غير الحسية.إذا ظلت دقة النموذجية على البيانات التالفة مرتفعة، فمن المحتمل أن تحتوي مجموعة البيانات على تحيزات إحصائية ومصنوعات تصريفات توقع التنبؤ.عكسيا، يشير انخفاض كبير في الدقة النموذجية إلى أن مجموعة البيانات الأصلية توفر تحديا صحيحا لقدرات منطق النماذج.وبالتالي، يمكن أن تكون عناصر التحكم المقترحة لدينا بمثابة اختبار تحطم لتطوير بيانات عالية الجودة لمهام NLI.
لعقود من الزمن، اعتمدت البحوث المنشورة في مجال التحقق الآلي من صحة التواقيع على استخدام مجموعة خصائص واحدة. اختار بعض الباحثين مجموعة الخصائص هذه اعتماداً على خبرتهم في هذا المجال، و اختارها آخرون اعتماداً على خوارزميات انتقاء الخصائص التي تستطيع اخت يار أفضل مجموعة خصائص. في الأنظمة العملية، يمكن أن تحتوي وثائق التواقيع ضجيجاً، و يمكن أن يكون تعرف كاتب الشيك مطلوباً في الحسابات التي يوقع شيكاتها أكثر من شخص. و نظراً إلى انخفاض مستوى أداء النظام الناتج عن مثل هذه المتطلبات، يصبح تحسين أداء نظام التحقق من صحة التواقيع ضرورة. تعرض ورقة البحث هذه تقنية جديدة لاتخاذ القرار بالاعتماد على عدة مجموعات خصائص بدلاً من واحدة فقط. و قد أظهرت النتائج التجريبية أن التقنية الجديدة تعطي تحسيناً مهماً في القدرة على كشف التزوير، و في الأداء العام للنظام.
تلخص هذه الورقة محاولة ارتكبناها لتلبية تحدي مهمة مشتركة بشأن ملخصات التأريض التي تم إنشاؤها بواسطة الجهاز في مباريات NBA (https://github.com/ehudreiter//accuracysharedtsask.git).في النصف الأول، نناقش الأساليب وفي الثانية، نبلغ عن النتائج، جنبا إلى ج نب مع مناقشة حول ميزة ما قد يكون لها تأثير على الأداء.
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا لتحقق من الحقائق وأدلة العثور على بيانات جدولية في الوثائق العلمية (حقائق SEM-Tab-Facts). تحتوي DataSet الخاصة بنا على 981 طاولة تم إنشاؤها يدويا وحدات بيانات تم إنشاؤها تلقائيا من 1980 طاولة توفر أكثر من 180 كيلو وايت وأكثر من 16 متر من التعليقات التوضيحية. ظهرت حقائق SEM-Tab مهام فرعية. في مهمة فرعية أ، كان الهدف هو تحديد ما إذا كان بيان مدعوم أو دحض أو غير معروف فيما يتعلق بجدول. في المهمة الفرعية B، كان التركيز على تحديد الخلايا المحددة للطاولة التي توفر أدلة على البيان. 69 وقعت فرق للمشاركة في المهمة مع 19 تقارير ناجحة إلى الفرعية و 12 من عروض ناجحة إلى Subtask B. نقدم نتائجنا والنتائج الرئيسية من المسابقة.
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب يبنا في SCIFACT، وهي مجموعة بيانات مفيدة حديثا تتطلب نماذج لا تتوقع فقط عن صحة المطالبات ولكنها توفر أيضا جمل ذات صلة من كائن من الأدبيات العلمية التي تدعم التنبؤ.تجريبيا، يتفوق نظامنا على خط أساس قوي في كل من المهام الفرعية الثلاث.نعرض أيضا قدرة Vert5erini على التعميم لمجموعات بيانات جديدة من مطالبات CovID-19 باستخدام أدلة من Cord-19 Corpus.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا