ترغب بنشر مسار تعليمي؟ اضغط هنا

التحقق من الحقائق القائم على الطاولة مع التعلم العلمي

Table-based Fact Verification With Salience-aware Learning

346   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توفر الجداول معرفة قيمة يمكن استخدامها للتحقق من العبارات النصية. في حين أن عددا من الأعمال قد نظر في التحقق من الحقائق القائم على الطاولة، فإن المحاذاة المباشرة للبيانات الجذابية مع الرموز في البيانات النصية نادرا ما توفرها. علاوة على ذلك، فإن تدريب نموذج التحقق من الحقائق المعممة يتطلب بيانات تدريبية ملصقة وفيرة. في هذه الورقة، نقترح نظام رواية لمعالجة هذه المشكلات. مستوحاة من السببية المتعددة، يحدد نظامنا من رجال الصمغ على مستوى الرمز في البيان مع تقدير البحار الذي يستند إلى التحقيق. يتيح تقدير Salience التعلم المعزز للتحقق من الحقائق من وجهات نظر. من منظور واحد، يقوم نظامنا بإجراء تنبؤ ممثن بالبرنامج المريح لتعزيز النموذج للمحاذاة والتفكير بين الطاولة والبيان. من المنظور الآخر، ينطبق نظامنا على توضيح تكبير البيانات الإدراك بالاستثناء لإنشاء مجموعة متنوعة من مثيلات التدريب عن طريق استبدال المصطلحات غير البارزة. تظهر النتائج التجريبية على Tabract التحسن الفعال من خلال تقنيات التعلم التي أدركها Carience المقترحة، مما يؤدي إلى أداء Sota الجديد على المعيار.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تهدف مهمة التحقق من الحقائق القائمة على الطاولة إلى التحقق مما إذا كان البيان المحدد مدعوم من الجدول شبه المنظم المحدد. يلعب المنطق الرمزي مع العمليات المنطقية دورا حاسما في هذه المهمة. الأساليب الحالية الاستفادة من البرامج التي تحتوي على معلومات منط قية غنية لتعزيز عملية التحقق. ومع ذلك، نظرا لعدم وجود إشارات خاضعة للإشراف بالكامل في عملية توليد البرنامج، يمكن استخلاص البرامج الزائفة وعملها، مما يؤدي إلى عدم قدرة النموذج على العمليات المنطقية المفيدة. لمعالجة المشكلات المذكورة أعلاه، في هذا العمل، نقوم بصياغة مهمة التحقق من الحقائق القائمة على الطاولة كإطار لاسترجاع الأدلة والتفكير، حيث اقترح شبكة التحقق من الأدلة على مستوى المنطق وشبكة التحقق القائمة على الرسم البياني (LERGV). على وجه التحديد، نقوم أولا باسترجئة الأدلة التي تشبه البرامج على مستوى المنطق من الجدول المعطى والبيان كدليل تكميلي على الطاولة. بعد ذلك، نقوم بإنشاء رسم بياني لمستوى منطقي لالتقاط العلاقات المنطقية بين الكيانات والوظائف في الأدلة المستردة، وتصميم شبكة التحقق القائمة على الرسم البياني لإجراء المنطق المستندة إلى الرسم البياني على مستوى المنطق بناء على الرسم البياني الذي تم إنشاؤه لتصنيف النهائي علاقة استقامة. النتائج التجريبية على Tabract Tabract القياسي على نطاق واسع تظهر فعالية النهج المقترح.
في هذه الورقة، نقترح نظام التحقق والتحقق من حقائق جديدة للتحقق من مطالبات محتوى ويكيبيديا.يسترد نظامنا صفحات ويكيبيديا ذات الصلة باستخدام Anserini، ويستخدم نموذج الإجابة على السؤال من Bert-Bert-bert-Berted لتحديد الأدلة الصحيحة، وتحقق من المطالبات با ستخدام نموذج الاستدلال باللغة الطبيعية XLNet بمقارنتها بالأدلة.يتم الحصول على أدلة خلية الجدول من خلال البحث عن قيم الخلايا المطابقة للكيان وسؤال الجدول Tapas نموذج الرد على نموذج.يستخدم خط الأنابيب إمكانيات الطلقة الصفرية للنماذج الحالية وجميع النماذج المستخدمة في خط الأنابيب لا يتطلب أي تدريب إضافي.حصل نظامنا على درجة حمامة من 0.06 ودقة ملصقة تبلغ 0.39 في التحدي الحمير.
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب يبنا في SCIFACT، وهي مجموعة بيانات مفيدة حديثا تتطلب نماذج لا تتوقع فقط عن صحة المطالبات ولكنها توفر أيضا جمل ذات صلة من كائن من الأدبيات العلمية التي تدعم التنبؤ.تجريبيا، يتفوق نظامنا على خط أساس قوي في كل من المهام الفرعية الثلاث.نعرض أيضا قدرة Vert5erini على التعميم لمجموعات بيانات جديدة من مطالبات CovID-19 باستخدام أدلة من Cord-19 Corpus.
لا يزال تقييم التلخيص مشكلة بحث مفتوحة: من المعروف أن المقاييس الحالية مثل الحمر محدودة وربطها بشكل سيء بأحكام بشرية.لتخفيف هذه المسألة، اقترحت العمل الحديث مقاييس التقييم التي تعتمد على الأسئلة في الإجابة على النماذج لتقييم ما إذا كان الملخص يحتوي ع لى جميع المعلومات ذات الصلة في وثيقتها المصدر.على الرغم من الواعدة، إلا أن النهج المقترحة فشلت حتى الآن في الارتباط بشكل أفضل من الحمر بأحكام بشرية.في هذه الورقة، نقدم النهج السابقة واقتراح إطار موحد، يدعى Questeval.على عكس مقاييس ثابتة مثل Rouge أو Bertscore، لا يتطلب Questeval أي مرجع حقيقي في الحقيقة.ومع ذلك، فإن Questeval يحسن بشكل كبير من الارتباط بالأحكام البشرية على أربع أبعاد تقييم (الاتساق والتماسك والطلاقة والأهمية)، كما هو مبين في تجارب واسعة النطاق.
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا لتحقق من الحقائق وأدلة العثور على بيانات جدولية في الوثائق العلمية (حقائق SEM-Tab-Facts). تحتوي DataSet الخاصة بنا على 981 طاولة تم إنشاؤها يدويا وحدات بيانات تم إنشاؤها تلقائيا من 1980 طاولة توفر أكثر من 180 كيلو وايت وأكثر من 16 متر من التعليقات التوضيحية. ظهرت حقائق SEM-Tab مهام فرعية. في مهمة فرعية أ، كان الهدف هو تحديد ما إذا كان بيان مدعوم أو دحض أو غير معروف فيما يتعلق بجدول. في المهمة الفرعية B، كان التركيز على تحديد الخلايا المحددة للطاولة التي توفر أدلة على البيان. 69 وقعت فرق للمشاركة في المهمة مع 19 تقارير ناجحة إلى الفرعية و 12 من عروض ناجحة إلى Subtask B. نقدم نتائجنا والنتائج الرئيسية من المسابقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا