ترغب بنشر مسار تعليمي؟ اضغط هنا

SEMEVAL-2021 المهمة 9: التحقق من الحقائق وأدلة العثور على البيانات الجدولة في المستندات العلمية (حقائق SEM-Tab)

SemEval-2021 Task 9: Fact Verification and Evidence Finding for Tabular Data in Scientific Documents (SEM-TAB-FACTS)

339   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: التحقق من الحقائق وأدلة العثور على بيانات جدولية في الوثائق العلمية (حقائق SEM-Tab-Facts). تحتوي DataSet الخاصة بنا على 981 طاولة تم إنشاؤها يدويا وحدات بيانات تم إنشاؤها تلقائيا من 1980 طاولة توفر أكثر من 180 كيلو وايت وأكثر من 16 متر من التعليقات التوضيحية. ظهرت حقائق SEM-Tab مهام فرعية. في مهمة فرعية أ، كان الهدف هو تحديد ما إذا كان بيان مدعوم أو دحض أو غير معروف فيما يتعلق بجدول. في المهمة الفرعية B، كان التركيز على تحديد الخلايا المحددة للطاولة التي توفر أدلة على البيان. 69 وقعت فرق للمشاركة في المهمة مع 19 تقارير ناجحة إلى الفرعية و 12 من عروض ناجحة إلى Subtask B. نقدم نتائجنا والنتائج الرئيسية من المسابقة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في الآونة الأخيرة، كان هناك مصلحة في البحث عن التحقق من الواقع والتنبؤ على البيانات المنظمة مثل الجداول والرسوم البيانية. للتحايل على أي حادث أخبار كاذبة، من الضروري عدم النموذج والتنبؤ فقط على البيانات المنظمة بكفاءة ولكن أيضا لشرح تلك التنبؤات. في هذه الورقة، كجزء من مهمة SEMEVAL-2021 9، نتعامل مع مشكلة التحقق من الحقائق وأدلة العثور على بيانات جدولية. هناك نوعان فرعي، حيث نظأ طاولة وبيان / حقيقة، يتمثل الترجمة الفرعية في تحديد ما إذا كان البيان استنتجا من البيانات الجدولية، ويقوم SubTask B بتحديد الخلايا الموجودة في الجدول تقديم أدلة على التراكب الفرعي السابق. نحن نقدم مقارنة بين خطوط الأساس وحالة النهج الفنية على مجموعة بيانات Semtabfact المعينة. نقترح أيضا نهج رواية Cellbert لحل مهمة العثور على الأدلة، كشكل من أشكال مهمة الاستدلال باللغة الطبيعية. نحصل على درجة F1 ذات الاتجاهين من 0.69 على التراكب الفرعي ونتيجة F1 من 0.65 على التراكب الفرعي B.
تصف هذه الورقة النظام المقدم في التحقق من البيان SEMEVAL-2021 وإصدار الأدلة مع الجداول المهمة.يعتمد النظام على جيل المرشح للنماذج المنطقية على الجدول بناء على مطابقة الكلمات الرئيسية وتحليل التبعية في بيانات المطالبة.
يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البي ان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.
تصف هذه الورقة نهجنا للمهمة 9 من Semeval 2021: التحقق من البيان وإصدار الأدلة مع الجداول.شاركنا في كل من المجموعات الفرعية، أي بيان التحقق من البيان وإيجاد الأدلة.بالنسبة إلى المراكز الفرعية للتحقق من العبارات، نقوم بتوسيع نموذج Tapas للتكيف مع فئة ا لبيانات المجهولة من خلال Finet Inetuning عليه في إصدار معدات من بيانات المهمة.للحصول على الترجمة الفرعية للنتيجة الأدلة، نحن Finetune نموذج التوريد في إعداد سيامي.
تصف هذه الورقة نظامنا للتحقق من العبارات مع الجداول في مهمة Semeval-2021 9. قمنا بتطوير نظام للتحقق من مرحلتين يعتمد على أحدث طراز Grappa المدرب مسبقا على الطاولة.يتم وضع شبكات متعددة للتحقق من أنواع مختلفة من العبارات في DataSet المسابقة وتطبق تقنية تكيفية نموذجية نموذجية على نماذج الفرقة في كلتا المراحل.يتم استخدام وحدة عملية تشغيل رمزية قائمة على البيان في نظامنا في نظامنا لتعزيز أداء النظام واستقراره.يحقق نموذجنا المركز الثاني في التصنيف ثلاثي الاتجاه والمركز الرابع في تقييم التصنيف الثاني في الاتجاه.تظهر العديد من التجارب الاجتثاث فعالية الوحدات المختلفة المقترحة في هذه الورقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا