ترغب بنشر مسار تعليمي؟ اضغط هنا

Volta في Semeval-2021 المهمة 9: بيان التحقق والأدلة التي تجد مع الجداول باستخدام Tapas ونقل التعلم

Volta at SemEval-2021 Task 9: Statement Verification and Evidence Finding with Tables using TAPAS and Transfer Learning

334   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البيان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في الآونة الأخيرة، كان هناك مصلحة في البحث عن التحقق من الواقع والتنبؤ على البيانات المنظمة مثل الجداول والرسوم البيانية. للتحايل على أي حادث أخبار كاذبة، من الضروري عدم النموذج والتنبؤ فقط على البيانات المنظمة بكفاءة ولكن أيضا لشرح تلك التنبؤات. في هذه الورقة، كجزء من مهمة SEMEVAL-2021 9، نتعامل مع مشكلة التحقق من الحقائق وأدلة العثور على بيانات جدولية. هناك نوعان فرعي، حيث نظأ طاولة وبيان / حقيقة، يتمثل الترجمة الفرعية في تحديد ما إذا كان البيان استنتجا من البيانات الجدولية، ويقوم SubTask B بتحديد الخلايا الموجودة في الجدول تقديم أدلة على التراكب الفرعي السابق. نحن نقدم مقارنة بين خطوط الأساس وحالة النهج الفنية على مجموعة بيانات Semtabfact المعينة. نقترح أيضا نهج رواية Cellbert لحل مهمة العثور على الأدلة، كشكل من أشكال مهمة الاستدلال باللغة الطبيعية. نحصل على درجة F1 ذات الاتجاهين من 0.69 على التراكب الفرعي ونتيجة F1 من 0.65 على التراكب الفرعي B.
تصف هذه الورقة نهجنا للمهمة 9 من Semeval 2021: التحقق من البيان وإصدار الأدلة مع الجداول.شاركنا في كل من المجموعات الفرعية، أي بيان التحقق من البيان وإيجاد الأدلة.بالنسبة إلى المراكز الفرعية للتحقق من العبارات، نقوم بتوسيع نموذج Tapas للتكيف مع فئة ا لبيانات المجهولة من خلال Finet Inetuning عليه في إصدار معدات من بيانات المهمة.للحصول على الترجمة الفرعية للنتيجة الأدلة، نحن Finetune نموذج التوريد في إعداد سيامي.
نقدم مساهمة التاباس في المهمة المشتركة بشأن التحقق من البيان وإيجاد الأدلة مع الجداول (مهمة Semeval 2021 9، وانغ وآخرون (2021)). مهمة SEM Tab Factor Task A هي مهمة التصنيف بالاعتراف إذا تم إيصال بيان أو محايد أو دحض بمحتوى جدول معين. نعتمد نموذج تابا س ثنائي من Eisenschlos et al. (2020) لهذه المهمة. نحن نتعلم نماذج تصنيف ثنائية: نموذج أول للتنبؤ إذا كان عبارة محايدة أو غير محايدة وثانية واحدة للتنبؤ إذا كانت مستلمة أو دحض. نظرا لأن مجموعة التدريب المهمة المشتركة تحتوي فقط على أمثلة مستلمة أو دحض، فإننا نولد أمثلة محايدة اصطناعية لتدريب النموذج الأول. يتم تدريب كلا النموذجين مسبقا باستخدام بيانات Masklm موضوعية ومكافحة موظفة واصطناعية (Eisenschlos et al.، 2020) و Tabact (Chen et al.، 2020)، مجموعة بيانات استيابية طاولة كبيرة. نجد أن الأمثلة المحايدة الاصطناعية فعالة إلى حد ما في تدريب النموذج الأول، وتحقيق 68.03 اختبار F1 مقابل 60.47 من خط الأساس الأغلبية. في المرحلة الثانية، نجد أن التدريب المسبق على البيانات الوسيطة وتطويط التحمل يحسن النتائج عبر Masklm قبل التدريب (68.03 مقابل 57.01).
تصف هذه الورقة النظام المقدم في التحقق من البيان SEMEVAL-2021 وإصدار الأدلة مع الجداول المهمة.يعتمد النظام على جيل المرشح للنماذج المنطقية على الجدول بناء على مطابقة الكلمات الرئيسية وتحليل التبعية في بيانات المطالبة.
تعد فهم الجداول مهمة مهمة وذات صلة تتضمن فهم بنية الجدول وكذلك القدرة على مقارنة ومعلومات التباين داخل الخلايا. في هذه الورقة، نتعامل مع هذا التحدي من خلال تقديم مجموعة بيانات جديدة ومهام جديدة تعالج هذا الهدف في مهمة مشتركة في مهمة Semeval 2020 9: ا لتحقق من الحقائق وأدلة العثور على بيانات جدولية في الوثائق العلمية (حقائق SEM-Tab-Facts). تحتوي DataSet الخاصة بنا على 981 طاولة تم إنشاؤها يدويا وحدات بيانات تم إنشاؤها تلقائيا من 1980 طاولة توفر أكثر من 180 كيلو وايت وأكثر من 16 متر من التعليقات التوضيحية. ظهرت حقائق SEM-Tab مهام فرعية. في مهمة فرعية أ، كان الهدف هو تحديد ما إذا كان بيان مدعوم أو دحض أو غير معروف فيما يتعلق بجدول. في المهمة الفرعية B، كان التركيز على تحديد الخلايا المحددة للطاولة التي توفر أدلة على البيان. 69 وقعت فرق للمشاركة في المهمة مع 19 تقارير ناجحة إلى الفرعية و 12 من عروض ناجحة إلى Subtask B. نقدم نتائجنا والنتائج الرئيسية من المسابقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا