ترغب بنشر مسار تعليمي؟ اضغط هنا

الجمع بين الجملة والأدلة الجدولية للتنبؤ بالكثير من المطالبات الواقعية باستخدام Tapas and Roberta

Combining sentence and table evidence to predict veracity of factual claims using TaPaS and RoBERTa

186   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة طريقة لاسترداد الأدلة والتنبؤ بعثور على مزاعم واقعية، على مجموعة البيانات المحمولة.تتكون الأدلة من كل من الجمل وخلايا الطاولة.الطريقة المقترحة هي جزء من المهمة المشتركة للحمى.يستخدم درجات التشابه بين متجهات TF-IDF لاسترداد الأدلة النصية ودرجات التشابه بين ناقلات كثيفة التي تم إنشاؤها بواسطة نماذج Tapas التي تم ضبطها بشكل جيد لاسترجاع الأدلة الجدولية.يتم تمرير الأدلة من خلال شبكة عصبية كثيفة لإنتاج تسمية صحية.النتيجة الحميرة للنظام المقترح 0.126.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البي ان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.
في هذه الورقة، نقترح طريقة لاستدادتها معلومات جملة المعلومات ومعلومات تردد الكلمات الخاصة بمهمة التعقيد ذات التعقيد 1-LCP (LCP). في نظامنا، تأتي معلومات الجملة من نموذج روبرتا، وتأتي معلومات تردد الكلمات من خوارزمية TF-IDF. استخدم Black Block كطبقة م شتركة لتعلم العقوبة ومعلومات تردد الكلمات وصفنا تنفيذ أفضل نظامنا وناقش أساليبنا وتجاربنا في المهمة. تنقسم المهمة المشتركة إلى مهمتين فرعيتين. الهدف من المهام الفرعية هو التنبؤ بعقد كلمة محددة سلفا. تنقسم المهمة المشتركة إلى قسمين فرعيين. الهدف من اثنين من المهن الفرعية هو التنبؤ بعقد كلمة محددة سلفا. مؤشر تقييم المهمة هو معامل الارتباط بيرسون. يحتوي أفضل نظام الأداء لدينا على معاملات ارتباط بيرسون من 0.7434 و 0.8000 في مجموعة اختبار المراكز الفرعية ذات الرمز الفرعي واحد ومجموعة اختبار الترجمة الفرعية متعددة رميات، على التوالي.
نقترح نموذج تسلسل متعدد التسلسل للمحولات للتعرف على الكلام التلقائي (ASR) قادر على نسخ الصوت التلقائي (ASR) من نسخ الصوت في وقت واحد والشروحة مع المعلومات اللغوية مثل النصوص الصوتية أو علامات جزء من الكلام (POS). نظرا لأن المعلومات اللغوية مهمة في مع الجة اللغة الطبيعية (NLP)، فإن ASR المقترح مفيد بشكل خاص لتطبيقات واجهة الكلام، بما في ذلك أنظمة الحوار المنطوقة والترجمة الكلامية، والتي تجمع بين ASR و NLP. لإنتاج التعليقات التوضيحية اللغوية، ندرب نظام ASR باستخدام أهداف تدريبية معدلة: يتبع كل وحدة جرفية أو متعددة الجرافيم في النص المستهدف تسلسل صوت محاذاة و / أو علامة نقاط البيع. نظرا لأن طريقتنا قد تمكن من الوصول إلى البيانات الصوتية الأساسية، فيمكننا تقدير التعليقات التوضيحية اللغوية بشكل أكثر دقة من نهج خطوط الأنابيب التي يتم فيها تطبيق الأساليب القائم على NLP على نص ASR الفرضية. تظهر النتائج التجريبية على مجموعات البيانات اليابانية والإنجليزية أن نظام ASR المقترح قادر على إنتاج نسخ عالية الجودة في وقت واحد والشروح اللغوية.
إن التنبؤ بمستوى تعقيد كلمة أو عبارة تعتبر مهمة صعبة.يتم التعرف عليه حتى كخطوة حاسمة في العديد من تطبيقات NLP، مثل إعادة ترتيب النصوص ومبسط النص.تعامل البحث المبكر المهمة بمثابة مهمة تصنيف ثنائية، حيث توقعت النظم وجود تعقيد كلمة (معقد مقابل غير معقدة ).تم تصميم دراسات أخرى لتقييم مستوى تعقيد الكلمات باستخدام نماذج الانحدار أو نماذج تصنيف الوسائط المتعددة.تظهر نماذج التعلم العميق تحسنا كبيرا على نماذج تعلم الآلات مع صعود تعلم التحويل ونماذج اللغة المدربة مسبقا.تقدم هذه الورقة نهجنا الذي فاز في المرتبة الأولى في المهمة السامية 1 (Sub STASK1).لقد حسبنا درجة تعقيد كلمة من 0-1 داخل النص.لقد تم تصنيفنا في المرتبة الأولى في المسابقة باستخدام نماذج اللغة المدربة مسبقا بيرت روبرتا، مع درجة ارتباط بيرسون من 0.788.
لقد أثبتت التعلم المناهج الدراسية، وهي استراتيجية تدريب الآلة التي تغذي حالات التدريب على النموذج من سهولة الصعب، لتسهيل مهمة توليد الحوار. وفي الوقت نفسه، يمكن أن تسفر عن طريقة تقطير المعرفة، منهجية تحويل المعرفة بين المعلمين وشبكات الطلاب دفعة كبير ة من الأداء لنماذج الطلاب. وبالتالي، في هذه الورقة، نقدم مجموعة من التعلم من المناهج الدراسية وتقطير المعرفة لنماذج جيل الحوار الفعالة، حيث يمكن أن يساعد تعلم المناهج الدراسية في تقطير المعارف من جوانب البيانات والنموذج. للبدء، من جانب البيانات، نقوم بتجميع حالات التدريب وفقا لتعقيدها، والتي تحسبها أنواع مختلفة من الميزات مثل طول الجملة والتماسك بين أزواج الحوار. علاوة على ذلك، فإننا نوظف استراتيجية تدريبية عدائية لتحديد تعقيد الحالات من مستوى النموذج. الحدس هو أنه، إذا كان بإمكان التمييز أن يخبر الاستجابة الناتجة عن المعلم أو الطالب، فسيكون الأمر من الصعب على الحالة أن نموذج الطالب لم يتكيف حتى الآن. أخيرا، نستخدم التعلم الذاتي، وهو امتداد لتعلم المناهج الدراسية لتعيين الأوزان لتقطير. في الختام، نقوم بترتيب منهج هرمي يستند إلى الجوانب المذكورة أعلاه لنموذج الطالب بموجب الإرشاد من نموذج المعلم. توضح النتائج التجريبية أن أساليبنا تحقق تحسينات مقارنة مع خطوط الأساس التنافسية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا