ترغب بنشر مسار تعليمي؟ اضغط هنا

مجردة، الأساس المنطقي، الموقف: نموذج مشترك للتحقق من المطالبة العلمية

Abstract, Rationale, Stance: A Joint Model for Scientific Claim Verification

365   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يمكن أن يساعد التحقق من المطالبات العلمية الباحثون على العثور بسهولة على الأوراق العلمية المستهدفة مع أدلة الجملة من كوربوس كبيرة للمطالبة المعينة.تقترح بعض الأعمال الموجودة نماذج خطوط الأنابيب على المهام الثلاث من استرجاع مجردة، اختيار الأساس المنطقي والتنبؤ بالموقف.مثل هذه الأعمال لها مشاكل انتشار الأخطاء بين الوحدات النمطية في خط الأنابيب ونقص مشاركة المعلومات القيمة بين الوحدات النمطية.وبالتالي، نقترح نهجا، سميت باسم Arsjoint، والتي تتعلم بالاشتراك الوحدات المهام الثلاثة ذات الإطار الفهم لقراءة الآلة من خلال إدراج معلومات المطالبة.بالإضافة إلى ذلك، نحن نعزز تبادل المعلومات والقيود بين المهام من خلال اقتراح مصطلح تنظيمي بين درجات انتباه الجملة من استرجاع الملخص والمخرجات المقدرة من الاختيار العقلاني.تظهر النتائج التجريبية على DataSet Benchmark Scifact أن نهجنا يتفوق على الأعمال الحالية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه المقالة البحث عن التحقق من المطالبة المنفذة باستخدام نموذج متعدد القائم على GAN.يتكون النموذج المقترح من ثلاثة أزواج من المولدات والتمييز.المولد والأزواج التمييزية مسؤولة عن توليد البيانات الاصطناعية للمطالبات المدعومة والمطالبة الدوحدة وتسم يات المطالبة.يتم توفير مناقشة نظرية حول النموذج المقترح للتحقق من صحة حالة التوازن للنموذج.يتم تطبيق النموذج المقترح على مجموعة بيانات الحمى، يتم استخدام نموذج لغة مدرب مسبقا لبيانات نص الإدخال.تساعد البيانات التي تم إنشاؤها بشكل شبكي على الحصول على معلومات تعمل على تحسين أداء التصنيف فوق خطوط الأساس الفنية.عشر درجات F1 المعنية بعد تطبيق الأسلوب المقترح في Fever 1.0 ومجموعات بيانات Fever 2.0 هي 0.65 + -0.018 و 0.65 + -0.051.
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.
يصف هذا العمل تكيف نموذج تسلسل متطلب مسبقا بمهمة التحقق من المطالبة العلمية في المجال الطبي الطبيعي.نقترح نظام يسمى Vert5erini الذي يستغل T5 لاسترجاع الملخص واختيار الجملة وتنبؤ التسمية، وهي ثلاثة مهام فرعية حرجة للتحقق من الادعاء.نقوم بتقييم خط أناب يبنا في SCIFACT، وهي مجموعة بيانات مفيدة حديثا تتطلب نماذج لا تتوقع فقط عن صحة المطالبات ولكنها توفر أيضا جمل ذات صلة من كائن من الأدبيات العلمية التي تدعم التنبؤ.تجريبيا، يتفوق نظامنا على خط أساس قوي في كل من المهام الفرعية الثلاث.نعرض أيضا قدرة Vert5erini على التعميم لمجموعات بيانات جديدة من مطالبات CovID-19 باستخدام أدلة من Cord-19 Corpus.
تكتسب توضيحات اللغة الطبيعية (NL) من التنبؤات النموذجية شعبية كوسيلة لفهم القرارات والتحقق منها من قبل النماذج المدربة مسبقا كبيرة من الصندوق الأسود، للمهام مثل الإجابة على الأسئلة (QA) والتحقق من الحقائق. مؤخرا، أثبتت التسلسل المدرب مسبقا إلى نماذج التسلسل (SEQ2SEQ) أن تكون فعالة للغاية في اتخاذ التنبؤ المشترك، بالإضافة إلى توليد تفسيرات NL. ومع ذلك، هذه النماذج لديها العديد من أوجه القصور؛ يمكنهم تصنيع توضيحات حتى بالنسبة للتنبؤات غير الصحيحة، فمن الصعب التكيف مع مستندات الإدخال الطويلة، وتتدرب تدريبها كمية كبيرة من البيانات المسمى. في هذه الورقة، نطور FID-EX، والتي تعالج هذه العيوب لنماذج SEQ2SeQ بقلم: 1) إدخال علامات جملة للقضاء على تلفيق التفسير من خلال تشجيع الجيل الاستخراجي، 2) باستخدام بنية الانصهار في وحدة فك التشفير للتعامل مع سياقات الإدخال الطويلة، و 3) توسيط الصغار على ضبط مجموعات بيانات QA المجال المفتوحة المهيكلة لتحسين أداء القليل من الطلقات. تحسن FID-السابقين بشكل كبير على العمل السابق من حيث مقاييس التفسير ودقة المهام على خمس مهام من المعيار لشرح الممحاة في كل من إعدادات الإشراف بالكامل وعدد القليلة.
في حين أن الشبكات العصبية تنتج أداء حديثة في العديد من مهام NLP، إلا أنها تعتمد بشكل عام على المعلومات المعدنية، والتي تنقل بشكل سيئ بين المجالات.نقدم مزيجا من استراتيجيتين للتخفيف من هذا الاعتماد على المعلومات المعجمية في مهام التحقق من الواقع.نقدم تقنية تقطير البيانات إلى Delexicalization، والتي ندموعها مع طريقة تقطير نموذجية لمنع تقطير البيانات العدوانية.نظرا لأنه من خلال استخدام حلنا، لا يبقى أداء نموذج حالة حديثة موجود على قدم المساواة مع نموذج النموذج الذي تم تدريبه على بيانات متعمدة بالكامل، ولكنه يؤدي أيضا بشكل أفضل منه عند اختبارهنطاق.نظهر أن هذه التقنية التي نقدمها تشجع النماذج لاستخراج الحقائق القابلة للتحويل من مجموعة بيانات التحقق من حقيقة معين.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا