ترغب بنشر مسار تعليمي؟ اضغط هنا

إعادة الراحة العصبية لاسترجاع الأدلة في المهمة الحمية

Neural Re-rankers for Evidence Retrieval in the FEVEROUS Task

216   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

اكتسب فحص الحقائق الحاسوبية الكثير من الجر في مجتمعات تعلم الآلات ومعالجة اللغة الطبيعية.تم تطوير عدد كبير من الحلول، لكن الأساليب التي تستفيد من كل من المعلومات الهيكلية وغير المنظمة للكشف عن المعلومات الخاطئة ذات أهمية خاصة.في هذه الورقة، نتعامل مع التحدي الحمير (استخراج الحقائق والتحقق من المعلومات غير المنظمة والمعلومات المهيكلة) التي تتكون من نظام أساسي من المصدر مفتوح مع مجموعة بيانات معيار تحتوي على 87،026 مطالبات تم التحقق منها.نقوم بتمديد هذا النموذج الأساسي هذا من خلال تحسين وحدة استرجاع الأدلة التي تسفر عن أفضل دليل F1 بين المنافسين في لوحة المتصدرين التحدي أثناء الحصول على درجة حمامة إجمالية قدرها 0.20 (أفضل نظام في المرتبة الخامسة).

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقوم بتطوير نظام لمهمة استخراج الحقائق الحميرة والتحقق من تحديد مجموعة أولية من الأدلة المحتملة، ثم يتابع الأدلة المفقودة في القفزات اللاحقة من خلال محاولة توليدها، مع وجود وحدة توقعات القفز التالية "التي يتم مطابقة خرجها من عناصر الصفحاتمقال متوقع.ت سعى للحصول على أدلة مع وحدة تنبؤ القفز التالية تستمر في تحسين النتيجة الحميرة لمدة تصل إلى سبع قفزات.يتم تدريب تصنيف العلامات على سلاسل الأدلة المستخرجة غير كاملة غير كاملة، واستخدام تلميحات التي تسهل المقارنة العددية.يحقق النظام .281 النتيجة الحميرة ودقة التسمية .658 على مجموعة التطوير، وينتهي في المرتبة الثانية باستخدام 0.259 درجة حمامة ودقة التسمية .576 على مجموعة الاختبار.
العثور على التعريفي للبيانات هو مفتاح العديد من المهام، بما في ذلك توليد المضادة.إننا نبني نظام، بالنظر إلى بيان، يسترد معرفا من مصادر متنوعة على الويب.في صميم هذا النظام هو نموذج لاستدلال اللغة الطبيعية (NLI) يحدد ما إذا كانت الجملة المرشحة زاوية سا رية المفعول أم لا.ومع ذلك، فإن معظم نماذج NLI حتى الآن، تفتقر إلى قدرات التفكير المناسبة اللازمة لإيجاد التعدد الزيادة التي تنطوي على استنتاج معقد.وبالتالي، نقدم نموذج NLI المحسن للمعرفة يهدف إلى التعامل مع الاستدلال المستندة إلى السببية والمثال من خلال دمج رسوم البيانية المعرفة.تتفوق نموذج NLI الخاص بنا على خطوط الأساس لمهام NLI، خاصة بالنسبة للحالات التي تتطلب الاستدلال المستهدف.بالإضافة إلى ذلك، يحسن نموذج NLI هذا نظام استرجاع معرفي، وخاصة إيجاد مزايا معقدة بشكل أفضل.
عملية التحقق من المطالبة تحديا لأنها تتطلب أولا العثور على أدلة نصية ثم قم بتطبيق تستيط أدلة المطالبة للتحقق من مطالبة.تقوم Works السابقة بتقييم خطوة الاستقبال استنادا إلى الأدلة المستردة، في حين أننا نفترض أن التنبؤ الاستيباري يمكن أن يوفر إشارات مف يدة لاسترجاع الأدلة، بمعنى أنه إذا كانت الجملة تدعم مطالبة أو يجب أن تكون الجملة ذات صلة.نقترح نموذج جديد يستخدم النتيجة الاستقبال للتعبير عن الملاءمة.تجاربنا تحقق من أن الاستفادة من التنبؤ التنفيذ يحسن الترتيب قطع متعددة من الأدلة.
التحقق من الحقائق الآلية على نطاق واسع هو مهمة صعبة لم تتم دراستها بشكل منهجي حتى وقت قريب.مجموعات وثيقة صاخبة كبيرة مثل الويب أو المقالات الإخبارية تجعل المهمة أكثر صعوبة.نحن تصف نظام فحص الحقائق الآلي من ثلاث مراحل، اسمه Quin +، باستخدام أساليب است رجاع الأدلة والاختيار.نحن نوضح أن استخدام تمثيلات مرور كثيفة يؤدي إلى أدلة أعلى بكثير استدعاء في بيئة صاخبة.نقترح أيضا أساليب اختيار الجملة، وهي اختيار مقرها التضمين باستخدام نموذج استرجاع كثيف، ونهج وضع العلامات المتسلسل لتحديد السياق.QUIN + قادر على التحقق من مطالبات المجال المفتوح باستخدام النتائج من محركات البحث على الويب.
في العديد من مهام معالجة اللغة الطبيعية، تعد استرجاع مرور وإعادة التعريف بمرتبة المقطع الإجراءان الرئيسيان في إيجاد المعلومات ذات الصلة وتحديدها. بما أن كل من الإجراءين يسهمان في الأداء النهائي، فمن المهم تحسينها بشكل مشترك من أجل تحقيق تحسن متبادل. في هذه الورقة، نقترح نهج تدريب مشترك رواية لاسترجاع المقطع الكثيف وإعادة إطلاق Reranking. مساهمة رئيسية هي أننا نقدم تقطير List Norwise الديناميكي، حيث نقوم بتصميم نهج تدريبي موحد للأسرار لكل من المسترد و Re-Ranker. أثناء التقطير الديناميكي، يمكن تحسين المسترد و Re-Ranker بشكل متكامل وفقا لمعلومات بعضهم البعض. نقترح أيضا استراتيجية تكبير البيانات الهجينة لبناء مثيلات تدريب متنوعة لنهج تدريب ListWise. تظهر تجارب واسعة فعالية نهجنا على كل من بيانات MSMARCO والأسئلة الطبيعية. يتوفر الكود الخاص بنا في https://github.com/paddlepaddle/rocketqa.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا