ترغب بنشر مسار تعليمي؟ اضغط هنا

فريق Papelo في FEVEROUS: الأدلة متعددة القفز

Team Papelo at FEVEROUS: Multi-hop Evidence Pursuit

280   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقوم بتطوير نظام لمهمة استخراج الحقائق الحميرة والتحقق من تحديد مجموعة أولية من الأدلة المحتملة، ثم يتابع الأدلة المفقودة في القفزات اللاحقة من خلال محاولة توليدها، مع وجود وحدة توقعات القفز التالية "التي يتم مطابقة خرجها من عناصر الصفحاتمقال متوقع.تسعى للحصول على أدلة مع وحدة تنبؤ القفز التالية تستمر في تحسين النتيجة الحميرة لمدة تصل إلى سبع قفزات.يتم تدريب تصنيف العلامات على سلاسل الأدلة المستخرجة غير كاملة غير كاملة، واستخدام تلميحات التي تسهل المقارنة العددية.يحقق النظام .281 النتيجة الحميرة ودقة التسمية .658 على مجموعة التطوير، وينتهي في المرتبة الثانية باستخدام 0.259 درجة حمامة ودقة التسمية .576 على مجموعة الاختبار.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة النظام الفائز للمهمة المشتركة للمكاسب 2021: تجديد شرح القفز متعدد القفز. بالنظر إلى سؤال وإجابته الصحيحة المقابلة، تهدف هذه المهمة إلى تحديد الحقائق التي يمكن أن توضح سبب صحة الإجابة لهذا السؤال والرد (ضمان الجودة) من قاعدة معارف كبيرة . لمعالجة هذه المشكلة وتسريع التدريب أيضا، تتضمن استراتيجيتنا خطوتين. أولا، قم بضبط النماذج اللغوية المدربة مسبقا (PLMS) مع فقدان ثلاثي لاستدعاء الحقائق ذات الصلة Top-K لكل سؤال وجواب. بعد ذلك، اعتماد نفس الهندسة المعمارية لتدريب نموذج إعادة الترتيب لترتيب المرشحين الأعلى K. لتعزيز الأداء، نحن متوسط ​​النتائج من النماذج المستندة إلى PLMS مختلفة (E.G.، ROBERTA) وإعدادات المعلمات المختلفة لجعل التنبؤات النهائية. يوضح التقييم الرسمي أنه، يمكن أن يتفوق نظامنا على ثاني أفضل نظام بمقدار 4.93 نقطة، مما يثبت فعالية نظامنا. كان رمزنا مفتوح المصدر، والعنوان هو https://github.com/deepblueaii/textgraphs-15
اكتسب فحص الحقائق الحاسوبية الكثير من الجر في مجتمعات تعلم الآلات ومعالجة اللغة الطبيعية.تم تطوير عدد كبير من الحلول، لكن الأساليب التي تستفيد من كل من المعلومات الهيكلية وغير المنظمة للكشف عن المعلومات الخاطئة ذات أهمية خاصة.في هذه الورقة، نتعامل مع التحدي الحمير (استخراج الحقائق والتحقق من المعلومات غير المنظمة والمعلومات المهيكلة) التي تتكون من نظام أساسي من المصدر مفتوح مع مجموعة بيانات معيار تحتوي على 87،026 مطالبات تم التحقق منها.نقوم بتمديد هذا النموذج الأساسي هذا من خلال تحسين وحدة استرجاع الأدلة التي تسفر عن أفضل دليل F1 بين المنافسين في لوحة المتصدرين التحدي أثناء الحصول على درجة حمامة إجمالية قدرها 0.20 (أفضل نظام في المرتبة الخامسة).
كيف يمكننا أن نولد تفسيرات موجزة لفهم القراءة متعددة القفز (RC)؟ يمكن اعتبار الاستراتيجيات الحالية لتحديد الجمل الداعمة كأخصات تركز على الأسئلة الاستخراجية لنص المدخلات. ومع ذلك، فإن هذه التفسيرات الاستخراجية ليست بالضرورة موجزة، وليس كافية على الأقل للإجابة على سؤال. بدلا من ذلك، ندعو إلى نهج إغراق، حيث نقترح إنشاء ملخص ركز على أسئلة غير مركزة لفقرات الإدخال ثم إطعامها لنظام RC. بالنظر إلى كمية محدودة من التفسيرات الموضحة البشرية المشروح البشرية، فإننا نربع الشرح الإفجي بطريقة شبه إشراف، حيث نبدأ من النموذج الخاضع للإشراف، ثم تدريب عليه من خلال التجربة والخطأ تعظيم وظيفة المكافآت التي تمت ترقيتها على الحجز. توضح تجاربنا أن المفسر المفسد المقترح يمكن أن يولد توضيحات أكثر إحكاما من الشرح الاستخراجي مع إشراف محدود (مثيلات 2K فقط) مع الحفاظ على الاكتفاء.
الرسوم البيانية المعرفة ضرورية للعديد من تطبيقات معالجة اللغة الطبيعية المصب، ولكنها غير مكتملة عادة مع العديد من الحقائق المفقودة. ينتج عن هذا الجهود البحثية في مهمة التفكير المتعدد القفزات، والتي يمكن صياغة كعملية بحث ونماذج حالية تؤدي عادة منطق بع يد المنال. ومع ذلك، فإن السبب البعيد الطويل أمر حيوي أيضا بالقدرة على توصيل الكيانات غير المرتبطة بسطحية. بأفضل من علمنا، يفتقر إلى وجود إطار عام يقترب من التفكير المتعدد القفز في سيناريوهات التفكير المسؤولة لفترة طويلة مختلطة. نقول أن هناك مشكلتان رئيسيتان لنموذج التفكير المتعدد القفز العام: ط) أين تذهب، والثاني) عند التوقف. لذلك، نقترح نموذج عام يحدد المشكلات ذات ثلاث وحدات: 1) وحدة المعرفة المحلية المحلية لتقدير المسارات المحتملة، 2) وحدة التسرب الإجراءات المختلفة لاستكشاف مجموعة متنوعة من المسارات، و 3) التوقف التكيفي وحدة البحث لتجنب البحث عنها. توضح النتائج الشاملة على ثلاث مجموعات بيانات تفوق نموذجنا مع تحسينات كبيرة ضد خطوط الأساس في سيناريوهات التفكير المسافة القصيرة والطويلة.
عملية التحقق من المطالبة تحديا لأنها تتطلب أولا العثور على أدلة نصية ثم قم بتطبيق تستيط أدلة المطالبة للتحقق من مطالبة.تقوم Works السابقة بتقييم خطوة الاستقبال استنادا إلى الأدلة المستردة، في حين أننا نفترض أن التنبؤ الاستيباري يمكن أن يوفر إشارات مف يدة لاسترجاع الأدلة، بمعنى أنه إذا كانت الجملة تدعم مطالبة أو يجب أن تكون الجملة ذات صلة.نقترح نموذج جديد يستخدم النتيجة الاستقبال للتعبير عن الملاءمة.تجاربنا تحقق من أن الاستفادة من التنبؤ التنفيذ يحسن الترتيب قطع متعددة من الأدلة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا