ترغب بنشر مسار تعليمي؟ اضغط هنا

السؤال المفتوح المجال الرد يذهب يتحدث عن طريق إعادة كتابة الأسئلة

Open-Domain Question Answering Goes Conversational via Question Rewriting

362   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم مجموعة بيانات جديدة لإعادة كتابة الأسئلة في سياق المحادثة (QRECC)، والتي تحتوي على محادثات 14 ألف مع أزواج من الإجابات السؤال 80k.تتمثل المهمة في QRECC في العثور على إجابات على أسئلة المحادثة داخل مجموعة من صفحات الويب 10 أمتار (تقسيم إلى 54 مترا مربعا).قد يتم توزيع إجابات على الأسئلة الموجودة في نفس المحادثة عبر العديد من صفحات الويب.توفر QRECC التعليقات التوضيحية التي تسمح لنا بتدريب وتقييم المهارات الفرعية الفردية من إعادة كتابة السؤال، واسترجاع المرور وفهم القراءة المطلوبة لمهمة الإجابة على مسألة المحادثة نهاية إلى نهاية.نبلغ عن فعالية نهج خط الأساس القوي الذي يجمع بين النموذج الحديثة لإعادة كتابة الأسئلة والنماذج التنافسية لقضاء ضمان الجودة المفتوحة.حددت نتائجنا أول خط أساسي ل DataSet QRECC مع F1 من 19.10، مقارنة بمضابط العلوي البشري 75.45، مما يدل على صعوبة الإعداد وغرفة كبيرة للتحسين.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يسأل الأسئلة المفتوحة الإجابة على تحديد إجابات الأسئلة التي أنشأتها المستخدم في مجموعات ضخمة من المستندات. أساليب Readriever-Reverse Graph النهج هي أسران كبيرتان من الحلول لهذه المهمة. يطبق قارئ المسترد أولا تقنيات استرجاع المعلومات للحصول على تحديد عدد قليل من الممرات التي من المحتمل أن تكون ذات صلة، ثم تغذي النص المسترد إلى قارئ شبكة عصبي لاستخراج الإجابة. بدلا من ذلك، يمكن بناء الرسوم البيانية المعرفة واستفسارها للإجابة على أسئلة المستخدمين. نقترح خوارزمية مع تصميم رواية Reader-Reader - يختلف عن كل من العائلات. يستخدم Reader-Retriever أولا قارئ حاليا لقراءة الكائن وإنشاء مجموعات من جميع الأسئلة المجدية المرتبطة بإجاباتهم، ثم يستخدم المسترد عبر الإنترنت للاستجابة لاستعلامات المستخدم من خلال البحث في مساحات الأسئلة التي تم إنشاؤها مسبقا للحصول على إجابات أكثر احتمالا أن يطلب في الطريقة المحددة. ندمج مزيد من الجمع بين قارئ المسترجع واحد واسترجاع القارئين في نموذج هجين يسمى R6 لأفضل أداء. تبين تجارب مع مجموعة بيانات عامة واسعة النطاق أن R6 يحقق دقة حديثة.
نقدم سبارتا، وهي طريقة استرجاع عصبي رواية تعرض وعد كبير في الأداء والتعميم والتفسيرية للحصول على سؤال السؤال المفتوح. على عكس العديد من أساليب التصنيف العصبي التي تستخدم ناقلات كثيفة أقرب بحث جار، يتعلم سبارتا تمثيل متقطع يمكن تنفيذها بكفاءة كمؤشر مق لوب. تمكن التمثيل الناتج استرجاع العصبي القابل للتطوير الذي لا يتطلب البحث التقريبي باهظ التقريب ويؤدي إلى أداء أفضل من نظيره الكثيف. لقد صادقنا مناهجنا على مهام الإجابة على سؤال (OpenQA) 4 و 11 مهام الإجابة على السؤال (REQA) 11. يحقق Sparta أحدث نتائج جديدة في مجموعة متنوعة من الأسئلة المفتوحة في المجال الرد على المهام في كل من مجموعات البيانات الإنجليزية والصينية، بما في ذلك الفريق المفتوح، CMRC، إلخ. تؤكد التحليل أيضا أن الطريقة المقترحة تخلق تمثيل قابل للتفسير الإنسان ويسمح السيطرة على المفاضلة بين الأداء والكفاءة.
تقدم التطورات الحديثة في QA في الهواء الطلق إلى نماذج قوية تعتمد على استرجاع كثيف، ولكن ركزت فقط على استرداد المقاطع النصية.في هذا العمل، نتعامل مع QA المجال المفتوح على الجداول لأول مرة، وإظهار أنه يمكن تحسين الاسترجاع من خلال المسترد المصمم للتعامل مع سياق الجدول.نقدم إجراءات فعالة مسبقة التدريب لاستردادنا وتحسين جودة الاسترجاع مع السلبيات الصلبة الملغومة.نظرا لأن مجموعات البيانات ذات الصلة مفقودة، فإننا نستخلص مجموعة فرعية من الأسئلة الطبيعية (Kwiatkowski et al.، 2019) في مجموعة بيانات QA.نجد أن المسترد الخاص بنا يحسن نتائج الاسترجاع من 72.0 إلى 81.1 استدعاء @ 10 وتنفذ QA نهاية إلى نهاية من 33.8 إلى 37.7 مباراة دقيقة، عبر المسترد القائم على بيرت.
الهدف الشامل من معالجة اللغة الطبيعية هو تمكين الآلات من التواصل بسلاسة مع البشر.ومع ذلك، يمكن أن تكون اللغة الطبيعية غامضة أو غير واضحة.في حالات عدم اليقين، يشارك البشر في عملية تفاعلية تعرف باسم الإصلاح: طرح الأسئلة والسعي للحصول على توضيح حتى يتم حل حالة عدم اليقين.نقترح إطارا لبناء نموذج لسؤال أسئلة بصريا قادرة على إنتاج أسئلة توضيحات القطبية (نعم لا) لحل سوء الفهم في الحوار.يستخدم نموذجنا هدف معلومات متوقعة اكتبا لصالح أسئلة مفيدة من Captioner صورة خارج الرف دون الحاجة إلى أي بيانات للإجابة على الأسئلة الخاضعة للإشراف.نوضح قدرة النموذج لدينا على طرح الأسئلة التي تحسن النجاح التواصل في لعبة 20 أسئلة موجهة نحو الأهداف مع الإجابات الاصطناعية والإنسانية.
حققت استرجاع النص العصبي الكثيف نتائج واعدة حول السؤال المفتوح للنطاق الرد (QA)، حيث يتم استغلال تمثيلات كامنة للأسئلة والمراجيات للحصول على أقصى قدر من البحث الداخلي في عملية الاسترجاع. ومع ذلك، فإن المستردات الكثيفة الحالية تتطلب تقسيم المستندات إل ى مقاطع قصيرة تحتوي عادة على سياق محلي جزئي ومحازي في بعض الأحيان، وتعتمد بشدة على عملية تقسيم. ونتيجة لذلك، قد تسفر عن تعويضات مخفية غير دقيقة ومضللة، مما تدهور نتيجة الاسترجاع النهائي. في هذا العمل، نقترح استرجاع هرمي هرمي كثيف (DHR)، وهو إطار هرمي يمكنه إنشاء تمثيلات كثيفة دقيقة من الممرات من خلال الاستفادة من كل من الدلالات الكبيرة في الوثيقة والدليل المجهري المحدد لكل مقطع. على وجه التحديد، يحدد المسترد على مستوى المستند أولا المستندات ذات الصلة، من بينها يتم استرداد المقاطع ذات الصلة من خلال المسترد لمستوى المقاطع. سيتم معايرة ترتيب الممرات المستردة من خلال دراسة أهمية مستوى الوثيقة. بالإضافة إلى ذلك، يتم التحقيق في هيكل العنوان الهرمي واستراتيجيات أخذ العينات السلبية (I.E.، في السلبيات في السلبيات) في السلبيات). نطبق DHR إلى مجموعات بيانات QA مفتوحة على نطاق واسع. تتفوق DHR بشكل كبير على استرداد المقطع الكثيف الأصلي، ويساعد نظام ضمان الجودة في نهاية إلى نهاية يتفوق على الأساس القوي على معايير QA متعددة النطاق.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا