ترغب بنشر مسار تعليمي؟ اضغط هنا

معلومات تكيف تسعى للحصول على سؤال مفتوح

Adaptive Information Seeking for Open-Domain Question Answering

329   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد المعلومات التي تطلبها خطوة أساسية للسؤال المفتوح الإجابة على جمع الأدلة الكفاءة من كوربوس كبيرة. في الآونة الأخيرة، أثبتت النهج التكرارية أن تكون فعالة للأسئلة المعقدة، من خلال استرداد أدلة جديدة بشكل متكرر في كل خطوة. ومع ذلك، فإن جميع الأساليب التكرارية الحالية تقريبا تستخدم استراتيجيات محددة مسبقا، إما تطبيق نفس وظيفة الاسترجاع عدة مرات أو إصلاح ترتيب وظائف استرجاع مختلفة، والتي لا يمكنها الوفاء بالمتطلبات المتنوعة من الأسئلة المختلفة. في هذه الورقة، نقترح استراتيجية رواية تكيفية تسعى للحصول على معلومات عن أسئلة مفتوحة، وهي AISO. على وجه التحديد، يتم تصميم عملية الاسترجاع والأجوبة بأكملها كعملية اتخاذ قرار Markov الملحوظ جزئيا، حيث يتم تعريف ثلاثة أنواع من عمليات استرجاع (مثل E.G.، BM25 و DPR وارتباط التشعبي) وعملية إجابة واحدة كإجراءات. وفقا للسياسة المستفادة، يمكن ل AISO اختيار إجراءات استرجاع مناسبة ستكيفا للبحث عن الأدلة المفقودة في كل خطوة، بناء على الأدلة التي تم جمعها واستفسلة إعادة صياغة، أو إخراج الإجابة مباشرة عندما تكون مجموعة الأدلة كافية للسؤال. تبين تجارب في تشكيلة مفتوحة و hotpotqa fullwiki، التي تخدم مع معايير قافلة واحدة مفتوحة ومتعددة النطاق، أن AISO تفوقت على جميع الأساليب الأساسية مع استراتيجيات محددة مسبقا فيما يتعلق بتقييمات الاسترجاع والإجابة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تفترض السؤال المتعدد اللغات الرد على المهام عادة أن الإجابات موجودة بنفس اللغة مثل السؤال. ومع ذلك، في الممارسة العملية، تواجه العديد من اللغات كل من ندرة المعلومات --- حيث تحتوي اللغات على عدد قليل من المقالات المرجعية --- واستاجةم المعلومات --- أين الأسئلة المرجعية المفاهيم من الثقافات الأخرى. يمتد هذا العمل سؤالا مفتوحا للاسترجاع الرد على الإعداد المتبادل الذي تمكن الأسئلة من لغة واحدة للإجابة على محتوى الإجابة من لغة أخرى. نحن نبني مجموعة بيانات واسعة النطاق تم بناؤها على أسئلة 40K تسعى للحصول على معلومات عبر 7 لغات غير الإنجليزية متنوعة لا يمكن أن تجد Tydi QA إجابات لغة نفسها. استنادا إلى هذه البيانات، نقدم إطار عمل، يسمى سؤالا عبر اللغات المفتوح استرجاع الإجابة (XOR QA)، الذي يتكون من ثلاث مهام جديدة تنطوي على استرجاع وثائق عبر اللغات من موارد متعددة اللغات والإنجليزية. نقوم بإنشاء خطوط الأساس مع أنظمة ترجمة من الآلة الحديثة ونماذج مسببة الاحتياطية عبر اللغات. تشير النتائج التجريبية إلى أن XOR QA هي مهمة صعبة سيسهل تطوير تقنيات جديدة للإجابة على الأسئلة متعددة اللغات. تتوفر بياناتنا ورمزنا في https://nlp.cs.washington.edu/xorqa/.
قراء قراء أوراق البحث الأكاديمي غالبا ما يقرؤون بهدف الإجابة على أسئلة محددة. يمكن للإجابة على الأسئلة التي يمكن أن ترد على هذه الأسئلة إجراء استهلاك المحتوى أكثر كفاءة بكثير. ومع ذلك، فإن بناء هذه الأدوات يتطلب بيانات تعكس صعوبة المهمة الناشئة عن ال تفكير المعقد حول المطالبات المقدمة في أجزاء متعددة من الورقة. في المقابل، تحتوي الأسئلة الحالية على المعلومات المتعلقة بالمعلومات الرد على مجموعات البيانات عادة أسئلة حول المعلومات العامة من النوع العامل. لذلك نحن نقدم QASPER، مجموعة بيانات من 5049 سؤالا أكثر من 1585 ورقة معالجة اللغة الطبيعية. يتم كتابة كل سؤال بممارس NLP الذي قرأ فقط عنوان وإجراء ملخص للورقة المقابلة، والسؤال يسعى للحصول على معلومات موجودة في النص الكامل. ثم تتم الإجابة على الأسئلة من قبل مجموعة منفصلة من ممارسين NLP الذين يقدمون أيضا الأدلة الداعمة للإجابات. نجد أن النماذج الحالية التي تعمل بشكل جيد على مهام ضمان الجودة الأخرى لا تؤدي بشكل جيد في الإجابة على هذه الأسئلة، وأيضا الأد من البشر بنسبة 27 نقطة على الأقل عند الإجابة عليها من الأوراق بأكملها، تحفز المزيد من الأبحاث في الوثائق التي تأسست، حيث تسعى للحصول على المعلومات، والتي تم تصميم DataSet لدينا لتسهيل.
تقدم التطورات الحديثة في QA في الهواء الطلق إلى نماذج قوية تعتمد على استرجاع كثيف، ولكن ركزت فقط على استرداد المقاطع النصية.في هذا العمل، نتعامل مع QA المجال المفتوح على الجداول لأول مرة، وإظهار أنه يمكن تحسين الاسترجاع من خلال المسترد المصمم للتعامل مع سياق الجدول.نقدم إجراءات فعالة مسبقة التدريب لاستردادنا وتحسين جودة الاسترجاع مع السلبيات الصلبة الملغومة.نظرا لأن مجموعات البيانات ذات الصلة مفقودة، فإننا نستخلص مجموعة فرعية من الأسئلة الطبيعية (Kwiatkowski et al.، 2019) في مجموعة بيانات QA.نجد أن المسترد الخاص بنا يحسن نتائج الاسترجاع من 72.0 إلى 81.1 استدعاء @ 10 وتنفذ QA نهاية إلى نهاية من 33.8 إلى 37.7 مباراة دقيقة، عبر المسترد القائم على بيرت.
في الإجابة على الأسئلة المفتوحة للنطاق الرد (ضمان الجودة)، فإن آلية استرداد وقراءة القراءة لها الاستفادة المتأصلة من الترجمة الترجمة من الترجمة الشفوية وسهولة إضافة أو إزالة أو تحرير المعرفة مقارنة بالنهج المعلمة لنماذج QA كتاب مغلقة.ومع ذلك، من المع روف أيضا أن تعاني من بصمة التخزين الكبيرة بسبب كوربوس وثائقها ومؤشرها.هنا، نناقش العديد من الاستراتيجيات المتعامدة لتقليل البصمة بشكل كبير من نظام QA لاسترداد ونظام QA المتسترف والقراءة بنسبة تصل إلى 160X.تشير نتائجنا إلى أن استرداد وقراءة القراءة يمكن أن يكون خيارا قابلا للتطبيق حتى في بيئة تخدم عالية للغاية مثل أجهزة الحافة، حيث نظهر أنه يمكن أن يحقق دقة أفضل من نموذج حزم بحزم مع حجم نظام منخفض المستوى من Docker.
تم إنشاء العديد من مجموعات البيانات لتدريب نماذج الفهم في القراءة، والسؤال الطبيعي هو ما إذا كان يمكننا دمجها لبناء النماذج التي (1) أداء أفضل على جميع مجموعات بيانات التدريب و (2) تعميم وتحويل أفضل بيانات جديدة إلى مجموعات البيانات الجديدة. عالج الع مل المسبق هذا الهدف من خلال تدريب شبكة واحدة في وقت واحد على مجموعات بيانات متعددة، والتي تعمل بشكل جيد في المتوسط ​​ولكنها عرضة للتوزيعات الفرعية المختلفة أو غير الضرورية ويمكن نقلها أسوأ مقارنة بالنماذج المصدر بأكثر تداخل مع DataSet المستهدف. يتمثل نهجنا في نموذج سؤال متعدد البيانات مستجيب مع مجموعة من خبراء DataSet واحد، من خلال تدريب مجموعة من وحدات محول محول خفيفة الوزن وخفيفة الوزن (Houlsby et al.، 2019) التي تشترك في نموذج محول أساسي. نجد أن خبراء مجموعة البيانات متعددة المحولات (صنع) تفوقوا جميع خطوط الأساس لدينا من حيث دقة التوزيع، والأساليب البسيطة القائمة على متوسط ​​المعلمة تؤدي إلى تحسين التعميم الصفرية وأداء قليل من الرصاص، مما يوفر قويا و نقطة انطلاق متعددة الاستخدامات لبناء أنظمة مفهوم القراءة الجديدة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا