في الإجابة على الأسئلة المفتوحة للنطاق الرد (ضمان الجودة)، فإن آلية استرداد وقراءة القراءة لها الاستفادة المتأصلة من الترجمة الترجمة من الترجمة الشفوية وسهولة إضافة أو إزالة أو تحرير المعرفة مقارنة بالنهج المعلمة لنماذج QA كتاب مغلقة.ومع ذلك، من المعروف أيضا أن تعاني من بصمة التخزين الكبيرة بسبب كوربوس وثائقها ومؤشرها.هنا، نناقش العديد من الاستراتيجيات المتعامدة لتقليل البصمة بشكل كبير من نظام QA لاسترداد ونظام QA المتسترف والقراءة بنسبة تصل إلى 160X.تشير نتائجنا إلى أن استرداد وقراءة القراءة يمكن أن يكون خيارا قابلا للتطبيق حتى في بيئة تخدم عالية للغاية مثل أجهزة الحافة، حيث نظهر أنه يمكن أن يحقق دقة أفضل من نموذج حزم بحزم مع حجم نظام منخفض المستوى من Docker.
In open-domain question answering (QA), retrieve-and-read mechanism has the inherent benefit of interpretability and the easiness of adding, removing, or editing knowledge compared to the parametric approaches of closed-book QA models. However, it is also known to suffer from its large storage footprint due to its document corpus and index. Here, we discuss several orthogonal strategies to drastically reduce the footprint of a retrieve-and-read open-domain QA system by up to 160x. Our results indicate that retrieve-and-read can be a viable option even in a highly constrained serving environment such as edge devices, as we show that it can achieve better accuracy than a purely parametric model with comparable docker-level system size.
المراجع المستخدمة
https://aclanthology.org/
حققت استرجاع النص العصبي الكثيف نتائج واعدة حول السؤال المفتوح للنطاق الرد (QA)، حيث يتم استغلال تمثيلات كامنة للأسئلة والمراجيات للحصول على أقصى قدر من البحث الداخلي في عملية الاسترجاع. ومع ذلك، فإن المستردات الكثيفة الحالية تتطلب تقسيم المستندات إل
التقدم الملخص في النمذجة المتبادلة يعتمد على مجموعات التقييم الصعبة والواقعية والتنوع.نقدم أسئلة وأجوبة معارف متعددة اللغات (MKQA)، وهي سؤالا مفتوحا في مجال الإجابة على مجموعة التقييم التي تضم أزواج من الإجابات السؤال 10 كيلو محاذاة عبر 26 لغة متنوعة
تعد المعلومات التي تطلبها خطوة أساسية للسؤال المفتوح الإجابة على جمع الأدلة الكفاءة من كوربوس كبيرة. في الآونة الأخيرة، أثبتت النهج التكرارية أن تكون فعالة للأسئلة المعقدة، من خلال استرداد أدلة جديدة بشكل متكرر في كل خطوة. ومع ذلك، فإن جميع الأساليب
يعمل العمل الأخير (فنغ وآخرون.، 2018) وجود شظايا مدخلات قصيرة غير قابلة للتفسير التي تحقق ثقة عالية ودقة في النماذج العصبية. نشير إلى هذه المدخلات الحد الأدنى للحفاظ على التنبؤ (MPPIS). في سياق الإجابة على السؤال، نحن نحقق في الفرضيات المتنافسة لوجود
يسأل الأسئلة المفتوحة الإجابة على تحديد إجابات الأسئلة التي أنشأتها المستخدم في مجموعات ضخمة من المستندات. أساليب Readriever-Reverse Graph النهج هي أسران كبيرتان من الحلول لهذه المهمة. يطبق قارئ المسترد أولا تقنيات استرجاع المعلومات للحصول على تحديد