ترغب بنشر مسار تعليمي؟ اضغط هنا

في الإجابة على الأسئلة المفتوحة للنطاق، أصبح استرجاع المقطع الكثيف نموذجا جديدا لاسترداد الممرات ذات الصلة لإيجاد الإجابات. عادة ما يتم اعتماد بنية التشفير المزدوجة لتعلم تمثيلات كثيفة من الأسئلة والممرات للمطابقة الدلالية. ومع ذلك، من الصعب تدريب تش فير مزدوج بشكل فعال بسبب التحديات بما في ذلك التناقض بين التدريب والاستدلال، ووجود إيجابيات غير محدودة وبيانات تدريب محدودة. لمعالجة هذه التحديات، نقترح نهج تدريبي محسن، يسمى Rocketqa، لتحسين استرجاع الممر الكثيف. نجعل ثلاث مساهمات تقنية رئيسية في Rocketqa، وهي السلبيات عبر الدفعة، السلبيات الصلبة الشاقة وزعم البيانات. تظهر نتائج التجربة أن Rocketqa تتفوق بشكل كبير على النماذج السابقة من بين الفنادق السابقة على كل من MSMARCO والأسئلة الطبيعية. نقوم أيضا بإجراء تجارب مكثفة لفحص فعالية الاستراتيجيات الثلاث في Rocketqa. علاوة على ذلك، نوضح أن أداء ضمان الجودة المناسبة يمكن تحسينه بناء على مسترد Rocketqa لدينا.
تتطلب QA مؤخرا مع أسئلة التفكير المنطقي علاقات على مستوى المرور بين الجمل.ومع ذلك، فإن النهج الحالية لا تزال تركز على العلاقات على مستوى الجملة تتفاعل بين الرموز.في هذا العمل، نستكشف عن أدلة على مستوى المرور التجميعي لحل ضمنيا المنطق المنطقي باستخدام المعلومات المستندة إلى الخطاب.نقترح شبكة الرسم البياني على داجرا (DAGN) تلك الأسباب التي تعتمد على هيكل الخطاب للنصوص.يرميز النموذج معلومات الخطاب كشركة رسم بياني مع وحدات الخطاب الأولية (EDUS) وعلاقات الخطاب، وتعلم ميزات Converse-Aware عبر شبكة رسم بياني لمهام QA المصب.يتم إجراء التجارب على اثنين من مجموعات البيانات المنطقية من المنطقية، reclor and logiqa، ونتائج dagn المقترحة لدينا نتائج تنافسية.يتوفر شفرة المصدر في https://github.com/eleanor-h/dagn.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا