ترغب بنشر مسار تعليمي؟ اضغط هنا

autoeqa: أسئلة الترميز التلقائي لسؤال الاستخراج

AutoEQA: Auto-Encoding Questions for Extractive Question Answering

254   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كان هناك تقدم كبير في مجال الإجابة على الأسئلة الاستخراجية (EQA) في السنوات الأخيرة.ومع ذلك، فإن معظمهم يعتمدون على التوضيحية الخاصة بالإجابة في الممرات المقابلة.في هذا العمل، نتعلم مشكلة EQA عندما لا توجد شروح موجودة للإجابة فترة الإجابة، أي، عندما تحتوي DataSet على أسئلة فقط والممرات المقابلة.تعتمد طريقتنا على الترميز التلقائي للسؤال الذي يؤدي سؤالا يرد على المهمة أثناء الترميز ومهمة توليد الأسئلة أثناء فك التشفير.نظهر أن طريقتنا تعمل بشكل جيد في إعداد صفرية ويمكن أن توفر خسارة إضافية لتعزيز الأداء ل EQA.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة N-XKT (الترميز العصبي بناء على نقل المعرفة التوضيحية)، وهي طريقة جديدة للتحويل التلقائي للمعرفة التوضيحية من خلال آليات الترميز العصبي.نوضح أن N-XKT قادر على تحسين الدقة والتعميم بشأن الإجابة على سؤال العلوم (QA).على وجه التحديد، من خل ال الاستفادة من الحقائق من معرض المعرفة التوضيحية الخلفية، يظهر نموذج N-XKT تحسنا واضحا على QA صفر النار.علاوة على ذلك، نظهر أن N-XKT يمكن ضبطها بشكل جيد على مجموعة بيانات QA المستهدفة، مما يتيح التقارب الأسرع والنتائج الأكثر دقة.يتم إجراء تحليل منهجي لتحليل أداء نموذج N-XKT وتأثير فئات مختلفة من المعرفة حول مهمة تعميم الشوط الصفرية.
في إجابة سؤال مفتوحة بسيطة (QA)، أصبح استرجاع كثيف أحد الأساليب القياسية لاستعادة المقاطع ذات الصلة إلى استنتاج إجابة.في الآونة الأخيرة، حققت الاسترجاع الكثيف أيضا نتائج أحدث النتائج في هفور تشاينا، حيث يلزم تجميع المعلومات من أجزاء متعددة من المعلوم ات والمناسبات عليها.على الرغم من نجاحها، فإن أساليب استرجاع كثيفة هي مكثفة حسابية، مما يتطلب تدريب GPUs المتعدد للتدريب.في هذا العمل، نقدم نهجا هجينا (معجميا وتكثيفا) تنافسية للغاية مع نماذج استرجاع كثيفة الحديث، مع مطالبة موارد حسابية أقل بكثير.بالإضافة إلى ذلك، نحن نقدم تقييم متعمق لأساليب استرجاع كثيفة على إعدادات الموارد الحاسوبية المحدودة، وهو شيء مفقود من الأدبيات الحالية.
إن التنبؤ بإجابة سؤال متعلقة بالمنتج هو مجال ناشئ من البحوث وجذب مؤخرا الكثير من الاهتمام. الإجابة على الأسئلة الذاتية والقائمة على الرأي هي الأكثر تحديا بسبب الاعتماد على المحتوى الذي تم إنشاؤه العملاء. يعمل السابق في الغالب على التنبؤ بالإجابة على مراجعة الاستعراض؛ ومع ذلك، فإن هذه الأساليب تفشل في منتجات جديدة أو غير شعبية، بعد مراجعات (أو قليلة فقط) في متناول اليد. في هذا العمل، نقترح نهج رواية ومكملة للتنبؤ بإجابة هذه الأسئلة، بناء على إجابات أسئلة مماثلة تم طرحها على منتجات مماثلة. نقيس التشابه السياقي بين المنتجات بناء على الإجابات التي توفرها لنفس السؤال. يستخدم إطار خبير في الخبراء للتنبؤ بالإجابة عن طريق تجميع الإجابات من المنتجات المماثلة للسياق. توضح النتائج التجريبية أن نموذجنا يتفوق على خطوط أساسية قوية في بعض شرائح الأسئلة، أي تلك التي لها ما يقرب من عشرة أسئلة واحدة أو أكثر مماثلة في الجور. بالإضافة إلى ذلك نشر مجموعات بيانات واسعة النطاق المستخدمة في هذا العمل، أحد أزواج أسئلة مماثلة، والثاني هو أزواج الإجابة على الأسئلة.
يهدف سؤال متعدد اللغات، الرد على الرسم البياني للمعرفة (KGQA) إلى استخلاص إجابات من الرسم البياني المعرفي (KG) للأسئلة بلغات متعددة. لتكون قابلة للتطبيق على نطاق واسع، نركز على إعداد نقل الطلقة الصفرية. هذا هو، يمكننا فقط الوصول إلى البيانات التدريبي ة فقط بلغة موارد عالية، بينما تحتاج إلى الإجابة على أسئلة متعددة اللغات دون أي بيانات معدنية باللغات المستهدفة. يتم تشغيل نهج مباشر إلى نماذج متعددة اللغات المدربة مسبقا (على سبيل المثال، MBERT) للنقل عبر اللغات، ولكن هناك فجوة كبيرة من الأداء KGQA بين المصدر واللغات المستهدفة. في هذه الورقة، نستمسى تحريض معجم ثنائي اللغة دون مقابل (BLI) لخريطة الأسئلة التدريبية في لغة المصدر في تلك الموجودة في اللغة المستهدفة مثل بيانات التدريب المعزز، والتي تتحل إلى عدم تناسق اللغة بين التدريب والاستدلال. علاوة على ذلك، نقترح استراتيجية تعليمية عدائية لتخفيف اضطراب بناء الجملة في البيانات المعززة، مما يجعل النموذج يميل إلى كل من اللغة والبنيات الاستقلال. وبالتالي، فإن نموذجنا يضيق الفجوة في تحويل صفرية عبر اللغات. التجارب على مجموعة بيانات KGQA متعددة اللغات مع 11 لغة موارد صفرية تحقق من فعاليتها.
تهدف تلخيص النص الاستخراجي إلى استخراج الأحكام الأكثر تمثيلا من وثيقة معينة كملخص لها. لاستخراج ملخص جيد من وثيقة نصية طويلة، يلعب تضمين الجملة دورا مهما. تتمتع الدراسات الحديثة باختصار شبكات عصبية لالتقاط العلاقة بين العلاقة بين الأمريكيين (مثل الرس م البياني للخطوط) داخل الوثائق لتعلم تضمين الجملة السياقية. ومع ذلك، فإن تلك النهج لا تنظر في أنواع متعددة من العلاقات بين العلاقات بين العلاقات بين العلاقات بين العلاقات العامة (على سبيل المثال، علاقات التدوين الدلالي والاتصال الطبيعي)، ولا علاقات نموذجية نموذجية (E.G، التشابه الدلالي والعلاقة الأساسية بين الكلمات). لمعالجة هذه المشكلات، نقترح شبكة تفصيلية رواية متعددة الأجزاء (متعددة الجنسيات) إلى نموذج أنواع مختلفة من العلاقات بين الجمل والكلمات. استنادا إلى Multi-GCN، نقترح طراز موجز جراب متعدد الأطراف (متعدد الأجراس) لتلخيص نص استخراج. أخيرا، نقوم بتقييم النماذج المقترحة على مجموعة بيانات CNN / DailyMaMail القياسية لإظهار فعالية طريقتنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا