ترغب بنشر مسار تعليمي؟ اضغط هنا

الفتح: إعادة صياغة السؤال السياقي من خلال جيل السؤال الاصطناعي على دراية

ConQuest: Contextual Question Paraphrasing through Answer-Aware Synthetic Question Generation

340   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

على الرغم من الأداء الممتاز في مهام مثل الإجابة على الأسئلة، تظل الهيغات القائمة على المحولات حساسة للمغوصات النحوية والسياقية. توفر إعادة صياغة الأسئلة (QP) حلا واعدا كوسيلة لزيادة مجموعات البيانات الحالية. تتضمن التحديات الرئيسية لنماذج QP الحالية عدم وجود بيانات تدريبية وصعوبة في توليد أسئلة متنوعة وطبيعية. في هذه الورقة، نقدم الفتح، إطارا لتوليد مجموعات البيانات الاصطناعية للحصول على إعادة صياغة الأسئلة السياقية. تحقيقا لهذه الغاية، توظف الفتح أولا نموذج جيل سؤال للإجابة (QG) لإنشاء مجموعة بيانات سؤال-زوج ثم يستخدم هذه البيانات لتدريب نموذج إعادة صياغة الأسئلة السياقية. نقوم بتقييم الفتح على نطاق واسع وإظهار قدرتها على إنتاج أزواج أسئلة متنوعة وطلاقة أكثر من الأساليب الحالية. ينشئ نموذج إعادة الصياغة السياقية لدينا أيضا خط أساس قوي للحصول على إعادة صياغة سياقية نهاية إلى نهاية. علاوة على ذلك، نجد أن السياق يمكن أن يحسن النتيجة BLEU-1 على الضغط السياقي والتوسع بنسبة 4.3 و 11.2 على التوالي، مقارنة بنموذج غير سياقي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

على الرغم من إظهار قيم واعدة للتطبيقات المصب، فإن توليد السؤال والإجابة معا يتم استكشافها. في هذه الورقة، نقدم مهمة جديدة تستهدف توليد زوج الإجابة على الأسئلة من الصور المرئية. لا يتطلب عدم توليد أزواج حول الإجابات المتنوعة فقط ولكن أيضا الحفاظ على ا لاتساق منهم. نحن ندرس نماذج جيل مختلفة لهذه المهمة واقتراح ثلاث نماذج: نموذج خط الأنابيب، النموذج المشترك، النموذج المتسلسل. نحن ندمج الاستدلال الاختلافي في هذه النماذج لتحقيق التنوع والاتساق. ونحن نقترح أيضا تقدير تمثيل المنطقة ومحاذاة الاهتمام لتحسين الاتساق أكثر. ونحن أخيرا وضع مقيم كقيط كمي للاتساق. نحن نقوم بالتحقق من نهجنا على معيارين، VQA2.0 و Visual-7W، من خلال تقييم التنوع والاتساق يدويا يدويا. تظهر النتائج التجريبية فعالية نماذجنا: يمكن أن تولد أزواج متنوعة أو متسقة. علاوة على ذلك، يمكن استخدام هذه المهمة لتحسين جيل السؤال المرئي والإجابة على السؤال المرئي.
وسط ارتفاع احتياجات الصحة العقلية في المجتمع، يتم نشر العوامل الافتراضية بشكل متزايد في المشورة. من أجل تقديم المشورة ذات الصلة، يجب على المستشارين أولا الحصول على فهم للقضايا المطروحة من خلال إظهار التقاسم من المستشار. من المهم وبالتالي بالنسبة للمس تشار Chatbot لتشجيع المستخدم على الانفتاح والتحدث. إحدى الطرق للحفاظ على تدفق المحادثة هي الاعتراف بالنقاط الرئيسية لاستشار المستشار عن طريق إعادة استخدامها، أو تحقيقها أكثر مع الأسئلة. تطبق هذه الورقة نماذج من مهام PLLP ذات الصلة ارتباطا وثيقا --- تلخيص وتوليد الأسئلة --- لإعادة التعميد وتوليد السؤال في سياق المشورة. أجرينا تجارب على مجموعة بيانات مشروحة يدويا من أزواج الكانتونية بعد الرد على الموضوعات المتعلقة بالوحدة والقلق الأكاديمي والقلق الاختبار. لقد حصلنا على أفضل أداء في كلا من إعادة تناوله وتوليد الأسئلة من خلال Bertsum Berting، وهو نموذج تلخيص حديثة، مع مجموعة البيانات اليدوية داخل المجال المعزز بمجموعة بيانات مفتوحة واسعة النطاق تلقائيا.
تم إظهار نماذج الإجابة على الأسئلة (QA) للحصول على فهم القراءة لاستغلال تحيزات محددات غير مقصودة مثل السؤال - التداخل المعجمي السياق. هذا يعيق نماذج ضمان الجودة من المعمم إلى العينات الممثلة تمثيلا مثل الأسئلة ذات التداخل المعجمي المنخفض. يمكن أن يكو ن جيل السؤال (QG)، وهي طريقة لتعزيز مجموعات بيانات QA، حل تدهور الأداء إذا كان QG يمكن أن Debias QA بشكل صحيح. ومع ذلك، نكتشف أن نماذج QG العصبية الأخيرة متحيزة نحو توليد الأسئلة ذات التداخل المعجمي العالي، والتي يمكن أن تضخيم تحيز DataSet. علاوة على ذلك، يكشف تحليلنا أن تكبير البيانات مع نماذج QG هذه تضعف بشكل متكرر الأداء على الأسئلة مع التداخل المعجمي المنخفض، مع تحسين ذلك على الأسئلة ذات التداخل المعجمي العالي. لمعالجة هذه المشكلة، نستخدم نهج مرادف يستند إلى استبدال أسئلة زيادة التداخل المعجمي المنخفض. نوضح أن نهج تكبير البيانات المقترح بسيط ولكنه فعال في التخفيف من مشكلة التدهور مع الأمثلة الاصطناعية 70K فقط.
يسأل الأسئلة المفتوحة الإجابة على تحديد إجابات الأسئلة التي أنشأتها المستخدم في مجموعات ضخمة من المستندات. أساليب Readriever-Reverse Graph النهج هي أسران كبيرتان من الحلول لهذه المهمة. يطبق قارئ المسترد أولا تقنيات استرجاع المعلومات للحصول على تحديد عدد قليل من الممرات التي من المحتمل أن تكون ذات صلة، ثم تغذي النص المسترد إلى قارئ شبكة عصبي لاستخراج الإجابة. بدلا من ذلك، يمكن بناء الرسوم البيانية المعرفة واستفسارها للإجابة على أسئلة المستخدمين. نقترح خوارزمية مع تصميم رواية Reader-Reader - يختلف عن كل من العائلات. يستخدم Reader-Retriever أولا قارئ حاليا لقراءة الكائن وإنشاء مجموعات من جميع الأسئلة المجدية المرتبطة بإجاباتهم، ثم يستخدم المسترد عبر الإنترنت للاستجابة لاستعلامات المستخدم من خلال البحث في مساحات الأسئلة التي تم إنشاؤها مسبقا للحصول على إجابات أكثر احتمالا أن يطلب في الطريقة المحددة. ندمج مزيد من الجمع بين قارئ المسترجع واحد واسترجاع القارئين في نموذج هجين يسمى R6 لأفضل أداء. تبين تجارب مع مجموعة بيانات عامة واسعة النطاق أن R6 يحقق دقة حديثة.
إلى جانب توفر مجموعات بيانات واسعة النطاق، مكنت هياكل التعلم العميق التقدم السريع في مهمة الإجابة على السؤال.ومع ذلك، فإن معظم مجموعات البيانات هذه باللغة الإنجليزية، وأدائيات النماذج متعددة اللغات الحديثة أقل بكثير عند تقييمها على البيانات غير الإنج ليزية.نظرا لتكاليف جمع البيانات العالية، فهي ليست واقعية للحصول على بيانات مشروحة لكل لغة رغبة واحدة لدعمها.نقترح طريقة لتحسين السؤال المتبادل الإجابة على الأداء دون الحاجة إلى بيانات مشروح إضافية، واستفادة نماذج توليد السؤال لإنتاج عينات اصطناعية في أزياء متصلة.نظهر أن الطريقة المقترحة تتيح التوفيق بشكل كبير على خطوط الأساس المدربين على بيانات اللغة الإنجليزية فقط.نبلغ عن أحدث طرف جديد في أربع مجموعات بيانات: MLQA و Xquad و Squad-It و PIAF (FR).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا