ترغب بنشر مسار تعليمي؟ اضغط هنا

أسئلة المتابعة الترطفة بصريا: مجموعة بيانات من الأسئلة المكانية التي تتطلب تاريخ الحوار

Visually Grounded Follow-up Questions: a Dataset of Spatial Questions Which Require Dialogue History

316   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نحدد وتقييم منهجية لاستخراج الأسئلة المكانية التي تعتمد على التاريخ من الحوارات البصرية.نقول أن السؤال يعتمد على التاريخ إذا كان يتطلب (أجزاء) تاريخ حواره المراد تفسيره.نقول أن بعض أنواع الأسئلة المرئية تحدد السياق الذي يعتمد عليه سؤال مكاني للمتابعة.نسمي السؤال الذي يقيد السياق: الزناد، ونحن نسمي السؤال المكاني الذي يتطلب الإجابة على سؤال الزناد: Zoomer.نستخرج تلقائيا أزواج الزناد و Zoomer المختلفة بناء على خاصية Visual التي تعتمد الأسئلة عليها (على سبيل المثال، اللون، رقم).نحل تدريجيا يدويا أزواج الزناد و Zoomer المستخرجة تلقائيا للتحقق من أن Zoomers التي تتطلب الزناد.نحن ننفذ بنية أساسية بسيطة بناء على تشفير سوتا متعددة الوسائط.نتائجنا تكشف أن هناك مساحة كبيرة لتحسين الإجابة على الأسئلة التي تعتمد على التاريخ.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

قراء قراء أوراق البحث الأكاديمي غالبا ما يقرؤون بهدف الإجابة على أسئلة محددة. يمكن للإجابة على الأسئلة التي يمكن أن ترد على هذه الأسئلة إجراء استهلاك المحتوى أكثر كفاءة بكثير. ومع ذلك، فإن بناء هذه الأدوات يتطلب بيانات تعكس صعوبة المهمة الناشئة عن ال تفكير المعقد حول المطالبات المقدمة في أجزاء متعددة من الورقة. في المقابل، تحتوي الأسئلة الحالية على المعلومات المتعلقة بالمعلومات الرد على مجموعات البيانات عادة أسئلة حول المعلومات العامة من النوع العامل. لذلك نحن نقدم QASPER، مجموعة بيانات من 5049 سؤالا أكثر من 1585 ورقة معالجة اللغة الطبيعية. يتم كتابة كل سؤال بممارس NLP الذي قرأ فقط عنوان وإجراء ملخص للورقة المقابلة، والسؤال يسعى للحصول على معلومات موجودة في النص الكامل. ثم تتم الإجابة على الأسئلة من قبل مجموعة منفصلة من ممارسين NLP الذين يقدمون أيضا الأدلة الداعمة للإجابات. نجد أن النماذج الحالية التي تعمل بشكل جيد على مهام ضمان الجودة الأخرى لا تؤدي بشكل جيد في الإجابة على هذه الأسئلة، وأيضا الأد من البشر بنسبة 27 نقطة على الأقل عند الإجابة عليها من الأوراق بأكملها، تحفز المزيد من الأبحاث في الوثائق التي تأسست، حيث تسعى للحصول على المعلومات، والتي تم تصميم DataSet لدينا لتسهيل.
إن التنبؤ بإجابة سؤال متعلقة بالمنتج هو مجال ناشئ من البحوث وجذب مؤخرا الكثير من الاهتمام. الإجابة على الأسئلة الذاتية والقائمة على الرأي هي الأكثر تحديا بسبب الاعتماد على المحتوى الذي تم إنشاؤه العملاء. يعمل السابق في الغالب على التنبؤ بالإجابة على مراجعة الاستعراض؛ ومع ذلك، فإن هذه الأساليب تفشل في منتجات جديدة أو غير شعبية، بعد مراجعات (أو قليلة فقط) في متناول اليد. في هذا العمل، نقترح نهج رواية ومكملة للتنبؤ بإجابة هذه الأسئلة، بناء على إجابات أسئلة مماثلة تم طرحها على منتجات مماثلة. نقيس التشابه السياقي بين المنتجات بناء على الإجابات التي توفرها لنفس السؤال. يستخدم إطار خبير في الخبراء للتنبؤ بالإجابة عن طريق تجميع الإجابات من المنتجات المماثلة للسياق. توضح النتائج التجريبية أن نموذجنا يتفوق على خطوط أساسية قوية في بعض شرائح الأسئلة، أي تلك التي لها ما يقرب من عشرة أسئلة واحدة أو أكثر مماثلة في الجور. بالإضافة إلى ذلك نشر مجموعات بيانات واسعة النطاق المستخدمة في هذا العمل، أحد أزواج أسئلة مماثلة، والثاني هو أزواج الإجابة على الأسئلة.
نحن نبحث عن طرق لإنشاء مفاهيم معقدة في النصوص من تلك البدائية أثناء تأسيسها في الصور.نقترح الرسم البياني للمفهوم والعلاقة (CRG)، والتي تبني أعلى تحليل الدوائر الانتخابية وتتكون من مفاهيم مجتمعة متكررة مع وظائف المسند.وفي الوقت نفسه، نقترح كسبية مفهوم شبكة عصبية تسمى الملحن للاستفادة من CRG للتعلم المفهوم الأساس بصريا.على وجه التحديد، نتعلم تأريض كل من المفاهيم البدائية وجميع المفاهيم المكونة عن طريق محاذاةها إلى الصور وإظهار أن التعلم من تأليف يؤدي إلى نتائج أساسية أكثر قوة، مما يقاس بدقة مطابقة النص إلى الصورة.والجدير بالذكر أن نموذجنا يمكن أن ينشفي المفاهيم المتطرفة التي تشكل على مستوى الجملة الدقيقة على مستوى الجملة ومستوى الحمض المعترض (أو مستوى الكلمات).يؤدي الملحن إلى تحسين وضوحا في دقة مطابقة عندما تحتوي بيانات التقييم على تباين مركب كبير من بيانات التدريب.
تقدم هذه الورقة MediaSum، مجموعة بيانات مقابلة الوسائط على نطاق واسع تتكون من نصوص 463.6 كيلو بايت مع ملخصات إبتياج.لإنشاء هذه البيانات، نجمع مخالفات المقابلة من NPR و CNN وتوظيف نظرة عامة وأوصاف موضوع كملخصات.مقارنة مع الشركة العامة القائمة للحصول ع لى تلخيص الحوار، فإن DataSet لدينا هي أمر من حيث الحجم ويحتوي على محادثات متعددة الأحزاب المعقدة من مجالات متعددة.نقوم بإجراء تحليل إحصائي لإظهار التحيز الموضعي الفريد المعروض في نصوص المقابلات التلفزيونية والإذاعية.نظهر أيضا أن MediaSum يمكن استخدامه في تعلم التعلم لتحسين أداء نموذج على مهام تلخيص حوار أخرى.
تمكين أنظمة حوار المجال المفتوح لطرح أسئلة توضيحية عند الاقتضاء هو اتجاه مهم لتحسين جودة استجابة النظام.وهي، بالنسبة للحالات عندما يكون طلب المستخدم غير محددا لنظام محادثة لتوفير إجابة على الفور، فمن المستحسن طرح سؤال توضيحي لزيادة فرص استرداد إجابة مرضية.لمعالجة مشكلة توضيح الأسئلة في الحوارات المفتوحة في الحوارات ": (1) نجمع وتحرير مجموعة بيانات جديدة تركز على المحادثات المفتوحة ومتعددة الدورات، (2) نحن معيارا عدة حالاتخطوط الأساس العصبية الفن، و (3) نقترح خط أنابيب يتكون من خطوات غير متصلة بالإنترنت وعلى الإنترنت لتقييم جودة توضيح الأسئلة في حوارات مختلفة.هذه المساهمات مناسبة كمؤسسة لمزيد من البحث.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا