ترغب بنشر مسار تعليمي؟ اضغط هنا

سبارتا: سؤال نصي يجيب على المعيار للتفكير المكاني

SPARTQA: A Textual Question Answering Benchmark for Spatial Reasoning

475   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقترح هذه الورقة معيارا للإجابة على الأسئلة (QA) للمنطق المكاني للنص اللغوي الطبيعي الذي يحتوي على ظواهر مكانية واقعية غير مغطاة بعمل مسبق وهو أمر صعب طرازات اللغة الحديثة (LM).نقترح طريقة الإشراف البعيدة لتحسين هذه المهمة.على وجه التحديد، نقوم بتصميم قواعد النحو والتفكير لإنشاء وصفا مكاني تلقائيا للمشاهد البصرية وأزواج ضمان الجودة المقابلة.تظهر التجارب أن محاور LMS بشكل أكبر على هذه البيانات التي تم إنشاؤها تلقائيا تعمل بشكل كبير على تحسين قدرة LMS على الفهم المكاني، والذي يساعد بدوره في حل مجموعات بيانات خارجية، و Babi، و Boolq.نأمل أن يعزز هذا العمل التحقيقات في نماذج أكثر تطورا للمناسبات المكانية على النص.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقتصر مقاييس تقييم سؤال الفيديو (VIDQA) على إجابة كلمة واحدة أو اختيار عبارة من مجموعة ثابتة من العبارات.هذه المقاييس تحد من سيناريو تطبيق نماذج VIDQA.في هذا العمل، نستفيد الأدوار الدلالية المستمدة من أوصاف الفيديو لإخفاء عبارات معينة، لإدخال VIDQAP الذي يطرح VIDQA كامرأة تعبئة العبارة.لتمكين تقييم الجمل الإجابة، نحسب التحسين النسبي للإجابة المتوقعة مقارنة بسلسلة فارغة.لتقليل تأثير التحيز اللغوي في مجموعات بيانات VIDQA، نسترجع شريط فيديو له إجابة مختلفة لنفس السؤال.لتسهيل البحث، نقوم ببناء AttactNet-SRL-QA و Charads-SRL-QA ومقاييسهم عن طريق تمديد ثلاث نماذج لغة رؤية.نحن نقوم بإجراء تحليل مكثف ودراسات ablative لتوجيه العمل في المستقبل.الرمز والبيانات عامة.
تحقق نماذج الرد على الأسئلة النصية الحالية (QA) أداء قوي على مجموعات اختبار داخل المجال، ولكن في كثير من الأحيان القيام بذلك عن طريق تركيب أنماط المستوى السطحي، لذلك فشلوا في التعميم لإعدادات خارج التوزيع. لجعل نظام ضمان الجودة أكثر قوة ومفهومة، نقوم بالنماذج النموذجية في الإجابة كمشكلة محاذاة. نحن نحلل كل من السؤال والسياق إلى وحدات أصغر بناء على التمثيلات الدلالية خارج الرف (هنا، الأدوار الدلالية)، ومحاذاة السؤال إلى مجموعة فرعية من السياق من أجل العثور على الجواب. نقوم بصياغة نموذجنا كإدارة منظمة تنظم، مع درجات المحاذاة المحسوبة عبر Bert، ويمكننا تدريب نهاية إلى نهاية على الرغم من استخدام شعاع البحث عن الاستدلال التقريبي. يتيح لنا استخدامنا للتويات الصريحة استكشاف مجموعة من القيود التي يمكننا حظرها أنواع معينة من السلوك النموذجي السيئ الناشئ في إعدادات المجال عبر. علاوة على ذلك، من خلال التحقيق في الاختلافات في الدرجات عبر الإجابات المحتملة المختلفة، يمكننا أن نسعى لفهم جوانب معينة من المدخلات التي تقدم النموذج لاختيار الإجابة دون الاعتماد على تقنيات تفسير ما بعد المخصص. نحن ندرب نموذجنا على فرقة V1.1 واختبرها على العديد من مجموعات بيانات الخصومة والخروج. تشير النتائج إلى أن طرازنا أكثر قوة من طراز Bert QA القياسي، والقيود المستمدة من درجات المحاذاة تسمح لنا بالتنازل بفعالية من التغطية والدقة بشكل فعال.
معظم أساليب الإجابة على الأسئلة القائمة على المعرفة الحالية (KBQA) تعلم أولا تعيين السؤال المحدد في رسم بياني للاستعلام، ثم قم بتحويل الرسم البياني إلى استعلام قابل للتنفيذ للعثور على الإجابة.عادة ما يتم توسيع الرسم البياني للاستعلام تدريجيا من كيان الموضوع بناء على نموذج تنبؤ التسلسل.في هذه الورقة، نقترح حل جديد للاستعلام عن جيل الرسم البياني الذي يعمل بالطريقة المعاكسة: نبدأ مع قاعدة المعرفة بأكملها وتقليصها تدريجيا إلى الرسم البياني للاستعلام المرغوب فيه.يعمل هذا النهج على تحسين كفاءة ودقة جيل الرسم البياني للاستعلام، خاصة بالنسبة لأسئلة قفز متعددة المعقدة.تظهر النتائج التجريبية أن طريقتنا تحقق أداء حديثة على مجموعة بيانات ComplexwebQuestion (CWQ).
تفترض السؤال المتعدد اللغات الرد على المهام عادة أن الإجابات موجودة بنفس اللغة مثل السؤال. ومع ذلك، في الممارسة العملية، تواجه العديد من اللغات كل من ندرة المعلومات --- حيث تحتوي اللغات على عدد قليل من المقالات المرجعية --- واستاجةم المعلومات --- أين الأسئلة المرجعية المفاهيم من الثقافات الأخرى. يمتد هذا العمل سؤالا مفتوحا للاسترجاع الرد على الإعداد المتبادل الذي تمكن الأسئلة من لغة واحدة للإجابة على محتوى الإجابة من لغة أخرى. نحن نبني مجموعة بيانات واسعة النطاق تم بناؤها على أسئلة 40K تسعى للحصول على معلومات عبر 7 لغات غير الإنجليزية متنوعة لا يمكن أن تجد Tydi QA إجابات لغة نفسها. استنادا إلى هذه البيانات، نقدم إطار عمل، يسمى سؤالا عبر اللغات المفتوح استرجاع الإجابة (XOR QA)، الذي يتكون من ثلاث مهام جديدة تنطوي على استرجاع وثائق عبر اللغات من موارد متعددة اللغات والإنجليزية. نقوم بإنشاء خطوط الأساس مع أنظمة ترجمة من الآلة الحديثة ونماذج مسببة الاحتياطية عبر اللغات. تشير النتائج التجريبية إلى أن XOR QA هي مهمة صعبة سيسهل تطوير تقنيات جديدة للإجابة على الأسئلة متعددة اللغات. تتوفر بياناتنا ورمزنا في https://nlp.cs.washington.edu/xorqa/.
الإجابة السؤالية (QA) هي واحدة من أكثر المهام التحدي والآثار في معالجة اللغة الطبيعية.ومع ذلك، ركزت معظم الأبحاث في ضمان الجودة على النطاق المفتوح أو الأبدية في حين أن معظم تطبيقات العالم الواقعي تعامل مع مجالات أو لغات محددة.في هذا البرنامج التعليمي ، نحاول سد هذه الفجوة.أولا، نقدم معايير قياسية في مجال QA متعدد اللغات متعددة اللغات.في كل من السيناريوهين، نناقش النهج الحديثة التي تحقق أداء مثير للإعجاب، تتراوح من التعلم من تحويل صفرية إلى التدريب خارج الصندوق مع أنظمة QA المجال المفتوحة.أخيرا، سنقدم مشاكل بحثية مفتوحة أن أجندة الأبحاث الجديدة تشكل مثل التعلم متعدد المهام، وتعلم التحويل عبر اللغات، وتكييف المجال وتدريب نماذج لغة متعددة اللغات المدربة مسبقا مسبقا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا