ترغب بنشر مسار تعليمي؟ اضغط هنا

تبحث وراء الاستدلال باللغة الطبيعية على مستوى الجملة للحصول على سؤال الرد وتلخيص النص

Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization

402   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

حقق استنتاج اللغة الطبيعي (NLI) اهتماما كبيرا في السنوات الأخيرة؛ومع ذلك، ظل وعد تطبيق اختراقات NLI لمهام NLP الأخرى المنفذة غير الموحدة.في هذا العمل، نستخدم الفهم القروض متعدد الخيارات (MCRC) وفحص صحة واقعية لمهام التلخيص النصي (CFCS) للتحقيق في الأسباب المحتملة لهذا.تظهر النتائج الخاصة بنا أن: (1) الطول الأقصر نسبيا في مجموعات بيانات NLI التقليدية هو التحدي الرئيسي الذي يحظر الاستخدام في تطبيقات المصب (التي تفعل أفضل مع سياقات أطول)؛(2) يمكن معالجة هذا التحدي عن طريق تحويل مجموعات بيانات فهم القراءة الغنية بالموارد إلى مجموعات بيانات NLI أطول؛و (3) تتفوق النماذج المدربة على مجموعات بيانات الفرضية المحولة والأطول الفرضية تلك المدربة باستخدام مجموعات بيانات NLI التقليدية القصيرة في مهام المصب في المقام الأول بسبب الفرق في أطوال الفرضية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أدت طرازات اللغة الكبيرة المدربة مسبقا (PLMS) إلى نجاح كبير في مهام الإجابة على الأسئلة المختلفة (QA) في أزياء نهاية إلى نهاية.ومع ذلك، تم إيلاء القليل من الاهتمام وفقا لمعرفة المعرفة المنطقية لتمييز مهام ضمان الجودة هذه.في هذا العمل، اقترحنا تصنيف ا لدلالات اللازمة لهذه المهام باستخدام SocialIQA كمثال.بناء على فئات المعرفة الاجتماعية الخاصة بنا المسمى DataSet على رأس SocialiQa، نربط نماذج QA العصبية لدمج فئات المعرفة الاجتماعية هذه ومعلومات العلاقة بين قاعدة المعرفة.على عكس العمل السابق، نلاحظ نماذجنا مع تصنيفات دلالية للمعرفة الاجتماعية يمكن أن تحقق أداء مماثل مع نموذج بسيط نسبيا وحجم أصغر مقارنة بالمناهج المعقدة الأخرى.
مراجعة العقود هي إجراء يستغرق وقتا طويلا يتحمل نفقات كبيرة للشركات وعدم المساواة الاجتماعية لأولئك الذين لا يستطيعون تحمل تكاليفها. في هذا العمل، نقترح استنتاج اللغة الطبيعي على مستوى المستند (NLI) للعقود "، وهو جديد، تطبيق عالمي حقيقي من NLI يتناول مثل هذه المشاكل. في هذه المهمة، يتم إعطاء نظام مجموعة من الفرضيات (مثل بعض الالتزامات بالاتفاق قد ينجو من الإنهاء. ") وعقد، ويطلب منها تصنيف ما إذا كانت كل فرضية تنطوي عليها" "، تناقض مع" لم يذكره "(محايد) العقد وكذلك تحديد الأدلة" للقرار على أنه يمتد في العقد. شرحنا وإطلاق سراح أكبر جوربوس حتى الآن يتكون من 607 عقدا مشروحا. نوضح بعد ذلك أن النماذج الحالية تفشل بشكل سيء في مهمتنا وإدخال خط أساس قوي، والتي (أ) تحديد دليل الأدلة كتصنيف متعدد العلامات على المدافع بدلا من محاولة التنبؤ بطارية الرموز البديلة والنهاية، و (ب) توظف تجزئة السياق أكثر تطورا للتعامل مع وثائق طويلة. نوضح أيضا أن الخصائص اللغوية للعقود، مثل النفي من خلال الاستثناءات، تساهم في صعوبة هذه المهمة وأن هناك مجالا كبيرا للتحسين.
يحقق نماذج اللغة التعلم المستندة عميقا (DL) أداء عال في مختلف المعايير لاستدلال اللغة الطبيعية (NLI).وفي هذا الوقت، يتلقى النهج الرمزية ل NLI اهتماما أقل.كلا النهجين (الرمزي و DL) لديهم مزاياهم وموضعاتهم.ومع ذلك، حاليا، لا توجد طريقة تجمع بينها في نظ ام لحل مهمة NLI.لدمج أساليب التعلم الرمزي والعميقة، نقترح إطار استنتاجي يسمى NeuRallog، والذي يستخدم محرك الاستدلال المنطقي على حد سواء ونموذج لغة الشبكة العصبية لمحاذاة العبارة.نماذج إطار عملنا مهمة NLI كصورة بحث كلاسيكية وتستخدم خوارزمية البحث في شعاع البحث عن مسارات الاستدلال الأمثل.تظهر التجارب أن نظامنا المشترك ومنطق الاستدلال العصبي يحسن الدقة في مهمة NLI ويمكن أن تحقق دقة حديثة على مجموعات البيانات المريضة والمتوسطة.
يمكن إلقاء العديد من الأسئلة المفتوحة على المشكلات بمثابة مهمة استقامة نصية، حيث يتم تسليم الإجابات السؤال والمرشح لتشكيل الفرضيات. ثم يحدد نظام ضمان الجودة إذا كان قواعد المعرفة الداعمة، التي تعتبر مباني محتملة، تنطوي على الفرضيات. في هذه الورقة، نح قق في نهج ضمان الجودة العصبي الرمزي الذي يدمج المنطق الطبيعي في مجال البندسة التعليمية العميقة، نحو تطوير نماذج إجابة فعالة وغير قابلة للتفسير. النموذج المقترح يسجل تدريجيا فرضية ومباني مرشحة بعد خطوات الاستدلال المنطقي الطبيعي لبناء مسارات إثبات. يتم قياس درجات الاستلام بين الفرضيات المتوسطة المكتسبة ومباني المرشح لتحديد ما إذا كانت الفرضية تستلزم الفرضية. نظرا لأن عملية التفكير الطبيعي للمنطق تشكل هيكل يشبه الأشجار وتسلسلا هرميا، فإننا قمنا بتضمين الفرضيات والمباني في مساحة مفرطة بدلا من مساحة Euclidean للحصول على تمثيلات أكثر دقة. تجريبيا، وطريقة لدينا تفوقت على العمل المسبق على الإجابة على أسئلة علوم متعددة الخيارات، وتحقيق أفضل النتائج في مجموعة بيانات متوفرة للجمهور. توفر عملية الاستدلال المنطقي الطبيعي بطبيعتها الأدلة للمساعدة في تفسير عملية التنبؤ.
تعد المعلومات التي تطلبها خطوة أساسية للسؤال المفتوح الإجابة على جمع الأدلة الكفاءة من كوربوس كبيرة. في الآونة الأخيرة، أثبتت النهج التكرارية أن تكون فعالة للأسئلة المعقدة، من خلال استرداد أدلة جديدة بشكل متكرر في كل خطوة. ومع ذلك، فإن جميع الأساليب التكرارية الحالية تقريبا تستخدم استراتيجيات محددة مسبقا، إما تطبيق نفس وظيفة الاسترجاع عدة مرات أو إصلاح ترتيب وظائف استرجاع مختلفة، والتي لا يمكنها الوفاء بالمتطلبات المتنوعة من الأسئلة المختلفة. في هذه الورقة، نقترح استراتيجية رواية تكيفية تسعى للحصول على معلومات عن أسئلة مفتوحة، وهي AISO. على وجه التحديد، يتم تصميم عملية الاسترجاع والأجوبة بأكملها كعملية اتخاذ قرار Markov الملحوظ جزئيا، حيث يتم تعريف ثلاثة أنواع من عمليات استرجاع (مثل E.G.، BM25 و DPR وارتباط التشعبي) وعملية إجابة واحدة كإجراءات. وفقا للسياسة المستفادة، يمكن ل AISO اختيار إجراءات استرجاع مناسبة ستكيفا للبحث عن الأدلة المفقودة في كل خطوة، بناء على الأدلة التي تم جمعها واستفسلة إعادة صياغة، أو إخراج الإجابة مباشرة عندما تكون مجموعة الأدلة كافية للسؤال. تبين تجارب في تشكيلة مفتوحة و hotpotqa fullwiki، التي تخدم مع معايير قافلة واحدة مفتوحة ومتعددة النطاق، أن AISO تفوقت على جميع الأساليب الأساسية مع استراتيجيات محددة مسبقا فيما يتعلق بتقييمات الاسترجاع والإجابة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا