ترغب بنشر مسار تعليمي؟ اضغط هنا

تسأل الأسئلة الحديثة الإجابة على معايير القراءة والآلة في كثير من الأحيان تقلل من المهمة إلى واحدة من 12 يمتد في مقطع نص معين يجيب على السؤال المحدد. عادة ما تكون هذه النظم غير مطلوبة لفهم النص على مستوى أعمق يسمح بالتفكير الأكثر تعقيدا في المعلومات الواردة. نقدم مجموعة بيانات جديدة تسمى BIQUAD التي تتطلب فهم أعمق من أجل الإجابة على الأسئلة بطريقة استخراجية وملىذة. تتكون DataSet من 4،190 نص مغلقا ومما مجموعه 99،149 زوجا للإجابة على الأسئلة. تقوم النصوص بتوليد تقارير مباراة كرة القدم التي تنشط الأحداث الرئيسية لكل مباراة. تتم مصحوبة جميع النصوص برامج Datalog منظمة تمثل نموذجا (منطقي) من معلوماتها. نظهر أن طرازات ضمان الجودة لا تعمل بشكل جيد على سياقات النموذج الطويلة الصعبة ومتطلبات التفكير التي تطرحتها مجموعة البيانات. على وجه الخصوص، تحقق النماذج القائمة على المحولات الموجودة على النتائج F1 من 39.0 فقط. نوضح كيف تحاكي مجموعات البيانات الاصطناعية هذه المعرفة المهيكلة بالنص الطبيعي وتأمل نموذج المساعدة عند الاقتراب من فهم النص المعقد.
نقدم Inferbert، وهي طريقة لتعزيز نماذج الاستدلال القائمة على المحولات مع المعرفة العلائقية ذات الصلة. يسهل نهجنا تعلم أنماط الاستدلال العامة التي تتطلب معرفة علوية (على سبيل المثال الاستدلالات المتعلقة بفرط النعطح) أثناء التدريب، مع حقنها عند الطلب ا لحقائق العلائقية ذات الصلة (E.G. Pangolin هي حيوان) في وقت الاختبار. نطبق Inferbert بمهمة NLI على مجموعة متنوعة من أنواع الاستدلال (ارتفاع ضغط الدم، الموقع، اللون، وبلد بلد المنشأ)، التي جمعنا مجموعات بيانات التحدي. في هذا الإعداد، ينجح Inferbert في تعلم أنماط الاستدلال العام، من عدد صغير نسبيا من مثيلات التدريب، مع عدم إظليل الأداء على بيانات NLI الأصلية وتفوق نماذج تحسين المعرفة السابقة بشكل كبير على بيانات التحدي. وينطبق كذلك استنتاجاتها بنجاح في وقت اختبار الكيانات غير المفككة سابقا. Inferbert هو أكثر كفاءة على حسابي أكثر كفاءة من معظم الطرق السابقة، من حيث عدد المعلمات واستهلاك الذاكرة وتدريب الوقت.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا