ترغب بنشر مسار تعليمي؟ اضغط هنا

على تحويل الحد الأدنى من المدخلات الاحتفاظ بالتنبؤ في الإجابة

On the Transferability of Minimal Prediction Preserving Inputs in Question Answering

333   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعمل العمل الأخير (فنغ وآخرون.، 2018) وجود شظايا مدخلات قصيرة غير قابلة للتفسير التي تحقق ثقة عالية ودقة في النماذج العصبية. نشير إلى هذه المدخلات الحد الأدنى للحفاظ على التنبؤ (MPPIS). في سياق الإجابة على السؤال، نحن نحقق في الفرضيات المتنافسة لوجود MPPIs، بما في ذلك ضعف المعايرة الخلفية للنماذج العصبية، ونقص الاحيلات، وتحيز DataSet "(حيث يتعلم نموذج الحضور إلى العظة الزائفة غير الجماعية بيانات التدريب). نكتشف التحير الثابت في MPPIS إلى بذور التدريب العشوائي، والهندسة المعمارية النموذجية، ومجال التدريب، والمجال التدريبي. إظهار MPPIS إمكانية نقل رائعة عبر المجالات التي تحقق أداء أعلى بكثير من استفسارات قصيرة مماثلة. بالإضافة إلى ذلك، فشل معاقبة الثقة الزائدة في MPPIS تحسين إما التعميم أو المتانة الخصومة. تشير هذه النتائج إلى إمكانية تفسير MPPIS غير كافية لتوصيف قدرة التعميم لهذه النماذج. نأمل أن يشجع هذا التحقيق المركز تحليلا منهجيا للسلوك النموذجي خارج التوزيع القابل للتفسير البشري للأمثلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في الإجابة على الأسئلة المفتوحة للنطاق الرد (ضمان الجودة)، فإن آلية استرداد وقراءة القراءة لها الاستفادة المتأصلة من الترجمة الترجمة من الترجمة الشفوية وسهولة إضافة أو إزالة أو تحرير المعرفة مقارنة بالنهج المعلمة لنماذج QA كتاب مغلقة.ومع ذلك، من المع روف أيضا أن تعاني من بصمة التخزين الكبيرة بسبب كوربوس وثائقها ومؤشرها.هنا، نناقش العديد من الاستراتيجيات المتعامدة لتقليل البصمة بشكل كبير من نظام QA لاسترداد ونظام QA المتسترف والقراءة بنسبة تصل إلى 160X.تشير نتائجنا إلى أن استرداد وقراءة القراءة يمكن أن يكون خيارا قابلا للتطبيق حتى في بيئة تخدم عالية للغاية مثل أجهزة الحافة، حيث نظهر أنه يمكن أن يحقق دقة أفضل من نموذج حزم بحزم مع حجم نظام منخفض المستوى من Docker.
يقارن تقييم نماذج الرد على الأسئلة التوضيحية حول التوقعات النموذجية. ومع ذلك، اعتبارا من اليوم، فإن هذه المقارنة تعتمد في الغالب معجمية، وبالتالي تفتقد الإجابات التي لا تحتوي على تداخل جذري ولكن لا تزال مماثلة متشابهة دلالة، وبالتالي علاج الإجابات ال صحيحة على أنها خاطئة. يعيق هذا التقليل من الأداء الحقيقي للنماذج قبول المستخدم في التطبيقات ويعقد مقارنة عادلة من النماذج المختلفة. لذلك، هناك حاجة إلى متري تقييم يعتمد على دلالات بدلا من تشابه السلسلة الخالصة. في هذه الورقة القصيرة، نقدم SAS، وهي متري مقرها في التشفير لتقدير تشابه الإجابة الدلالية، ومقارنتها بسبعة مقاييس موجودة. تحقيقا لهذه الغاية، نقوم بإنشاء مجموعة بيانات تقييم اللغة الإنجليزية ثلاثية وألمانية تحتوي على أزواج من الإجابات جنبا إلى جنب مع الحكم البشري من التشابه الدلالي، والتي نصرح لها جنبا إلى جنب مع تنفيذ Metric SAS والتجارب. نجد أن مقاييس التشابه الدلالي القائم على نماذج المحولات الأخيرة ترتبط بشكل أفضل بكثير مع الحكم البشري من مقاييس التشابه المعجمية التقليدية على مجموعات بياناتنا التي أنشأت حديثا ومجموعة بيانات واحدة من العمل ذي الصلة.
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا ت اختبار الباحث البشري من الألمانيةوالإنجليزية والهولندية في مهمة SIGMORPHON-UNIMORPH 2021 المشتركة، مع نتائج تنافسية.وقد ثبت بعض الخصائص الرسمية لعملية التعميم الحد الأدنى.تم تطوير طريقة تلقائية لإنشاء محفزات اختبار Wug للتجارب المستقبلية التي تحقق ما إذا كانت التعميمات المورفولوجية النموذجية ضئيلة للغاية.
ركزت أبحاث NLP باللغة العبرية إلى حد كبير على التورفولوجيا وبناء جملة، حيث تتوفر مجموعات البيانات المشروحة الغنية بروح التبعيات العالمية.ومع ذلك، تعد مجموعات البيانات الدلالية في العرض القصير، مما يعوق السلف الحاسم في تطوير تكنولوجيا NLP باللغة العبر ية.في هذا العمل، نقدم البسجة، والسؤال الأول يجيب على DataSet في العبرية الحديثة.تتبع DataSet التنسيق والتعبئة المنهجية من المنهجية من التدقيق، وتحتوي على ما يقرب من 3000 من الأمثلة المشروحة، مماثلة لمجموعات بيانات الإجابة على الأسئلة الأخرى بلغات الموارد المنخفضة.نحن نقدم نتائج خط الأساس الأولى باستخدام نماذج مصممة على طراز برت صدر مؤخرا للعبرية، مما يدل على أن هناك مجالا مهما للتحسين في هذه المهمة.
نقدم نظام إجابة استدعاء الاسترجاع على المعلومات للإجابة على الأسئلة القانونية.لا يقتصر النظام على مجموعة محددة مسبقا من الأسئلة أو الأنماط ويستخدم كلا من البحث المتساقط والشركات التجريبية للمدخلات لنظام إعادة الإجابة القائمة على برت.يتم استخدام مجموع ة من المجال العام والبيانات القانونية للتدريب.نظام الإجابة على السؤال الطبيعي في الإنتاج ويستخدم تجاريا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا