يعمل العمل الأخير (فنغ وآخرون.، 2018) وجود شظايا مدخلات قصيرة غير قابلة للتفسير التي تحقق ثقة عالية ودقة في النماذج العصبية. نشير إلى هذه المدخلات الحد الأدنى للحفاظ على التنبؤ (MPPIS). في سياق الإجابة على السؤال، نحن نحقق في الفرضيات المتنافسة لوجود MPPIs، بما في ذلك ضعف المعايرة الخلفية للنماذج العصبية، ونقص الاحيلات، وتحيز DataSet "(حيث يتعلم نموذج الحضور إلى العظة الزائفة غير الجماعية بيانات التدريب). نكتشف التحير الثابت في MPPIS إلى بذور التدريب العشوائي، والهندسة المعمارية النموذجية، ومجال التدريب، والمجال التدريبي. إظهار MPPIS إمكانية نقل رائعة عبر المجالات التي تحقق أداء أعلى بكثير من استفسارات قصيرة مماثلة. بالإضافة إلى ذلك، فشل معاقبة الثقة الزائدة في MPPIS تحسين إما التعميم أو المتانة الخصومة. تشير هذه النتائج إلى إمكانية تفسير MPPIS غير كافية لتوصيف قدرة التعميم لهذه النماذج. نأمل أن يشجع هذا التحقيق المركز تحليلا منهجيا للسلوك النموذجي خارج التوزيع القابل للتفسير البشري للأمثلة.
Recent work (Feng et al., 2018) establishes the presence of short, uninterpretable input fragments that yield high confidence and accuracy in neural models. We refer to these as Minimal Prediction Preserving Inputs (MPPIs). In the context of question answering, we investigate competing hypotheses for the existence of MPPIs, including poor posterior calibration of neural models, lack of pretraining, and dataset bias'' (where a model learns to attend to spurious, non-generalizable cues in the training data). We discover a perplexing invariance of MPPIs to random training seed, model architecture, pretraining, and training domain. MPPIs demonstrate remarkable transferability across domains achieving significantly higher performance than comparably short queries. Additionally, penalizing over-confidence on MPPIs fails to improve either generalization or adversarial robustness. These results suggest the interpretability of MPPIs is insufficient to characterize generalization capacity of these models. We hope this focused investigation encourages more systematic analysis of model behavior outside of the human interpretable distribution of examples.
المراجع المستخدمة
https://aclanthology.org/
في الإجابة على الأسئلة المفتوحة للنطاق الرد (ضمان الجودة)، فإن آلية استرداد وقراءة القراءة لها الاستفادة المتأصلة من الترجمة الترجمة من الترجمة الشفوية وسهولة إضافة أو إزالة أو تحرير المعرفة مقارنة بالنهج المعلمة لنماذج QA كتاب مغلقة.ومع ذلك، من المع
يقارن تقييم نماذج الرد على الأسئلة التوضيحية حول التوقعات النموذجية. ومع ذلك، اعتبارا من اليوم، فإن هذه المقارنة تعتمد في الغالب معجمية، وبالتالي تفتقد الإجابات التي لا تحتوي على تداخل جذري ولكن لا تزال مماثلة متشابهة دلالة، وبالتالي علاج الإجابات ال
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا
ركزت أبحاث NLP باللغة العبرية إلى حد كبير على التورفولوجيا وبناء جملة، حيث تتوفر مجموعات البيانات المشروحة الغنية بروح التبعيات العالمية.ومع ذلك، تعد مجموعات البيانات الدلالية في العرض القصير، مما يعوق السلف الحاسم في تطوير تكنولوجيا NLP باللغة العبر
نقدم نظام إجابة استدعاء الاسترجاع على المعلومات للإجابة على الأسئلة القانونية.لا يقتصر النظام على مجموعة محددة مسبقا من الأسئلة أو الأنماط ويستخدم كلا من البحث المتساقط والشركات التجريبية للمدخلات لنظام إعادة الإجابة القائمة على برت.يتم استخدام مجموع