ترغب بنشر مسار تعليمي؟ اضغط هنا

ربط الوثائق وسلوك نموذج ضمان الجودة في واقعية

Connecting Attributions and QA Model Behavior on Realistic Counterfactuals

344   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

عندما يبرز تقنية إسناد نموذجية جزءا خاصا من المدخلات، قد يفهم المستخدم هذا الضوء على أنه بيان حول Worklactuals (Miller، 2019): إذا كان هذا الجزء من الإدخال هو التغيير، فقد يتغير تنبؤ النموذج أيضا. تحقق هذه الورقة في مدى توافق تقنيات الإسناد المختلفة مع هذا الافتراض على مواجهة بشكل واقعي في حالة قراءة الفهم (RC). RC هي حالة اختبار صعبة بشكل خاص، كأداة مستوية على مستوى الرمز المميز الذي تم دراسته على نطاق واسع في مهام NLP الأخرى مثل تحليل المعرفات أقل مناسبا لتمثيل التفكير الذي تؤدي نماذج RC. نقوم بإنشاء مجموعات مضادة لثلاث إعدادات RC مختلفة، ومن خلال الاستدلال التي يمكنها توصيل نواتج أساليب الإسناد إلى سلوك نموذج رفيع المستوى، يمكننا تقييم مدى فائدة أساليب الإسناد المختلفة وحتى التنسيقات المختلفة لفهم الوسائل المتعددة. نجد أن نسبة الزوجية أكثر ملاءمة بشكل أفضل ل RC من سمات المستوى الرمز المميز عبر هذه الإعدادات المختلفة RC، مع أفضل أدائنا القادم من التعديل الذي نقترحه لطريقة إسناد الزوجية الحالية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الوسائل المضادة هي وسيلة قيمة لفهم القرارات التي اتخذتها أنظمة ML.ومع ذلك، فإن الوسادة المتعرضية الناتجة عن الأساليب المتاحة حاليا لنص اللغة الطبيعية هي غير واقعية أو إدخال تغييرات غير محسوسة.نقترح WilDFactualgan: طريقة تجمع بين GAN الشرطية و AsbeDdi ngs من ترميز بيرت المسبق أن تولد نموذجا حقيقيا باللغة الطبيعية بشكل جزئي لتوضيح مهام الانحدار والتصنيف.تشير النتائج التجريبية إلى أن طريقتنا تنتج بشكل غير قابل للتمييز بشكل ملحوظ، مع تفوق أربعة أساليب خطية على الإخلاص والأحكام البشرية من الطبيعة، عبر مجموعات بيانات متعددة ونماذج تنبؤ متعددة.
هناك اهتمام متزايد بالتعلم المستمر (CL)، حيث أصبحت خصوصية البيانات أولوية للتطبيقات الحقيقية لتعلم الآلة في العالم.وفي الوقت نفسه، لا يزال هناك نقص في معايير NLP الأكاديمية التي تنطبق على إعدادات CL واقعية، وهي تحدي كبير للنهوض بالمجال.في هذه الورقة، نناقش بعض خصائص البيانات غير الواقعية لمجموعات البيانات العامة، ودراسة تحديات التعلم المستمر واقعي واقعي وكذلك فعالية بروفات البيانات كوسيلة للتخفيف من خسارة الدقة.نحن نبني مجموعة بيانات CL NER من مجموعة بيانات موجودة متوفرة للجمهور وإصدارها جنبا إلى جنب مع الكود إلى مجتمع البحث.
إن أنظمة الإجابة على السؤال الطبي (QA) لديها القدرة على الرد على أوجه عدم اليقين للأطباء حول العلاج والتشخيص عند الطلب، على علم بأحدث الأدلة.ومع ذلك، على الرغم من التقدم الكبير في عام ضمان الجودة التي أدلى بها مجتمع NLP، لا تزال أنظمة ضمان الجودة الط بية تستخدم على نطاق واسع في البيئات السريرية.أحد الأسباب المحتملة لهذا هو أن الأطباء قد لا يرجعون بسهولة مخرجات نظام ضمان الجودة، جزئيا لأن الشفافية والثقة بالثقة، ولم تكن الأصل اعتبارات رئيسية في تصميم هذه النماذج.في هذه الورقة، نناقش مجموعة من المعايير التي، إذا التقت، فمن المرجح أن تزيد من المرجح أن تزيد من فائدة أنظمة ضمان الجودة الطبية الحيوية، والتي قد تؤدي بدورها إلى اعتماد هذه النظم في الممارسة العملية.نقوم بتقييم النماذج والمهام والموادات الموجودة فيما يتعلق بهذه المعايير وتسليط الضوء على أوجه القصور من الأساليب المقترحة سابقا والشديد نحو ما قد يكون أكثر قدرة للاستخدام من أنظمة ضمان الجودة.
غالبا ما يتم استخدام مخصصات Dirichlet الكامنة (LDA)، وهو نموذج موضوع يستخدم على نطاق واسع كأداة أساسية لتحليل النص في التطبيقات المختلفة. ومع ذلك، فإن عملية التدريب لنموذج LDA عادة ما تتطلب بيانات كوربوس نصية ضخمة. من ناحية، قد تعرض هذه البيانات الضخ مة معلومات خاصة في بيانات التدريب، وبالتالي تكبد شواغل الخصوصية الهامة. من ناحية أخرى، قد تتأثر كفاءة التدريب لنموذج LDA، لأن تدريب LDA يحتاج غالبا إلى التعامل مع بيانات كوربوس النص الضخمة. لمعالجة مشكلات الخصوصية في التدريب النموذجي LDA، جمعت بعض الأعمال الحديثة خوارزميات تدريب LDA التي تستند إلى أخذ عينات Gibbs المنهارة (CGS) مع خصوصية تفاضلية. ومع ذلك، فإن هذه الأعمال عادة ما يكون لها ميزانية خصوصية تراكمية عالية بسبب التكرارات الشاسعة في CGS. علاوة على ذلك، فإن هذه الأعمال لديها دائما كفاءة منخفضة بسبب التعامل مع بيانات Corpus النص الضخمة. لتحسين ضمان الخصوصية والكفاءة، نجمع بين طريقة فرعية مع CGS واقتراح خوارزمية تدريب LDA الجديدة مع خصوصية تفاضلية، فرعية LDA. نجد أن التعيين في CGS يحسن بشكل طبيعي الكفاءة أثناء تضخيم الخصوصية. نقترح أداة متري جديدة، وكفاءة - وظيفة الخصوصية، لتقييم تحسينات ضمان الخصوصية والكفاءة. استنادا إلى طريقة فرعية تقليدية، نقترح طريقة عمل قضائية على التكيف لتحسين فائدة النموذج التي تنتجها فرعية LDA عندما تكون النسبة الفرعية صغيرة. نحن نقدم تحليلا شاملا ل Sub-LDA، وتقييم نتائج التجربة تحسيناتها وضمان خصوصيتها.
تؤدي حمولة الانفجار إلى إفراغ كمية كبيرة من الطاقة بسرعة عالية و ذلك خلال أجزاء من الثانية مسببة ارتفاع كبير للضغط، إضافة لتولد حرارة مرتفعة، بسبب سرعة التأثير الفائقة غالبا تنتهي التأثيرات المحلية للانفجار قبل أن يبدأ الجسر بالاستجابة مما يسبب أضرار كبيرة في منشأة الجسر. لاتأخذ بعين الاعتبار معظم كودات تصميم الجسور خلال عملية التصميم أحمال الانفجارات بعين الاعتبار، و كذلك لا توجد كودات بشأن معاينة الجسور بتأثير أحمال الانفجارات، يهدف البحث لدراسة و تسهيل فهم الأضرار الناجمة عن أحمال الانفجارات على العناصر الإنشائية المشكلة للجسور الطرقية و ذلك من خلال وقائع الانفجارات و الصور الفوتوغرافية لحالات الأضرار الحاصلة عمليا و واقعيا، و أيضا من خلال بعض النماذج الحاسوبية . تم في البحث استعراض أثر حمولة الانفجار على بلاطات الجسور و تم التمييز بين حالة تأثير حمولة الانفجار أعلى و أسفل بلاطة الجسر، حيث أن حالة التفجير أعلى بلاطة الجسر تؤدي لزيادة العزوم و قوى القص في البلاطة على عكس حالة التفجير أسفل بلاطة الجسر و التي تؤدي لتأثير حمولة معاكسة للأحمال التصميمية. يتطرق البحث لأثر حمولة الانفجار على جوائز الجسور و وضحت قوى المقطع الإضافية الناجمة عن ذلك. وضحت أيضا أثر حمولة الانفجار على ركائز الجسور الطرفية و الوسطية و أشكال الأضرار الناجمة عن ذلك.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا