ترغب بنشر مسار تعليمي؟ اضغط هنا

نحتاج إلى التحدث عن تقسيم اختبار قطار Dev

We Need to Talk About train-dev-test Splits

235   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقسيم اختبار القطار القياسي المستخدم المستخدمة لقياس نماذج متعددة ضد بعضها البعض تستخدم بشكل مجيئ في معالجة اللغة الطبيعية (NLP). في هذا الإعداد، يتم استخدام بيانات القطار لتدريب النموذج، مجموعة التطوير لتقييم إصدارات مختلفة من النماذج (النماذج) المقترحة أثناء التطوير، ومجموعة الاختبار لتأكيد الإجابات على سؤال (أسئلة) البحث الرئيسية. ومع ذلك، أدى إدخال الشبكات العصبية في NLP إلى استخدام مختلف لهذه الانشقاقات القياسية؛ غالبا ما تستخدم مجموعة التطوير في كثير من الأحيان لتحديد النماذج أثناء إجراء التدريب. لهذا السبب، يؤدي مقارنة إصدارات متعددة من نفس النموذج أثناء التطوير إلى تقدير في تقدير بيانات التطوير. كأحد، بدأ الناس بمقارنة كمية متزايدة من النماذج في بيانات الاختبار، مما يؤدي إلى زيادة السرعة والانتعاش "من مجموعات الاختبار الخاصة بنا. نقترح استخدام ضبط ضبط الوقت عند تطوير أساليب الشبكة العصبية، والتي يمكن استخدامها للاختيار النموذجي بحيث تتمكن مقارنة الإصدارات المختلفة من نموذج جديد بأمان على بيانات التطوير.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يؤثر عرض الحزمة المتاحة تأثيراً لا يستهان به في أداء كثير من التطبيقات التي تعمل عبر الشبكات الحاسوبية، خاصة تلك الحساسة للتأخير مثل نقل الصوت و الصورة عبر الإنترنت. لذلك اهتم العديد من الباحثين بقياس عرض الحزمة المتاحة، و تقديم أدوات عملية لقياسه. ندرس في هذا البحث إمكانية قياس عرض الحزمة المتاحة عبر بناء عدد من رزم السبر و إرسالها و استقبالها تشكل بمجموعها قطار سبر، بفواصل زمنية محددة بين تلك الرزم. يقاس الزمن الفاصل بين رزم السبر قبل إرسالها، و بعد استقبالها، ثم يقدر عرض الحزمة المتاحة للمسار الذي عبرته رزم السبر. تعد خوارزمية القياس التي نعتمدها سهلة التطبيق و شفافة على الشبكة. يمكن للتطبيقات استخدام هذه الطريقة لمعرفة عرض الحزمة المتاحة قبل أن تتبادل أية معطيات عبر الشبكة.
تمكين أنظمة حوار المجال المفتوح لطرح أسئلة توضيحية عند الاقتضاء هو اتجاه مهم لتحسين جودة استجابة النظام.وهي، بالنسبة للحالات عندما يكون طلب المستخدم غير محددا لنظام محادثة لتوفير إجابة على الفور، فمن المستحسن طرح سؤال توضيحي لزيادة فرص استرداد إجابة مرضية.لمعالجة مشكلة توضيح الأسئلة في الحوارات المفتوحة في الحوارات ": (1) نجمع وتحرير مجموعة بيانات جديدة تركز على المحادثات المفتوحة ومتعددة الدورات، (2) نحن معيارا عدة حالاتخطوط الأساس العصبية الفن، و (3) نقترح خط أنابيب يتكون من خطوات غير متصلة بالإنترنت وعلى الإنترنت لتقييم جودة توضيح الأسئلة في حوارات مختلفة.هذه المساهمات مناسبة كمؤسسة لمزيد من البحث.
نقدم تحليل خطأ في Taggers UPOS العصبية لتقييم سبب استخدام علامات الذهب هذه المساهمة الإيجابية الكبيرة في تحليل الأداء أثناء استخدام UPOS المتوقع إما للأداء أو يقدم تحسنا ضئيلا.نقوم أيضا بتقييم ما يتعلمه محلل التبعية العصبية ضمنيا حول أنواع الكلمات وك يف يتعلق الأمر بعملية الأخطاء التي يصنعها Taggers، لشرح التأثير الأدنى باستخدام علامات المتوقع على المحللين.ثم نقنع علامات UPOS بناء على أخطاء مصنوعة من Tagers لإطفاء مساهمة علامات UPOS تنجح Taggers وتفشل في تصنيفها بشكل صحيح وتأثير وضع العلامات على الأخطاء.
نلاحظ مثالا على التحيز المستحث بين الجنسين في تطبيق في النهر، على الرغم من عدم وجود كلمات جنسانية صريحة في حالات الاختبار.نحن نقدم مجموعة اختبار، Sowinobias، لغرض قياس مثل هذه التحيز الجنساني الكامن في أنظمة حل السلاسة.نقيم أداء أساليب الدخل الحالية على مجموعة اختبار Sowinobias، خاصة في إشارة إلى تصميم الطريقة وتغيير خصائص مساحة التضمين.انظر https://github.com/hillary-dawkins/sowinobias.
حاولنا من خلال هذه الدراسة المقارنة بين حساسية و نوعية اختبار شرائح rK39 و اختبار التـراص المباشر في تقصي وجود داء الليشمانية الحشوي في بعض القرى الموبوءة في جنوب سـورية، و ذلـك لاعتماد الاختبار الأفضل و الأسهل في الدراسات الوبائية كمؤشر لتقصي وجود هذا الداء ليس فقـط لـدى الأشخاص العرضيين (يبدون أعراضاً مرضية) و إنما لدى الأشخاص اللاعرضيين (لا يبدون أي عـرض مرضي) و المشكوك بهم عن طريق الكشف عن وجود الأضداد النوعية في مصولهم ليصار إلى معـالجتهم بشكل سريع و مبكر.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا