Open-set Label Noise Can Improve Robustness Against Inherent Label Noise

نشر في Hongxin Wei بتاريخ 2021 في مجال الهندسة المعلوماتية والبحث باللغة English تحميل البحث

الملخص بالعربية

تعلم مع تسميات مزعجة هو مشكلة تحديدية في التعلم المشروع بشكل ضعيف. في الأبحاث الحالية، يتم دائمًا النظر في الضوضاء المفتوحة كمسدسات للتعزيز، مماثلة للضوضاء المغلقة. في هذا البحث، نظرنا إلى أن التسميات المزعجة المفتوحة قد لا تكون سامة وأنها قد تساعد على المرونة ضد التسميات المزعجة الأصلية. مشحونين من هذه الملاحظات، نقترح تنظيمًا بسيطًا ولكن فعالًا عن طريق إدخال عينات مفتوحة مع تسميات مزعجة ديناميكية (ODNL) في التدريب. مع ODNL، يمكن استهلاك السعة الإضافية للشبكة العصبية بشكلٍ لا يتضرر من تعلم الأنماط من البيانات النظيفة. من خلال عدسة SGD noise، نظرنا إلى أن الضوضاء الناجمة عن طريقة عملنا هي عشوائية، خالية من الصراعات ومتحيزة، مما قد يساعد النموذج على التحقق من الحد الأدنى المستوي مع استقرار فائق وإجبار النموذج على إنتاج توقعات محايدة على المثال الخارج من التوزيع. يثبت النتائج التجريبية الشاملة على مجموعات بيانات المعيار مع أنواع مختلفة من التسميات المزعجة أن الطريقة المقترحة لا تحسن فقط أداء الخوارزميات المستقرة الموجودة، ولكنها تحقق تحسين كبير في مهام الكشف عن الخارج من التوزيع حتى في إعداد التسميات المزعجة.

تحميل البحث