هناك اهتمام متزايد بالتعلم المستمر (CL)، حيث أصبحت خصوصية البيانات أولوية للتطبيقات الحقيقية لتعلم الآلة في العالم.وفي الوقت نفسه، لا يزال هناك نقص في معايير NLP الأكاديمية التي تنطبق على إعدادات CL واقعية، وهي تحدي كبير للنهوض بالمجال.في هذه الورقة، نناقش بعض خصائص البيانات غير الواقعية لمجموعات البيانات العامة، ودراسة تحديات التعلم المستمر واقعي واقعي وكذلك فعالية بروفات البيانات كوسيلة للتخفيف من خسارة الدقة.نحن نبني مجموعة بيانات CL NER من مجموعة بيانات موجودة متوفرة للجمهور وإصدارها جنبا إلى جنب مع الكود إلى مجتمع البحث.
There is an increasing interest in continuous learning (CL), as data privacy is becoming a priority for real-world machine learning applications. Meanwhile, there is still a lack of academic NLP benchmarks that are applicable for realistic CL settings, which is a major challenge for the advancement of the field. In this paper we discuss some of the unrealistic data characteristics of public datasets, study the challenges of realistic single-task continuous learning as well as the effectiveness of data rehearsal as a way to mitigate accuracy loss. We construct a CL NER dataset from an existing publicly available dataset and release it along with the code to the research community.
المراجع المستخدمة
https://aclanthology.org/
الوسائل المضادة هي وسيلة قيمة لفهم القرارات التي اتخذتها أنظمة ML.ومع ذلك، فإن الوسادة المتعرضية الناتجة عن الأساليب المتاحة حاليا لنص اللغة الطبيعية هي غير واقعية أو إدخال تغييرات غير محسوسة.نقترح WilDFactualgan: طريقة تجمع بين GAN الشرطية و AsbeDdi
الكيانات الطبية الحيوية المسماة معقدة، لذلك تم استخدام مطابقة تقريبية لتحسين تغطية الكيان.ومع ذلك، فإن نهج المطابقة التقريب المعتادة يجلب نتيجة مطابقة واحدة فقط، والتي غالبا ما تكون صاخبة.في هذا العمل، نقترح طريقة لنقل الطبية الحيوية التي يجلب مباريا
عندما يبرز تقنية إسناد نموذجية جزءا خاصا من المدخلات، قد يفهم المستخدم هذا الضوء على أنه بيان حول Worklactuals (Miller، 2019): إذا كان هذا الجزء من الإدخال هو التغيير، فقد يتغير تنبؤ النموذج أيضا. تحقق هذه الورقة في مدى توافق تقنيات الإسناد المختلفة
تؤدي حمولة الانفجار إلى إفراغ كمية كبيرة من الطاقة بسرعة عالية و ذلك خلال أجزاء من الثانية مسببة ارتفاع كبير للضغط، إضافة لتولد حرارة مرتفعة، بسبب سرعة التأثير الفائقة غالبا تنتهي التأثيرات المحلية للانفجار قبل أن يبدأ الجسر بالاستجابة مما يسبب أضرار
في السنوات الأخيرة، تم تطبيق نماذج قليلة بالرصاص بنجاح في مجموعة متنوعة من مهام NLP.هان وآخرون.(2018) أدخل إطارا متعدد الطلقات التعلم لتصنيف العلاقة، ومنذ ذلك الحين، تجاوزت عدة نماذج الأداء البشري في هذه المهمة، مما يؤدي إلى الانطباع بأن التصنيف القل