تقدم هذه الورقة المهمة المشتركة تتكيف المجال المجانية للمصدر التي عقدت داخل Semeval-2021.كان الهدف من المهمة هو استكشاف تكيف نماذج تعليم الآلات في مواجهة قيود مشاركة البيانات.على وجه التحديد، نعتبر السيناريو حيث توجد التعليقات التوضيحية للنطاق ولكن لا يمكن تقاسمها.بدلا من ذلك، يتم تزويد المشاركين مع النماذج المدربة على هذه البيانات (المصدر).يتلقى المشاركون أيضا بعض البيانات المسمى من مجال جديد (تطوير) لاستكشاف خوارزميات تكيف المجال.ثم يتم اختبار المشاركين على البيانات التي تمثل مجال جديد (الهدف).استكشفنا هذا السيناريو مع اثنين من المهام الدلالية المختلفة: الكشف عن النفي (مهمة تصنيف النص) والتعرف على تعبير الوقت (مهمة وضع علامة تسلسل).
This paper presents the Source-Free Domain Adaptation shared task held within SemEval-2021. The aim of the task was to explore adaptation of machine-learning models in the face of data sharing constraints. Specifically, we consider the scenario where annotations exist for a domain but cannot be shared. Instead, participants are provided with models trained on that (source) data. Participants also receive some labeled data from a new (development) domain on which to explore domain adaptation algorithms. Participants are then tested on data representing a new (target) domain. We explored this scenario with two different semantic tasks: negation detection (a text classification task) and time expression recognition (a sequence tagging task).
المراجع المستخدمة
https://aclanthology.org/
قيود مشاركة البيانات شائعة في مجموعات بيانات NLP.الغرض من هذه المهمة هو تطوير نموذج مدرب في مجال المصدر لجعل تنبؤات للمجال المستهدف مع بيانات المجال ذات الصلة.لمعالجة هذه المسألة، قدم المنظمون النماذج التي يتم ضبطها بشكل جيد على عدد كبير من بيانات مج
يفترض تكيف المجال أن العينات من المجالات المصدر والمستهدفة يمكن الوصول إليها بحرية خلال مرحلة التدريب.ومع ذلك، نادرا ما يكون مثل هذا الافتراض معقول في العالم الحقيقي وقد يؤدي إلى مشكلات خصوصية البيانات، خاصة عندما تكون تسمية مجال المصدر يمكن أن تكون
يعد التكيف المجال المجاني للمصدر خطا ناشئا في أبحاث التعلم العميق لأنه يرتبط ارتباطا وثيقا ببيئة العالم الحقيقي.ندرس مخصصات المجال في مشكلة تسلسل التسلسل حيث يتم تقديم الطراز الذي تم تدريبه على بيانات مجال المصدر.نقترح طريقتين: محول الذات وتدريب المص
تصف هذه الورقة أنظمتنا لإلغاء الكشف عن النفي والتعرف على تعبير الوقت في مهمة Semeval 2021، وتكييف المجال المجاني للمصدر للمعالجة الدلالية.نظرا لأن التدريب الذاتي والتعلم النشط وتقنيات تكبير البيانات يمكن أن يحسن قدرة تعميم النموذج على بيانات المجال ا
نظرا للمخاوف المتزايدة لخصوصية البيانات، يجذب تكيف المجال بدون إلغاء تأسيس المصدر المزيد من الاهتمام بالأبحاث، حيث يفترض أن نموذج مصدر مدرب فقط متاحا، في حين تبقى بيانات المصدر المسمى خاصة.للحصول على نتائج التكيف الواعدة، نحتاج إلى إيجاد طرق فعالة لن