ترغب بنشر مسار تعليمي؟ اضغط هنا

نقدم مساهمة التاباس في المهمة المشتركة بشأن التحقق من البيان وإيجاد الأدلة مع الجداول (مهمة Semeval 2021 9، وانغ وآخرون (2021)). مهمة SEM Tab Factor Task A هي مهمة التصنيف بالاعتراف إذا تم إيصال بيان أو محايد أو دحض بمحتوى جدول معين. نعتمد نموذج تابا س ثنائي من Eisenschlos et al. (2020) لهذه المهمة. نحن نتعلم نماذج تصنيف ثنائية: نموذج أول للتنبؤ إذا كان عبارة محايدة أو غير محايدة وثانية واحدة للتنبؤ إذا كانت مستلمة أو دحض. نظرا لأن مجموعة التدريب المهمة المشتركة تحتوي فقط على أمثلة مستلمة أو دحض، فإننا نولد أمثلة محايدة اصطناعية لتدريب النموذج الأول. يتم تدريب كلا النموذجين مسبقا باستخدام بيانات Masklm موضوعية ومكافحة موظفة واصطناعية (Eisenschlos et al.، 2020) و Tabact (Chen et al.، 2020)، مجموعة بيانات استيابية طاولة كبيرة. نجد أن الأمثلة المحايدة الاصطناعية فعالة إلى حد ما في تدريب النموذج الأول، وتحقيق 68.03 اختبار F1 مقابل 60.47 من خط الأساس الأغلبية. في المرحلة الثانية، نجد أن التدريب المسبق على البيانات الوسيطة وتطويط التحمل يحسن النتائج عبر Masklm قبل التدريب (68.03 مقابل 57.01).
يعد التكيف المجال المجاني للمصدر خطا ناشئا في أبحاث التعلم العميق لأنه يرتبط ارتباطا وثيقا ببيئة العالم الحقيقي.ندرس مخصصات المجال في مشكلة تسلسل التسلسل حيث يتم تقديم الطراز الذي تم تدريبه على بيانات مجال المصدر.نقترح طريقتين: محول الذات وتدريب المص نف الانتقائي.المحول الذاتي هو طريقة تدريب تستخدم تسميات زائفة على مستوى الجملة التي تمت تصفيتها بواسطة عتبة الانتروب الذاتي لتوفير الإشراف على النموذج بأكمله.يستخدم التدريب الانتقائي مؤشر التسميات الزائفة على مستوى الرمز المميز ويشرف على طبقة التصنيف فقط من النموذج.يتم تقييم الأساليب المقترحة على البيانات التي توفرها مهمة Semeval-2021 10 وتحقيق المحول الذاتي أداء المرتبة الثانية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا