نقدم تقديم BME لمهمة Sigmorphon 2021 0 الجزء 1، التعميم عبر المهمة المشتركة بين اللغات المتنوعة من الناحية النموذجية.نحن نستخدم نموذج فك تشفير LSTM مع ثلاثة خطوات التدريب المدرب لأول مرة على جميع اللغات، ثم ضبطها على كل عائلة لغة وأخيرا ضبطها على اللغات الفردية.نستخدم نوع مختلف من تقنية تكبير البيانات في الخطوتين الأولين.تفوق نظامنا على التقديم الآخر الوحيد.على الرغم من أنه لا يزال أسوأ من خط الأساس المحول الذي أصدره المنظمون، فإن نموذجنا أبسط وأن تقنياتنا تكبير البيانات تنطبق بسهولة على لغات جديدة.نقوم بإجراء دراسات الاجتثاث وإظهار أن تقنيات المعزز والخطوات التدريبية الثلاثة غالبا ما تساعد ولكن في بعض الأحيان يكون لها تأثير سلبي.رمز لدينا هو متاح علنا.
We present the BME submission for the SIGMORPHON 2021 Task 0 Part 1, Generalization Across Typologically Diverse Languages shared task. We use an LSTM encoder-decoder model with three step training that is first trained on all languages, then fine-tuned on each language family and finally fine-tuned on individual languages. We use a different type of data augmentation technique in the first two steps. Our system outperformed the only other submission. Although it remains worse than the Transformer baseline released by the organizers, our model is simpler and our data augmentation techniques are easily applicable to new languages. We perform ablation studies and show that the augmentation techniques and the three training steps often help but sometimes have a negative effect. Our code is publicly available.
المراجع المستخدمة
https://aclanthology.org/
نحن تصف مهمة Sigmorphon الثانية على التورفولوجيا غير المدعومة: الهدف من المهمة المشتركة SIGMORPHON 2021 على تجميع النماذج المورفولوجية غير المزدئة غير المنشأة هو أنواع الكلمات العنقودية من كوربوس نص الخام إلى النماذج.تحقيقا لهذه الغاية، نطلق سرورا لم
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا
نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا
توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من