وثائق هذه الورقة نهج فريق Linguistics UBC في مهمة SIGMORPHON 2021 Graphem-To-PhoneMe المشتركة، والتركيز على إعداد الموارد المنخفضة.توسع أنظمتنا نموذج الأساس مع تعديلات بسيطة على علم بنية مقطع لفظي وتحليل الأخطاء.يبين التحقيق المتعمق في تنبؤات مجموعة الاختبار أن أفضل طرازنا يصحح عددا كبيرا من الأخطاء مقارنة بالتنبؤ الأساسي، حيث فهناك جميع التقديمات الأخرى.تحقق نتائجنا الرأي الذي يمكن أن يؤدي تحليل الأخطاء الدقيق مع المعرفة اللغوية إلى نمذجة حسابية أكثر فعالية.
This paper documents the UBC Linguistics team's approach to the SIGMORPHON 2021 Grapheme-to-Phoneme Shared Task, concentrating on the low-resource setting. Our systems expand the baseline model with simple modifications informed by syllable structure and error analysis. In-depth investigation of test-set predictions shows that our best model rectifies a significant number of mistakes compared to the baseline prediction, besting all other submissions. Our results validate the view that careful error analysis in conjunction with linguistic knowledge can lead to more effective computational modeling.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا
نحن ندرس تحليل عمرو متعدد اللغات من منظور تقطير المعرفة، حيث يكون الهدف هو تعلم وتحسين محلل عمرو متعدد اللغات باستخدام محلل إنجليزي موجود كمعلم لها.نحن تقيد استكشافنا في إعداد صارم متعدد اللغات: هناك نموذج واحد لتحليل جميع اللغات المختلفة بما في ذلك
UDIFY هو محلل التبعية اللاإرائي لغرفة التبعية اللغوية التي يتم تدريبها على كوربوس متعدد الألوان من 75 لغة.يتيح هذا النمذجة متعددة اللغات النموذج من التعميم على اللغات غير المعروفة / الأقل شهرة، مما يؤدي إلى تحسين الأداء على لغات الموارد المنخفضة.في ه
نحن تصف محلول Nuig لمهمة IWPT 2021 بمهمة التعبير المعزز (ED) معزز بلغات متعددة.بالنسبة لهذه المهمة المشتركة، نقترح وتقييم محلل إد المحلي المستند SEQ2SEQ SEQ2SEQ ومقرها SEQ2SEQ الذي يتنبأ بمجموعة ED-Parse من جملة مدخلات معينة كأسلسلة موضعية موضعية للن
نحن تصف ثلاثة أنظمة تفوق خطوط خط أساس للمهمة الفرعية للإنجليزية فقط فقط من المهمة المشتركة Sigmorphon 2021 1: مجموعة صغيرة يستخدم فريق التعرف على الكلام في Dialpad داخليا، نموذجا غير معروف من الرف، وأكبرنموذج الفرقة التي تضم هذه وغيرها.نناقش التحديات