نحن تصف ثلاثة أنظمة تفوق خطوط خط أساس للمهمة الفرعية للإنجليزية فقط فقط من المهمة المشتركة Sigmorphon 2021 1: مجموعة صغيرة يستخدم فريق التعرف على الكلام في Dialpad داخليا، نموذجا غير معروف من الرف، وأكبرنموذج الفرقة التي تضم هذه وغيرها.نناقش التحديات المرتبطة بالبيانات المقدمة، جنبا إلى جنب مع خطوات المعالجة التي أخذناها.
We describe three baseline beating systems for the high-resource English-only sub-task of the SIGMORPHON 2021 Shared Task 1: a small ensemble that Dialpad's speech recognition team uses internally, a well-known off-the-shelf model, and a larger ensemble model comprising these and others. We additionally discuss the challenges related to the provided data, along with the processing steps we took.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا
في هذه الورقة، نستكشف مقاربة عصبية بسيطة للغاية لتعيين تقويم الإملاءات إلى النسخ الصوتي في سياق منخفض الموارد.الفكرة الأساسية هي البدء من نظام أساسي وتركيز جميع الجهود بشأن تكبير البيانات.سوف نرى أن بعض التقنيات تعمل، ولكن البعض الآخر لا.
وثائق هذه الورقة نهج فريق Linguistics UBC في مهمة SIGMORPHON 2021 Graphem-To-PhoneMe المشتركة، والتركيز على إعداد الموارد المنخفضة.توسع أنظمتنا نموذج الأساس مع تعديلات بسيطة على علم بنية مقطع لفظي وتحليل الأخطاء.يبين التحقيق المتعمق في تنبؤات مجموعة
غالبا ما تتطلب تطبيقات العالم الواقعي نماذج محسنة عن طريق الاستفادة * مجموعة من إشارات الإشراف العرضي الرخيص *. يمكن أن تشمل هذه ملصقات جزئية، ملصقات صاخبة، قيود قائمة على المعرفة، والشروح عبر المجال أو التعليق الشرح - جميعها وجود ارتباطات إحصائية مع
يتم تعريف حدود قابلية تطبيق نماذج الرؤية واللغة من خلال تغطية بياناتها التدريبية. تتطلب المهام مثل الرؤية الإجابة على الأسئلة (VQA) في كثير من الأحيان معلومات المنطقية والواقعية تتجاوز ما يمكن تعلمه من مجموعات البيانات الخاصة بمهام المهام. تحقق هذه ا