في هذه الورقة، نصف نظام ترجمة الكلام متعددة اللغات نهاية إلى نهاية المقدمة إلى حملة تقييم IWSLT 2021 في مهمة مشتركة من خطابات الكلام متعددة اللغات. بنيت نظامنا من خلال الاستفادة من التعلم النقل عبر الطرائق والمهام واللغات. أولا، نحن نستفيد الوحدات متعددة اللغات للأغراض العامة مسببة اللغات مع كميات كبيرة من البيانات غير المسماة والمصدرة. ونحن كذلك تمكين نقل المعرفة من مهمة النص إلى مهمة خطاب من خلال التدريب بمهامتين بالاشتراك. أخيرا، يتم تصوير نموذجنا متعدد اللغات في البيانات الخاصة ببيانات المهام الخاصة بترجمة الكلام لتحقيق أفضل نتائج الترجمة. تظهر النتائج التجريبية أن نظامنا يتفوق على الأنظمة المبلغ عنها، بما في ذلك النهج القائمة على المناسبة والمتوسطة، بتهامش كبير. في بعض اتجاهات الترجمة، تعد نتائج ترجمة الكلام التي تم تقييمها على مجموعة اختبار TEDX متعددة اللغات متعددة اللغات مقارنة مع تلك الموجودة من نظام ترجمة نصية قوية للنص، والذي يستخدم النصوص أوراكل الكلام كإدخال.
In this paper, we describe our end-to-end multilingual speech translation system submitted to the IWSLT 2021 evaluation campaign on the Multilingual Speech Translation shared task. Our system is built by leveraging transfer learning across modalities, tasks and languages. First, we leverage general-purpose multilingual modules pretrained with large amounts of unlabelled and labelled data. We further enable knowledge transfer from the text task to the speech task by training two tasks jointly. Finally, our multilingual model is finetuned on speech translation task-specific data to achieve the best translation results. Experimental results show our system outperforms the reported systems, including both end-to-end and cascaded based approaches, by a large margin. In some translation directions, our speech translation results evaluated on the public Multilingual TEDx test set are even comparable with the ones from a strong text-to-text translation system, which uses the oracle speech transcripts as input.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة مشاركة جامعة ماستريخت في مسار الترجمة متعددة اللغات في IWSLT 2021.المهمة في هذه المسار هي بناء أنظمة ترجمة خطاب متعددة اللغات في اتجاهات تحت إشراف ومطلة الصفر.نظامنا الأساسي هو نموذج نهاية إلى نهاية يؤدي إلى نسخ الكلام والترجمة.نلاحظ أ
يصف هذا التقرير أن أنظمة ترجمة آلات Microsoft للمهمة المشتركة WMT21 على الترجمة ذات الجهاز متعدد اللغات على نطاق واسع.شاركنا في مسارات التقييم الثلاثة بما في ذلك المسار الكبير والمسارين الصغيرين حيث لا يتم حدوث المرء السابق وأن الأخيران مقيدان تماما.
تحتوي هذه الورقة على وصف لتقديم معهد Karlsruhe للتكنولوجيا (KIT) لمهمة ترجمة TEDX متعددة اللغات في حملة تقييم IWSLT 2021.نهجنا الرئيسي هو تطوير كل من النظم المتتالية ونظم نهاية إلى نهاية وتجمع بينها في نهاية المطاف لتحقيق أفضل النتائج الممكنة لهذا ال
في هذه الورقة، وصفنا تقديم جامعة تشجيانغ إلى مهمة ترجمة الكلام متعددة اللغات IWSLT2021.تركز هذه المهمة على بحث ترجمة الكلام (ST) عبر العديد من لغات المصدر غير الإنجليزية.يمكن للمشاركين أن يقرروا ما إذا كانوا سيعملون على أنظمة مقيدة أو أنظمة غير مقيدة
توضح هذه الورقة تقديم نظام الترجمة من Niutrans End-tou-end الكلام للمهمة غير المتصلة IWSLT 2021، والتي تترجم من الصوت الإنجليزي إلى النص الألماني مباشرة دون نسخ متوسط.نحن نستخدم الهندسة المعمارية النموذجية القائمة على المحولات وتعزيزها عن طريق مطابقة