توضح هذه الورقة أنظمة ترجمة الكلام غير المتصلة بالإنترنت والمزخرفة التي تم تطويرها في Apptek for IWSLT 2021. يتضمن خضائه غير المتصل للنظام المباشر للنظام المباشر والنموذج المتكامل الخفي المزعوم، وهو أقرب إلى نظام Cascade ولكن تم تدريبهفي أزياء نهاية إلى نهاية، حيث تكون جميع الوحدات المتطرفة النماذج نهاية إلى نهاية نفسها.بالنسبة إلى القديس المتزامن، نجمع بين التعرف على الكلام التلقائي الهجينة بنهج ترجمة آلية يتم تعلم قرارات سياسة الترجمة من محاذاة الكلمة الإحصائية.مقارنة بالعام الماضي، نحسن الجودة العامة وتوفير مجموعة واسعة من مفاضات الجودة / الكمون، سواء بسبب طريقة تكبير البيانات مما يجعل نموذج MT قويا بأحجام قطع قطع متنوعة.أخيرا، نقدم طريقة تجزئة إخراج ASR إلى جمل تقدم أقل تأخير إضافي.
This paper describes the offline and simultaneous speech translation systems developed at AppTek for IWSLT 2021. Our offline ST submission includes the direct end-to-end system and the so-called posterior tight integrated model, which is akin to the cascade system but is trained in an end-to-end fashion, where all the cascaded modules are end-to-end models themselves. For simultaneous ST, we combine hybrid automatic speech recognition with a machine translation approach whose translation policy decisions are learned from statistical word alignments. Compared to last year, we improve general quality and provide a wider range of quality/latency trade-offs, both due to a data augmentation method making the MT model robust to varying chunk sizes. Finally, we present a method for ASR output segmentation into sentences that introduces a minimal additional delay.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة Kit'SubImission إلى مهمة ترجمة الكلام IWSLT 2021 دون اتصال بالإنترنت.وصفنا نظاما في كل من الحالة المتتالية وحالة نهاية إلى النهاية.في الحالة المتتالية، حققنا في معماريات مختلفة من نهاية إلى نهاية لوحدة التعرف على الكلام.لوحدة تجزئة الن
اكتسبت النماذج المستندة إلى المحولات شعبية متزايدة تحقق الأداء الحديث في العديد من مجالات البحث بما في ذلك ترجمة الكلام. ومع ذلك، فإن التعقيد التربيعي للمحول فيما يتعلق بديل تسلسل الإدخال يمنع اعتماده كما هو الحال مع إشارات صوتية، والتي تمثل عادة بال
في هذه الورقة، وصفنا تقديم جامعة تشجيانغ إلى مهمة ترجمة الكلام متعددة اللغات IWSLT2021.تركز هذه المهمة على بحث ترجمة الكلام (ST) عبر العديد من لغات المصدر غير الإنجليزية.يمكن للمشاركين أن يقرروا ما إذا كانوا سيعملون على أنظمة مقيدة أو أنظمة غير مقيدة
تصف الورقة أنظمة ترجمة الكلام (ST) ولكن الإنجليزية إلى الألمانية. وهي تستند إلى نماذج الترجمة الآلية المعرونة التي تم تدريبها بشكل مشترك. يتم تقييم أدائها على مجموعة اختبار MUSTC المشتركة. في هذا العمل، ندرس كفاءتها من وجهة نظر وجود كمية كبيرة من بيا
توضح هذه الورقة تقديم IWSLT-St المجموعة ESPNET-St Group في مسار ترجمة الكلام دون اتصال بالإنترنت. لقد بذلنا هذا العام جهود مختلفة على تدريب البيانات والهندسة المعمارية وتجزئة الصوت. على جانب البيانات، التحقق في تقطير المعرفة على مستوى التسلسل (SEQKD)