ترغب بنشر مسار تعليمي؟ اضغط هنا

نحن تصف تقديمنا إلى المهمة المشتركة IWSLT 2021 على الترجمة الإنجليزية-الألمانية المتزامنة.يعتمد نظامنا على نهج إعادة الترجمة حيث يقوم الوكيل بإعادة ترجمة بادئة المصدر بأكملها في كل مرة يتلقى رمزية مصدر جديد.ومع ذلك، فإن هذا النهج لديه ميزة القدرة على استخدام محرك الاستدلال الآلات العصبية القياسية (NMT) مع بحث شعاع، ومع ذلك، هناك خطر من أن عدم التوافق بين عمليات إعادة الترجمات المتعاقبة ستحلل الإخراج.لتحسين جودة الترجمات، نقوم بتجربة مناهج مختلفة: نستخدم حجم ثابت في بداية الجملة، ونحن نستخدم درجة نموذج اللغة للكشف عن وحدات مترجمة، ونحن نطبق اخفاء ديناميكي لتحديد متى تكون الترجمة غير مستقروبعدنجد أن مزيج من النقاط النموذجي للمخف واللغة الديناميكي يحصل على أفضل إيقاف تشغيل جودة الكمون.
توضح هذه الورقة أنظمة ترجمة الكلام غير المتصلة بالإنترنت والمزخرفة التي تم تطويرها في Apptek for IWSLT 2021. يتضمن خضائه غير المتصل للنظام المباشر للنظام المباشر والنموذج المتكامل الخفي المزعوم، وهو أقرب إلى نظام Cascade ولكن تم تدريبهفي أزياء نهاية إلى نهاية، حيث تكون جميع الوحدات المتطرفة النماذج نهاية إلى نهاية نفسها.بالنسبة إلى القديس المتزامن، نجمع بين التعرف على الكلام التلقائي الهجينة بنهج ترجمة آلية يتم تعلم قرارات سياسة الترجمة من محاذاة الكلمة الإحصائية.مقارنة بالعام الماضي، نحسن الجودة العامة وتوفير مجموعة واسعة من مفاضات الجودة / الكمون، سواء بسبب طريقة تكبير البيانات مما يجعل نموذج MT قويا بأحجام قطع قطع متنوعة.أخيرا، نقدم طريقة تجزئة إخراج ASR إلى جمل تقدم أقل تأخير إضافي.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا