في السنوات الأخيرة، أعاد ظهور منصات تدفق مثل Netflix أو HBO أو Amazon Prime Prieet في مجال الترفيه، والذي يعتمد بشكل متزايد على أوضاع الروائح أو الصوت على الصوت. ومع ذلك، يعرف القليل عن الترجمة السمعية البصرية عند التعامل مع محركات الترجمة الآلية العصبية (NMT). تسعى ورقة العمل في العمل هذه إلى فحص الترجمات الإنجليزية من الحلقة الأولى للفتيات الكابلات الإسبانية سلسلة Netflix الشهيرة والنسخة المترجمة التي تم إنشاؤها بواسطة Google Translate و Deepl. سيساعدنا هذا التحليل في تحديد ما إذا كانت هناك اختلافات لغوية كبيرة يمكن أن تؤدي إلى سوء فهم أو صدمات ثقافية. تحقيقا لهذه الغاية، تتكون Corpus Compounts من البرنامج النصي الإسباني، المتاحة الترجمات الإنجليزية في Netflix والإصدار المترجم من البرنامج النصي. لتحليل البيانات، تم تصنيف الأخطاء بعد مصممة خطأ DQF / MQM وتم تقييمها باستخدام Metric Bleu التلقائي. تظهر النتائج أن محركات NMT تقدم ترجمات ذات نوعية جيدة، والتي بدورها قد تستفيد المترجمين الذين يعملون مع موارد الترفيه البصرية.
In recent years, the emergence of streaming platforms such as Netflix, HBO or Amazon Prime Video has reshaped the field of entertainment, which increasingly relies on subtitling, dubbing or voice-over modes. However, little is known about audiovisual translation when dealing with Neural Machine Translation (NMT) engines. This work-in-progress paper seeks to examine the English subtitles of the first episode of the popular Spanish Netflix series Cable Girls and the translated version generated by Google Translate and DeepL. Such analysis will help us determine whether there are significant linguistic differences that could lead to miscomprehension or cultural shocks. To this end, the corpus compiled consists of the Spanish script, the English subtitles available in Netflix and the translated version of the script. For the analysis of the data, errors have been classified following the DQF/MQM Error typology and have been evaluated with the automatic BLEU metric. Results show that NMT engines offer good-quality translations, which in turn may benefit translators working with audiovisual entertainment resources.
المراجع المستخدمة
https://aclanthology.org/
تحتاج أنظمة الإنتاج NMT عادة إلى خدمة مجالات المتخصصة التي لا تغطيها كوربيا كبيرة ومتاحة بسهولة بشكل مناسب.ونتيجة لذلك، غالبا ما يكون الممارسون نماذج غرضا عاما نماذج عامة على كل من المجالات التي يلبيها منظمةها.ومع ذلك، يمكن أن يصبح عدد المجالات كبيرا
يمكن فهم لغات الموارد المنخفضة كنغات أكثر شحيحة، وأقل دراستها، أقل امتيازا، أقل شيوعا، والتي تكون أقل شيوعا والتي توجد فيها موارد أقل (Singh، 2008؛ Cieri et al.، 2016؛ Magueresse et al.، 2020) وبعد يركز البحث والتكنولوجيا لمعالجة اللغة الطبيعية (NLP)
تعد أنظمة التعرف السمعية البصرية التي تعتمد على صوت و حركة شفاه المتكلم من أهم
أنظمة التعرف على الكلام. و قد تم تطوير العديد من التقنيات المختلفة من حيث الطرائق
المستخدمة في استخراج السمات و طرائق التصنيف.
يقترح البحث إنشاء نظام للتعرف على الكلمات
تصف هذه الورقة مساهمة Sebamat بمهمة مشتركة بين 2021 WMT Translation.باستخدام مجموعة أدوات الترجمة الآلية العصبية Marian، تم بناء أنظمة الترجمة القائمة على بنية محولات Google في كلا الاتجاهين في الكاتالونية - الإسبانية والبرتغالية - الإسبانية.تم تدريب
تصف هذه الورقة التقديم إلى المهمة المشتركة لترجمة الأخبار WMT 2021 بواسطة مجموعة الترجمة الآلية في UPC.الهدف من المهمة هو ترجمة الألمانية إلى الفرنسية (DE-FR) والفرنسية إلى الألمانية (FR-DE).يركز تقديمنا على ضبط نموذج مدرب مسبقا للاستفادة من بيانات أ