تلقت ترجمة الكلام (ST) مؤخرا اهتماما متزايدا بتوليد الترجمات دون الحاجة إلى نسخ لغة مصدر ومتوسط توقيت (I.E. التوضيحية).ومع ذلك، فإن الجيل المشترك من مشاريع المصدر والترجمات المستهدفة لا يجلب فقط مزايا جودة الإخراج المحتملة عندما تقوم عمليات فك التشفير بإبلاغ بعضها البعض، ولكنها غالبا ما تكون مطلوبة في سيناريوهات متعددة اللغات.في هذا العمل، نركز على النماذج St النماذج التي تولد عمليات تعليقا ثابتا من حيث الهيكل والمحتوى المعجمي.نقدم مقاييس جديدة لتقييم الاتساق الفرعي.تظهر النتائج التي توصلنا إليها أن فك التشفير المشترك يؤدي إلى زيادة الأداء والاتساق بين التسميات التوضيحية والترجمات التي تم إنشاؤها والتي لا تزال تسمح بمرونة كافية لإنتاج ترجمات تتوافق مع الاحتياجات والمعايير الخاصة باللغة.
Speech translation (ST) has lately received growing interest for the generation of subtitles without the need for an intermediate source language transcription and timing (i.e. captions). However, the joint generation of source captions and target subtitles does not only bring potential output quality advantages when the two decoding processes inform each other, but it is also often required in multilingual scenarios. In this work, we focus on ST models which generate consistent captions-subtitles in terms of structure and lexical content. We further introduce new metrics for evaluating subtitling consistency. Our findings show that joint decoding leads to increased performance and consistency between the generated captions and subtitles while still allowing for sufficient flexibility to produce subtitles conforming to language-specific needs and norms.
المراجع المستخدمة
https://aclanthology.org/
أصبح الاستفادة من أشرطة فيديو الويب غير المسبقة على نطاق واسع مثل مقاطع الفيديو التعليمية للتدريب المسبق مسبقا تليها Finetuning الخاصة بمهمة المهام هي نهج De Facto للعديد من المهام الفيديو واللغة. ومع ذلك، فإن مقاطع الفيديو التعليمية هذه صاخبة للغاية
على الرغم من إظهار قيم واعدة للتطبيقات المصب، فإن توليد السؤال والإجابة معا يتم استكشافها. في هذه الورقة، نقدم مهمة جديدة تستهدف توليد زوج الإجابة على الأسئلة من الصور المرئية. لا يتطلب عدم توليد أزواج حول الإجابات المتنوعة فقط ولكن أيضا الحفاظ على ا
ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتج
تصف الورقة نظام تلخيص تلقائي باللغة الإنجليزية لبيانات الأخبار عبر الإنترنت التي تأتي من لغات مختلفة غير الإنجليزية.تم تصميم النظام لاستخدامه في بيئة الإنتاج لمراقبة الوسائط.يمكن أن تكون التلخيص التلقائي مفيدة للغاية في هذا المجال عند تطبيقها كأداة م
تعاني نماذج الترجمة الآلية العصبية غير التلقائية (NART) من مشكلة الوسائط المتعددة والتي تسبب عدم تناسق الترجمة مثل تكرار الرمز المميز. حاولت معظم الأساليب الأخيرة حل هذه المشكلة من خلال النمذجة الضمنية التبعيات بين المخرجات. في هذه الورقة، نقدم Align