ترغب بنشر مسار تعليمي؟ اضغط هنا

بين المرونة والاتساق: توليد المشترك من التسميات التوضيحية والترجمة

Between Flexibility and Consistency: Joint Generation of Captions and Subtitles

347   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تلقت ترجمة الكلام (ST) مؤخرا اهتماما متزايدا بتوليد الترجمات دون الحاجة إلى نسخ لغة مصدر ومتوسط توقيت (I.E. التوضيحية).ومع ذلك، فإن الجيل المشترك من مشاريع المصدر والترجمات المستهدفة لا يجلب فقط مزايا جودة الإخراج المحتملة عندما تقوم عمليات فك التشفير بإبلاغ بعضها البعض، ولكنها غالبا ما تكون مطلوبة في سيناريوهات متعددة اللغات.في هذا العمل، نركز على النماذج St النماذج التي تولد عمليات تعليقا ثابتا من حيث الهيكل والمحتوى المعجمي.نقدم مقاييس جديدة لتقييم الاتساق الفرعي.تظهر النتائج التي توصلنا إليها أن فك التشفير المشترك يؤدي إلى زيادة الأداء والاتساق بين التسميات التوضيحية والترجمات التي تم إنشاؤها والتي لا تزال تسمح بمرونة كافية لإنتاج ترجمات تتوافق مع الاحتياجات والمعايير الخاصة باللغة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبح الاستفادة من أشرطة فيديو الويب غير المسبقة على نطاق واسع مثل مقاطع الفيديو التعليمية للتدريب المسبق مسبقا تليها Finetuning الخاصة بمهمة المهام هي نهج De Facto للعديد من المهام الفيديو واللغة. ومع ذلك، فإن مقاطع الفيديو التعليمية هذه صاخبة للغاية ، وغالبا ما تكون روايات العاصرة المصاحبة غير مكتملة، ويمكن أن تكون غير ذات صلة أو غير مهمة مع المحتوى المرئي، مما يحد من أداء النماذج المدربة على هذه البيانات. لمعالجة هذه المشكلات، نقترح طريقة محسنة مسبقة من الفيديو واللغة التي تضيف أولا التوضيحات التي تم استخراجها تلقائيا من إطارات الفيديو كإدخال نص إضافي، لتوفير إشارات مرئية مفيدة لتعلم أفضل لجمعيات الفيديو واللغة. ثانيا، لتخفيف قضية الاختلال الزمنية، تتضمن طريقةنا فقدان انتروبيا مقيدا مقيدا بقليل التقليل، لتشجيع النموذج على التركيز تلقائيا على التسمية التوضيحية الصحيحة من بركة من تعليق المرشح الأساسي. يتم تسمية نهجنا الإجمالي في ديسمبر (تعليق كثيف وتقليل الانتروبيا). تجارب شاملة على ثلاثة مهام فيديو و لغوية (استرجاع النص إلى الفيديو، وتسمية الفيديو، والإجابة على سؤال الفيديو) عبر خمسة مجموعات بيانات توضح أن نهجنا يتفوق على الطرق السابقة من الأساليب السابقة. تظهر دراسة الأزمة على مهام ما قبل التدريب والمعب المصب أن إضافة تعليق كثيف وفقدان الاهتمام المقيد مساعدة في تحسين الأداء النموذجي. أخيرا، نقدم أيضا تصور الاهتمام لإظهار تأثير تطبيق فقدان الاهتمام المقيد المقترح.
على الرغم من إظهار قيم واعدة للتطبيقات المصب، فإن توليد السؤال والإجابة معا يتم استكشافها. في هذه الورقة، نقدم مهمة جديدة تستهدف توليد زوج الإجابة على الأسئلة من الصور المرئية. لا يتطلب عدم توليد أزواج حول الإجابات المتنوعة فقط ولكن أيضا الحفاظ على ا لاتساق منهم. نحن ندرس نماذج جيل مختلفة لهذه المهمة واقتراح ثلاث نماذج: نموذج خط الأنابيب، النموذج المشترك، النموذج المتسلسل. نحن ندمج الاستدلال الاختلافي في هذه النماذج لتحقيق التنوع والاتساق. ونحن نقترح أيضا تقدير تمثيل المنطقة ومحاذاة الاهتمام لتحسين الاتساق أكثر. ونحن أخيرا وضع مقيم كقيط كمي للاتساق. نحن نقوم بالتحقق من نهجنا على معيارين، VQA2.0 و Visual-7W، من خلال تقييم التنوع والاتساق يدويا يدويا. تظهر النتائج التجريبية فعالية نماذجنا: يمكن أن تولد أزواج متنوعة أو متسقة. علاوة على ذلك، يمكن استخدام هذه المهمة لتحسين جيل السؤال المرئي والإجابة على السؤال المرئي.
ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتج اهل السياق أو تتطلب مواصفات يدوية لقالب مشكلة، والتي تساوم، تنوع mwps التي تم إنشاؤها.في هذه الورقة، نحن نطور نهج جيل MWP الجديد الذي يرفع طرازات اللغة المدربة مسبقا ونموذج اختيار الكلمات الرئيسية السياق لتحسين جودة اللغة من MWPS المولدة والثاني) لقيود اتساق المعادلة لمعادلات الرياضيات لتحسين الصلاحية الرياضيةmwps التي تم إنشاؤها.تجارب كمية واسعة من الكمية والنوعية على ثلاثة مجموعات بيانات MWP العالمية الحقيقية توضح الأداء الفائق لنهجنا مقارنة مع خطوط الأساس المختلفة.
تصف الورقة نظام تلخيص تلقائي باللغة الإنجليزية لبيانات الأخبار عبر الإنترنت التي تأتي من لغات مختلفة غير الإنجليزية.تم تصميم النظام لاستخدامه في بيئة الإنتاج لمراقبة الوسائط.يمكن أن تكون التلخيص التلقائي مفيدة للغاية في هذا المجال عند تطبيقها كأداة م ساعد للصحفيين حتى يتمكنوا من مراجعة المعلومات المهمة فقط من قنوات الأخبار.ومع ذلك، مثل كل حل البرمجيات، يحتاج الملخص التلقائي إلى مراقبة الأداء والبيئة الآمنة المؤمنة للعملاء.في بيئة مراقبة وسائل الإعلام هي أكثر السمات إشكالية يجب معالجتها هي: قضايا حقوق الطبع والنشر، الاتساق الواقعي، أسلوب النص والمعايير الأخلاقية في الصحافة.وبالتالي، فإن المساهمة الرئيسية لعملنا الحالي هي أن الخصائص المذكورة أعلاه مراقبة بنجاح في نماذج تلخيص تلقائية عصبية وتحسينها بمساعدة إجراءات التحقق من الصحة والحفاظ على الحقائق وفحص الحقائق.
تعاني نماذج الترجمة الآلية العصبية غير التلقائية (NART) من مشكلة الوسائط المتعددة والتي تسبب عدم تناسق الترجمة مثل تكرار الرمز المميز. حاولت معظم الأساليب الأخيرة حل هذه المشكلة من خلال النمذجة الضمنية التبعيات بين المخرجات. في هذه الورقة، نقدم Align art، الذي يرفع معلومات المحاذاة الكاملة إلى تقليل طريقة التوزيع المستهدف بشكل صريح. تقسم AlignArt مهمة ترجمة الآلة في (1) تقدير المحاذاة و (2) الترجمة مع مدخلات فك تشفير محاذاة، توجيه وحدة فك التركيز للتركيز على الترجمة المبسطة الواحدة المبسطة. لتخفيف مشكلة تقدير المحاذاة، فإننا نقترح كذلك طريقة تحلل المحاذاة الجديدة. تظهر تجاربنا أن Alignart تفوق النماذج السابقة غير التكرارية التي تركز على تخفيض طريقة صريحة على WMT14 EN↔DE و WMT16 RO → EN. علاوة على ذلك، تحقق Alignart درجات بلو مماثلة لتلك النماذج القائمة على التصنيف الزمني للدولة من الفنون على WMT14 En↔de. نلاحظ أيضا أن Alignart يعالج بشكل فعال مشكلة تكرار الرمز المميز حتى دون تقطير المعرفة على مستوى التسلسل.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا