ترغب بنشر مسار تعليمي؟ اضغط هنا

استكشاف أهمية النص المصدر في التحرير التلقائي للترجمة الآلية للترجمة الآلية

Exploring the Importance of Source Text in Automatic Post-Editing for Context-Aware Machine Translation

315   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تتطلب الترجمة الدقيقة معلومات على مستوى المستندات، والتي يتم تجاهلها بواسطة الترجمة الآلية على مستوى الجملة.لقد أظهر العمل الحديث أن الاتساق على مستوى المستند يمكن تحسينه باستخدام معلومات ما بعد التحرير التلقائي باستخدام معلومات اللغة المستهدفة فقط (TL).ندرس نموذج قرد موسع يدمج سياق المصدر.يكشف التقييم البشري للطلاقة والكفاة باللغة الإنجليزية - الترجمة الروسية الإنجليزية أن النموذج الذي يتمتع بالوصول إلى سياق المصدر يتفوق بشكل كبير على قرد أحادي الأحادي من حيث الكفاية، وهو تأثير تجاهله إلى حد كبير بواسطة مقاييس التقييم التلقائي إلى حد كبير.تظهر نتائجنا أن نمذجة TL فقط يزيد الطلاقة دون تحسين كفاية، مما يدل على الحاجة إلى تكييف النص المصدر لتحرير ما بعد التحرير التلقائي.كما أنها تسليط الضوء على النقاط العمياء في الأساليب التلقائية للتقييم المستهدف وإظهار الحاجة إلى تقييم بشري لتقييم جودة الترجمة على مستوى المستند بشكل موثوق.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يتم استخدام نماذج ما بعد التحرير التلقائي (APE) مخرجات نظام الترجمة الآلية (MT) الصحيحة عن طريق التعلم من أنماط ما بعد التحرير البشري.نقدم النظام المستخدم في التقديم الخاص بنا إلى المهمة المشتركة (APE) APانية (EN-DE).نستفيد نظام MT الحديث (NG et al.، 2019) لهذه المهمة.للحصول على مزيد من التحسينات، نقوم بتكييف نموذج MT إلى مجال المهام باستخدام Wikimatrix (Schwenket al.، 2021) متبوعا بضبط جيد مع عينات إضافية للقرد من الإصدارات السابقة للمهمة المشتركة (WMT-16،17،18) وتمتلكنماذج.تغلب أنظمتنا على خط الأساس على درجات TER على مجموعة اختبار WMT'21.
تيسير آليات الاهتمام الموازية المتعددة التي تستخدم رؤساء اهتمامات متعددة أكبر أداء نموذج المحول لمختلف التطبيقات على سبيل المثال، الترجمة الآلية العصبية (NMT)، تصنيف النص. في آلية اهتمام متعددة الرأس، يحضر رؤوس مختلفة إلى أجزاء مختلفة من المدخلات. وم ع ذلك، فإن القيد هو أن رؤساء متعددة قد يحضرون إلى نفس الجزء من الإدخال، مما أدى إلى زيادة الرؤوس المتعددة. وبالتالي، يتم استخدام الموارد النموذجية. نهج واحد لتجنب ذلك هو أن تقليم رؤساء أقل أهمية بناء على درجة أهمية معينة. في هذا العمل، نركز على تصميم آلية حسابية ذات أهمية ديناميكية (DHICM) لحساب أهمية الرأس بشكل حيوي فيما يتعلق بالإدخال. إن رؤيتنا هي تصميم طبقة اهتمام إضافي مع الاهتمام متعدد الأطراف، وتستخدم مخرجات الاهتمام متعدد الأطراف جنبا إلى جنب مع المدخلات، لحساب أهمية كل رأس. بالإضافة إلى ذلك، نضيف دالة خسارة إضافية لمنع النموذج من تعيين النتيجة نفسها لجميع الرؤوس، لتحديد رؤوس أكثر أهمية وأداء الارتجال. لقد قمنا بتحليل أداء DHICM ل NMT مع لغات مختلفة. تظهر التجارب في مجموعات البيانات المختلفة أن DHICM تتفوق على النهج التقليدي القائم على المحولات من خلال الهامش الكبير، خاصة، عند توفر بيانات التدريب الأقل.
قام تطوير تقنيات الترجمة، مثل ذاكرة الترجمة والترجمة الآلية، قد غيرت تماما سير عمل صناعة الترجمة وسير العمل في العقود الماضية.ومع ذلك، تم تطوير TM و MT بشكل منفصل حتى وقت قريب.سيقوم هذا المشروع المستمر بدراسة التكامل الخارجي ل TM و MT، وفحص ما إذا كا نت الجهود الإنتاجية وما بعد التحرير للمترجمين أعلى أو أقل من استخدام TM فقط.تحقيقا لهذه الغاية، سنقوم بإجراء تجربة حيث سيطلب من طلاب الترجمة والمترجمين المحترفين ترجمة نصين قصيرين؛ثم سنتحقق من جهود ما بعد التحرير (الجهود الزمنية والتقنية والمعرفية) ونوعية النصوص المترجمة.
تقدم هذه الورقة بيانات عن تصورات تدريب المتدربين في عملية MTPE وآثار التدريب على التدريب في هذا المجال.تهدف هذه الدراسة إلى تحليل أداء المتدربين في ثلاثة مهام MTPE الزوجية باللغة الإنجليزية البولندية ومقابلات ما بعد المهام لتحديد الحاجة إلى تعزيز مها رات تحرير الترجمة الآلية في تثقيف طلاب الترجمة.نظرا لأن القليل جدا من المعلومات المتعلقة بتدريب MTPE متاح، فقد يتم العثور على هذه الدراسة مفيدة.
نماذج الترجمة الآلية العصبية (NMT) هي مدفوعة بالبيانات وتتطلب كوربوس تدريب واسع النطاق. في التطبيقات العملية، عادة ما يتم تدريب نماذج NMT على مجال مجال عام ثم يتم ضبطه بشكل جيد من خلال التدريب المستمر على Corpus في المجال. ومع ذلك، فإن هذا يحمل خطر ا لنسيان الكارثي الذي ينخفض ​​فيه الأداء الموجود على المجال العام بشكل كبير. في هذا العمل، نقترح إطارا تعليميا مستمرا جديدا لنماذج NMT. نحن نعتبر سيناريو حيث يتألف التدريب من مراحل متعددة واقتراح تقنية تقطير معارف ديناميكية لتخفيف مشكلة النسيان الكارثي بشكل منهجي. نجد أيضا أن التحيز موجود في الإسقاط الخطي الإخراج عند ضبط جيد على Corpus في المجال، واقترح وحدة تصحيح التحيز للقضاء على التحيز. نقوم بإجراء تجارب في ثلاثة إعدادات تمثيلية لتطبيق NMT. تظهر النتائج التجريبية أن الطريقة المقترحة تحقق أداء فائقا مقارنة بالنماذج الأساسية في جميع الإعدادات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا