ترغب بنشر مسار تعليمي؟ اضغط هنا

قياس المعنويات (SAM) لتقييم نقل المشاعر بواسطة أنظمة الترجمة الآلية

Sentiment-Aware Measure (SAM) for Evaluating Sentiment Transfer by Machine Translation Systems

288   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في ترجمة النص حيث تعتبر المشاعر الرسالة الرئيسية، يعطي المترجمون البشريون اهتماما خاصا للكلمات تحمل المعنويات. السبب هو أن ترجمة غير صحيحة لهذه الكلمات سوف تفوت الجانب الأساسي للنص المصدر، أي شعور المؤلف. في العالم عبر الإنترنت، تستخدم أنظمة MT على نطاق واسع لترجمة المحتوى الذي تم إنشاؤه بواسطة المستخدم (UGC) مثل المراجعات، وتغريدات، ووظائف وسائل التواصل الاجتماعي، حيث تكون الرسالة الرئيسية في كثير من الأحيان موقف المؤلف الإيجابي أو السلبي تجاه موضوع النص. من المهم في مثل هذه السيناريوهات لقياس بدقة إلى حد ما يمكن أن يكون نظام MT أداة مساعدة واقعية موثوقة في نقل الرسالة الصحيحة. تتناول هذه الورقة مشكلة أقل معترف بها في مجال تقييم الترجمة الآلية التي تهم إلى أي مدى يتفق المقاييس التلقائية مع مستوى الذهب من التقييم البشري للحصول على ترجمة صحيحة للمشاعر. نقوم بتقييم فعالية مقاييس الجودة التقليدية في اكتشاف عدم فهم الثقة، خاصة عندما يكون الخطأ الوحيد في إخراج MT. نقترح قياس المعنويات العددية "تقييس" المناسب لتقييم دقة الرسالة المترجمة تؤثر في نص UGC بواسطة نظام MT. سنظهر أن دمج هذا التدبير على دراية المعنويات يمكن أن يعزز بشكل كبير ارتباط بعض مقاييس الجودة المتاحة مع الحكم الإنساني لترجمة دقيقة للمشاعر.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة أنظمة الترجمة الآلية العصبية Niutrans لمهام الترجمة من الأخبار WMT 2021.لقد جعلنا التقديمات إلى 9 اتجاهات لغة، بما في ذلك محاميات اللغة الإنجليزية، اليابانية والروسية والأيسلندية والأيسلندية والإنجليزية.بنيت أنظمتنا الأساسية على العديد من المتغيرات الفعالة من المحولات، على سبيل المثال، محول DLCL، ODE-Transformer.نحن نستخدم أيضا الترجمة مرة أخرى، وقطاع المعرفة، وتقنيات ما بعد الفرقة، والتقنيات الدقيقة للتكرار لتعزيز الأداء النموذجي كذلك.
تصف هذه الورقة نظامنا (معرف الفريق: Nictrb) للمشاركة في مهمة الترجمة الآلية المحظورة Wat'21.في نظامنا المقدم، صممنا نهج تدريب جديد للترجمة الآلية المحظورة.بواسطة أخذ العينات من هدف الترجمة، يمكننا حل المشكلة التي لا تملك بيانات التدريب العادية مفردات مقيدة.مع مزيد من المساعدة في فك التشفير المقيد في مرحلة الاستدلال، حققنا نتائج أفضل من الأساس، مما يؤكد فعالية حلنا.بالإضافة إلى ذلك، حاولنا أيضا محول الفانيليا والخريج كشبكة العمود الفقري للنموذج، بالإضافة إلى إعاقة نموذجية، مما أدى إلى تحسين أداء الترجمة النهائي.
ينطوي تحليل المعنويات المستندة إلى جانب الجسیلاء بشكل أساسي على ثلاث مجموعات فرعية: استخراج الأجل في الجانب، واستخراج الأجل رأي، وتصنيف المعنويات على مستوى الجانب، والذي يتم التعامل معه عادة بطريقة منفصلة أو مشتركة. ومع ذلك، فإن النهج السابقة لا تستغ ل العلاقات التفاعلية بين ثلاث مجموعات فرعية ولا تستفيد بشكل متفيد على مستوى الوثيقة / المعروفة المسمى المسمى المستندات المتوفرة بسهولة، مما يقيد أدائه. لمعالجة هذه المشكلات، نقترح شبكة نقل المعرفة متعددة المعرفة متعددة الرواية (IMKTN) ل AND-LITE ABSA. لشيء واحد، من خلال الارتباطات التفاعلية بين المهن الفرعية ABASA، تقوم IMKTN بتحويل المعرفة الخاصة بمهام المهام من أي اثنين من المهام الفرعية الثلاثة إلى واحدة أخرى على مستوى الرمز المميز من خلال الاستفادة من خوارزمية التوجيه المصممة جيدا، أي أي اثنين من سيساعد المهن الفرعية الثلاثة الثالث. بالنسبة لآخر، تقوم IMKTN بتحويل المعرفة على مستوى المستند، I.E.، المعرفة ذات الصلة بالمجال والمعنويات، إلى التسكال الفرعية على مستوى الجانب لتعزيز الأداء المقابل. النتائج التجريبية على ثلاثة مجموعات بيانات معيار توضح فعالية وتفوق نهجنا.
يقدم هذا العمل مجموعة متنوعة بسيطة لتقييم جودة الترجمة الآلية بناء على مجموعة من الرواية ومقاييس ثابتة.نقيم الفرقة باستخدام ارتباط لعشرات MQM القائم على الخبراء ورشة عمل WMT 2021 المقاييس.في كل من إعدادات المونولينغوية والصفرية القصيرة، نعرض تحسنا كب يرا في الأداء على مقاييس واحدة.في الإعدادات المتبادلة، نوضح أيضا أن نهج الفرع ينطبق جيدا على اللغات غير المرئية.علاوة على ذلك، نحدد خط أساس قوي خال من المرجعية التي تتفوق باستمرار على تدابير بلو واستخدامها بشكل شائع وتحسين أداء فرقنا بشكل كبير.
في هذا العمل، تم تطوير وتقييم وتقييم أنظمة الترجمة الآلية العصبيةين كجزء من BILIRECTIONAL TAMIL-TELUGU Transmation Language Translation Transke Subtask في WMT21. تم استخدام مجموعة أدوات OpenNMT-PY لإنشاء النماذج النماذج الخاصة بالأنظمة السريعة، والتي تتابع النماذج التي تم تدريبها على مجموعات البيانات التدريبية التي تحتوي على Corpus الموازي وأخيرا تم تقييم النماذج على مجموعات بيانات Dev المقدمة كجزء من المهمة. تم تدريب كل من الأنظمة على محطة DGX مع 4 -V100 GPUs. أول نظام NMT في هذا العمل هو طراز ترميز تشفير من 6 طبقة محول، تدرب على 100000 خطوة تدريبية، مما يشبه تكوينه الجديد الذي يوفره OpenNMT-PY وهذا يستخدم لإنشاء نموذج للحصول على ترجمة ثنائية الاتجاه. يحتوي نظام NMT الثاني على نماذج ترجمة أحادية الاتجاه مع نفس التكوين كنظام أول كأول، مع إضافة ترميز زوج البايت البايت (BPE) لتخشيص الكلمات الفرعية من خلال طراز MultiBPEMB المدرب مسبقا. بناء على مقاييس تقييم DEV DataSet لكل من النظم، فإن النظام الأول I.E. لقد تم تقديم نموذج محول الفانيليا كنظام أساسي. نظرا لعدم وجود تحسينات في المقاييس أثناء تدريب النظام الثاني مع BPE، فقد تم تقديمه كأنظمة مضادة للتناقض.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا