تم تقييم الترجمة الآلية (MT) حاليا بأحد طريقتين: بطريقة أحادية الأجل، بالمقارنة مع إخراج النظام إلى ترجمات مرجعية بشرية واحدة أو أكثر، أو في أزياء تقاطعات مدربة، من خلال بناء نموذج إشرافي للتنبؤ بعشرات الجودة من البيانات ذات العلامات على الإنسان. في هذه الورقة، نقترح بديل أكثر فعالية من حيث التكلفة، ومع ذلك أدائين جيدا من حيث التكلفة، والاعتماد على كلمة متعددة المحاكمات متعددة اللغات وتمثيلات الجملة، ونحن نقارن مباشرة المصدر مع الجملة ترجمت الآلة، وبالتالي تجنب الحاجة إلى كل من الترجمات المرجعية والمسمى بيانات التدريب. يعتمد المقياس على النهج القائم على أحدث الولاية - وهي مسافة BertScore و Word Mover - من خلال دمج فكرة التشابه الدلالي الحكم. من خلال القيام بذلك، فإنه يحقق ارتباطا أفضل مع درجات بشرية على مجموعات بيانات مختلفة. نظظ أنه يتفوق على هذه المقاييس وغيرها من المقاييس الأخرى في إعداد أحادي الأحادي القياسي (الترجمة المرجعية MT)، كما هو الحال في إعداد ثنائي اللغة المصدر - MT، حيث تنفذ على قدم المساواة مع نهج المربع الزجاجي لتقدير الجودة التي تعتمد على نموذج MT معلومة.
Machine translation (MT) is currently evaluated in one of two ways: in a monolingual fashion, by comparison with the system output to one or more human reference translations, or in a trained crosslingual fashion, by building a supervised model to predict quality scores from human-labeled data. In this paper, we propose a more cost-effective, yet well performing unsupervised alternative SentSim: relying on strong pretrained multilingual word and sentence representations, we directly compare the source with the machine translated sentence, thus avoiding the need for both reference translations and labelled training data. The metric builds on state-of-the-art embedding-based approaches -- namely BERTScore and Word Mover's Distance -- by incorporating a notion of sentence semantic similarity. By doing so, it achieves better correlation with human scores on different datasets. We show that it outperforms these and other metrics in the standard monolingual setting (MT-reference translation), a well as in the source-MT bilingual setting, where it performs on par with glass-box approaches to quality estimation that rely on MT model information.
المراجع المستخدمة
https://aclanthology.org/
يمكن تحسين جودة الترجمة من خلال المعلومات العالمية من الجملة المستهدفة المطلوبة لأن وحدة فك الترميز يمكن أن تفهم كل من المعلومات السابقة والمستقبلية.ومع ذلك، يحتاج النموذج إلى تكلفة إضافية لإنتاج والنظر في هذه المعلومات العالمية.في هذا العمل، لحقن مع
اكتسبت الترجمة الآلية المتزامنة الجر مؤخرا، بفضل تحسينات الجودة المهمة ومختام تطبيقات البث.تحتاج أنظمة الترجمة المتزامنة إلى إيجاد مفاضلة بين جودة الترجمة ووقت الاستجابة، وبالتالي تم اقتراح تدابير الكمون المتعددة.ومع ذلك، يتم تقدير تقييمات الكمون للت
التقييم الخالي من المرجع لديه القدرة على جعل تقييم الترجمة الآلية أكثر قابلية للتطوير بشكل كبير، مما يتيح لنا المحور بسهولة لغات أو مجالات جديدة.لقد أظهر مؤخرا أن الاحتمالات التي قدمتها نموذج كبير متعدد اللغات يمكن أن تحقق حالة من النتائج الفنية عند
نماذج الترجمة الآلية العصبية (NMT) هي مدفوعة بالبيانات وتتطلب كوربوس تدريب واسع النطاق. في التطبيقات العملية، عادة ما يتم تدريب نماذج NMT على مجال مجال عام ثم يتم ضبطه بشكل جيد من خلال التدريب المستمر على Corpus في المجال. ومع ذلك، فإن هذا يحمل خطر ا
أسئلة البحث الحديثة أهمية الاهتمام الذاتي لمنتج المنتج في نماذج المحولات ويظهر أن معظم رؤساء الاهتمام تعلم أنماطا موضعية بسيطة. في هذه الورقة، ندفع أبعد من ذلك في خط البحث هذا واقتراح آلية بديلة جديدة عن النفس: الاهتمام المتكرر (ران). تتعلم RAN بشكل