السيطرة الجميلة المحبوسة على مخرجات الترجمة الآلية (MT) على طول سمات متعددة أمر بالغ الأهمية للعديد من تطبيقات MT الحديثة ومتطلبات الحصول على ثقة المستخدمين. تتمثل النهج القياسي في ممارسة التحكم في MT بإعداد المدخلات بعلامة خاصة للإشارة إلى سمة الإخراج المرغوبة. على الرغم من بساطته، فإن علامات السمة لديها العديد من العيوب: يجب أن تكون القيم المستمرة في الفئات المنفصلة، وهي غير طبيعية لبعض التطبيقات؛ التدخل بين العلامات المتعددة مفهومة سيئة. نحن نبحث عن هذه المشاكل عن طريق إدخال تدخلات ذات قيمة ناقلات تسمح بالتحكم الدقيق في سمات متعددة في وقت واحد عبر مزيج خطي مرجح من المتجهات المقابلة. بالنسبة لبعض السمات، تسمح نهجنا حتى بضبط نموذج تدرب عليه دون توضيحية لدعم هذه التدخلات. في تجارب ذات ثلاث سمات (الطول والتدانة والروماتونية) واثنين من أزواج اللغة (الإنجليزية إلى الألمانية واليابانية) تحقق نماذجنا تحكما أفضل على مجموعة واسعة من المهام مقارنة بوضع العلامات، لا تتحلل جودة الترجمة عند عدم طلب أي سيطرة. أخيرا، نوضح كيفية تمكين التحكم في نموذج مدرب بالفعل بعد مرحلة صعبة رخيصة نسبيا.
Fine-grained control of machine translation (MT) outputs along multiple attributes is critical for many modern MT applications and is a requirement for gaining users' trust. A standard approach for exerting control in MT is to prepend the input with a special tag to signal the desired output attribute. Despite its simplicity, attribute tagging has several drawbacks: continuous values must be binned into discrete categories, which is unnatural for certain applications; interference between multiple tags is poorly understood. We address these problems by introducing vector-valued interventions which allow for fine-grained control over multiple attributes simultaneously via a weighted linear combination of the corresponding vectors. For some attributes, our approach even allows for fine-tuning a model trained without annotations to support such interventions. In experiments with three attributes (length, politeness and monotonicity) and two language pairs (English to German and Japanese) our models achieve better control over a wider range of tasks compared to tagging, and translation quality does not degrade when no control is requested. Finally, we demonstrate how to enable control in an already trained model after a relatively cheap fine-tuning stage.
المراجع المستخدمة
https://aclanthology.org/
تبين أن تقدير الجودة (QE) للترجمة الآلية تصل إلى دقة عالية نسبيا في التنبؤ بعشرات على مستوى الجملة، والاعتماد على المدينات السياقية المحددة مسبقا وعشرات الجودة المنتجة للإنسان. ومع ذلك، فإن الافتقار إلى التفسيرات إلى جانب القرارات التي اتخذتها النماذ
تقدم الورقة تجارب في الترجمة الآلية العصبية مع القيود المعجمية في لغة غنية مورمية.على وجه الخصوص، نقدم طريقة واستنادا إلى فك التشفير المقيد والتي تتعامل مع الأشكال المصدرة للإدخالات المعجمية ولا تتطلب أي تعديل بيانات التدريب أو الهندسة المعمارية النم
تعاني ترجمة الآلات العصبية التي تعتمد على نص ثنائي اللغة مع بيانات تدريبية محدودة من التنوع المعجمي، والتي تقلل من دقة ترجمة الكلمات النادرة وتقلص من تعميم نظام الترجمة.في هذا العمل، نستخدم التسميات التوضيحية المتعددة من مجموعة بيانات متعددة 30 ألفا
عادة ما يتم تكليف الترجمة الآلية العصبية متعددة الموارد (MNMT) بتحسين أداء الترجمة على أزواج لغة واحدة أو أكثر بمساعدة أزواج لغة الموارد عالية الموارد.في هذه الورقة، نقترح اثنين من المناهج البحث البسيطة القائمة على البحث - طلب بيانات التدريب المتعدد
تعتمد الترجمة الآلية عادة على Corpora الموازي لتوفير إشارات متوازية للتدريب.جلبت ظهور الترجمة الآلية غير المنشورة ترجمة آلة بعيدا عن هذا الاعتماد، على الرغم من أن الأداء لا يزال يتخلف عن الترجمة التقليدية للإشراف الآلية.في الترجمة الآلية غير المنشورة