تقوم الترجمة الآلية المتزامنة (Simt) بإنشاء ترجمة قبل قراءة جملة المصدر بأكملها وبالتالي يجب عليها التجانس بين جودة الترجمة والكمول. للوفاء بمتطلبات جودة الترجمة المختلفة والكمون في التطبيقات العملية، عادة ما تحتاج الأساليب السابقة إلى تدريب نماذج SIMT متعددة لمستويات الكمون المختلفة، مما يؤدي إلى تكاليف حسابية كبيرة. في هذه الورقة، نقترح نموذجا عالميا SIMT مع سياسة مثالية من الخبراء وينظر K لتحقيق أفضل جودة الترجمة تحت الكمون التعسفي مع نموذج واحد مدرب فقط. على وجه التحديد، توظف طريقتنا اهتماما متعدد الأطراف لإنجاز مزيج الخبراء حيث يتم التعامل مع كل رأس كخبير الانتظار الخاص به برقم كلمات الانتظار الخاصة به، وبالنظر إلى مزيد من مدخلات الكمون ومشروعات المصدر، يتم تعديل أوزان الخبراء لإنتاج أفضل الترجمة. تظهر التجارب في ثلاث مجموعات البيانات أن أسلوبنا تتفوق على جميع خطوط الأساس القوية بموجب زينة مختلفة، بما في ذلك السياسة التكيفية الحديثة.
Simultaneous machine translation (SiMT) generates translation before reading the entire source sentence and hence it has to trade off between translation quality and latency. To fulfill the requirements of different translation quality and latency in practical applications, the previous methods usually need to train multiple SiMT models for different latency levels, resulting in large computational costs. In this paper, we propose a universal SiMT model with Mixture-of-Experts Wait-k Policy to achieve the best translation quality under arbitrary latency with only one trained model. Specifically, our method employs multi-head attention to accomplish the mixture of experts where each head is treated as a wait-k expert with its own waiting words number, and given a test latency and source inputs, the weights of the experts are accordingly adjusted to produce the best translation. Experiments on three datasets show that our method outperforms all the strong baselines under different latency, including the state-of-the-art adaptive policy.
المراجع المستخدمة
https://aclanthology.org/
يعد الانتباه عبر الانتباه عنصرا هاما للترجمة الآلية العصبية (NMT)، والتي تتحقق دائما عن طريق انتباه DOT-Product في الأساليب السابقة.ومع ذلك، فإن اهتمام DOT-Product يعتبر فقط الارتباط بين الكلمات بين الكلمات، مما أدى إلى تشتت عند التعامل مع جمل طويلة
إن القدرة على توليد أسئلة باللغة الطبيعية مع مستويات التعقيد التي تسيطر عليها مرغوب فيه للغاية لأنها توزع تطبيق تطبيق سؤال. في هذه الورقة، نقترح نموذجا من جيلات السؤال العصبي المرتعل من نهاية إلى نهج، مما يشتمل على مزيج من الخبراء (MOE) كمحدد قوالب ن
تعتمد الترجمة الآلية عادة على Corpora الموازي لتوفير إشارات متوازية للتدريب.جلبت ظهور الترجمة الآلية غير المنشورة ترجمة آلة بعيدا عن هذا الاعتماد، على الرغم من أن الأداء لا يزال يتخلف عن الترجمة التقليدية للإشراف الآلية.في الترجمة الآلية غير المنشورة
التقييم البشري التجريدي لأنظمة الترجمة عالية الجودة الحديثة هي مشكلة صعبة، وهناك أدلة متزايدة على أن إجراءات التقييم غير الكافية يمكن أن تؤدي إلى استنتاجات خاطئة. بينما كان هناك بحث كبير في التقييم البشري، لا يزال الحقل يفتقر إلى إجراء قياسي شائع. كخ
في الترجمة الآلية المتزامنة، والعثور على وكيل مع تسلسل العمل الأمثل للقراءة والكتابة التي تحتفظ بمستوى عال من جودة الترجمة مع التقليل من التأخر المتوسط في إنتاج الرموز المستهدفة لا يزال مشكلة صعبة للغاية. نقترح نهج تعليمي تحت إشراف رواية لتدريب وكي