نفذنا نظام ترجمة آلات عصبية يستخدم علامات التسلسل التلقائي لتحسين جودة الترجمة.بدلا من التشغيل في أزواج الجملة غير المركبة، يستخدم نظامنا أنظمة العلامات المدربة مسبقا لإضافة ميزات لغوية إلى المصدر الجمل المستهدفة.تتعلم بنية العصبية المقترحة لدينا تضمين مشترك للرموز والعلامات في التشفير، والرمز المتزامن والتنبؤ بالعلامة في وحدة فك التشفير.بالمقارنة مع خط الأساس مع التدريب غير المرفقي، زادت هذه الهيكل هذه النتيجة بلو للألمانية إلى إخراج الترجمة الفرعية للفيلم الإنجليزي بمقدار 1.61 نقطة باستخدام علامات الكيان المسماة؛ومع ذلك، انخفضت النتيجة بلو بمقدار 0.38 نقطة باستخدام علامات جزء من الكلام.وهذا يدل على أن مخرجات العلامات على مستوى الرمز المميز من أنظمة العلامات خارج الرف يمكن أن تحسن إخراج أنظمة الترجمة العصبية باستخدام التضمين المشترك ومجموعات فك التشفير المتزامنة.
We implemented a neural machine translation system that uses automatic sequence tagging to improve the quality of translation. Instead of operating on unannotated sentence pairs, our system uses pre-trained tagging systems to add linguistic features to source and target sentences. Our proposed neural architecture learns a combined embedding of tokens and tags in the encoder, and simultaneous token and tag prediction in the decoder. Compared to a baseline with unannotated training, this architecture increased the BLEU score of German to English film subtitle translation outputs by 1.61 points using named entity tags; however, the BLEU score decreased by 0.38 points using part-of-speech tags. This demonstrates that certain token-level tag outputs from off-the-shelf tagging systems can improve the output of neural translation systems using our combined embedding and simultaneous decoding extensions.
المراجع المستخدمة
https://aclanthology.org/
في معظم سيناريوهات جهاز التقطير أو سرقة الترجمة الآلية العصبية، يتم استخدام فرضية التسجيل أعلى النموذج المستهدف (المعلم) لتدريب نموذج جديد (طالب).إذا كانت الترجمات المرجعية متاحة أيضا، فيمكن إظهار الفرضيات الأفضل (فيما يتعلق بالمراجع) وفرضيات فقراء إ
نحن تصف أمين البرنامج النصي بمساعدة الماكينة (MASC)، وهو نظام للتأليف البرمجي التعاوني للآلة البشرية.تشمل البرامج النصية التي تم إنتاجها مع MASC (1) الأوصاف الإنجليزية للأحداث الفرعية التي تشمل حدث أكبر ومعقدة؛(2) أنواع الأحداث لكل من تلك الأحداث؛(3)
تصف هذه الورقة شركة Tone Communication Global Co.، Ltd. لتقديم مهمة ترجمة الأخبار المشتركة WMT21.نشارك في ست اتجاهات: إنجليزي منادر إلى / من الهوسا، الهندية من / إلى / من البنغالية وزولو إلى / من Xhosa.أنظمتنا المقدمة غير مقيدة والتركيز على الترجمة م
يتطلب نشر الترجمة الآلية الناجحة (MT) فهم ليس فقط الصفات الجوهرية لإخراج MT، مثل الطلاقة وكفاية، ولكن أيضا تصورات المستخدمين.يستجيب المستخدمون الذين لا يفهمون لغة المصدر إخراج MT بناء على تصورهم للحصول على احتمال أن يطابق معنى إخراج MT معنى النص المص
تعلم الترجمة الآلية العصبية متعددة اللغات (MNMT) ترجمة أزواج متعددة اللغات بنموذج واحد، يحتمل أن يحسن كل من الدقة وكفاءة الذاكرة للنماذج المنتشرة. ومع ذلك، فإن عدم اختلال البيانات الثقيلة بين اللغات يعوق النموذج من الأداء بشكل موحد عبر أزواج اللغة. ف