ترغب بنشر مسار تعليمي؟ اضغط هنا

تهدف الترجمة متعددة الوسائط (MMT) إلى تحسين أداء الترجمة من خلال دمج المعلومات المرئية. معظم الدراسات الاستفادة من المعلومات المرئية من خلال دمج ميزات الصورة العالمية كمدخل إضافي أو فك تشفير من خلال حضور المناطق المحلية ذات الصلة في الصورة. ومع ذلك، فإن هذا النوع من استخدام المعلومات المرئية يجعل من الصعب معرفة كيفية تساعد طريقة المرئية ولماذا يعمل. مستوحاة من نتائج (الاقتباس) التي تعد الكيانات أكثر تفكيا في الصورة، نقترح نهجا للتعلم الصريح عبر مستوى الكيانات يهدف إلى زيادة تمثيل الكيان. على وجه التحديد، يتم تأطير النهج كهجوم لإعادة الإعمار الذي يعيد إدخال المدخلات النصية الأصلية من المدخلات متعددة الوسائط يتم استبدال الكيانات بالكيانات بالميزات المرئية. بعد ذلك، يتم استخدام إطار عمل متعدد المهام في الجمع بين مهمة الترجمة ومهمة إعادة الإعمار للاستفادة الكاملة من تعلم تمثيل الكيان عبر الوسائط. تثبت التجارب الواسعة أن نهجنا يمكن أن يحقق أداء قابلا للمقارنة أو أفضل من النماذج الحديثة. علاوة على ذلك، يوضح تحليلنا المتعمق كيفية تحسين المعلومات المرئية الترجمة.
تصف هذه الورقة التقديم إلى المهمة المشتركة لترجمة الأخبار WMT 2021 بواسطة مجموعة الترجمة الآلية في UPC.الهدف من المهمة هو ترجمة الألمانية إلى الفرنسية (DE-FR) والفرنسية إلى الألمانية (FR-DE).يركز تقديمنا على ضبط نموذج مدرب مسبقا للاستفادة من بيانات أ حادية الأجل.نحن نغلق mbart50 باستخدام البيانات المصفاة، بالإضافة إلى ذلك، ندرب نموذج محول على نفس البيانات من الصفر.في التجارب، نظهر أن نتائج MBART50 الناشجة في 31.69 بلو ل DE-FR و 23.63 بلو FR-DE، مما يزيد من 2.71 و 1.90 بلو وفقا لذلك، مقارنة بالنموذج الذي نتدرب من الصفر.إن تقديمنا النهائي هو فرقة لهذين النموذجين، مما يزيد من 0.3 بلو ل FR-DE.
توفر أنظمة ترجمة الآلات الحالية (MT) نتائج جيدة للغاية على مجموعة متنوعة متنوعة من أزواج اللغات ومجموعات البيانات. ومع ذلك، من المعروف أن إنتاج مخرجات ترجمة بطلاقة يمكن أن تحتوي على أخطاء ذات معنى مهم، وبالتالي تقويض موثوقيتها في الممارسة العملية. تق دير الجودة (QE) هي مهمة تقييم أداء MT تلقائيا في وقت الاختبار. وبالتالي، من أجل أن تكون مفيدة، يجب أن تكون أنظمة QE قادرا على اكتشاف هذه الأخطاء. ومع ذلك، لم يتم بعد اختبار هذه القدرة في ممارسات التقييم الحالية، حيث يتم تقييم أنظمة QE فقط من حيث ارتباطها بالأحكام البشرية. في هذا العمل، نسرج هذه الفجوة من خلال اقتراح منهجية عامة لاختبار الخصم من QE ل MT. أولا، نظرا لأنه على الرغم من الارتباط العالي بالأحكام البشرية التي حققتها سوتا الأخيرة، لا تزال أنواع معينة من الأخطاء المعنية مشكلة في الكشف عن QE. ثانيا، نظهر أنه في المتوسط، فإن قدرة نموذج معين على التمييز بين الاضطرابات المعنية التي تحافظ مع المعنى وتغيير المعنى هي التنبؤ بأدائها العام، وبالتالي يحتمل أن يسمح بمقارنة أنظمة QE دون الاعتماد على تشريح الجودة اليدوية.
تصف هذه الورقة نظام Noahnmt المقدم إلى المهمة المشتركة WMT 2021 الخاصة بترجمة آلية منخفضة للغاية للإشراف على الموارد.النظام هو نموذج محول قياسي مزود بتقنية نقلنا الحديثة.كما توظف التقنيات المستخدمة على نطاق واسع من المعروف أنها مفيدة للترجمة الآلية ا لعصبية، بما في ذلك الترجمة الترجمة الإلكترونية التكرارية، والصلفة المختارة، والوقت.يقدم التقديم النهائي أعلى بلو لثلاثة اتجاهات ترجمة.
تهدف الترجمة الآلية المتنوعة إلى توليد ترجمات لغة مستهدفة مختلفة عن عقوبة لغة مصدر معينة. للاستفادة من العلاقة الخطية في مجال الجملة الكامنة التي أدخلت من خلال التدريب المزيج، نقترح طريقة رواية، خلطتيبات، لتوليد ترجمات مختلفة عن جملة الإدخال من خلال الاسترجاء الخطي مع أزواج من الجملة المختلفة من كوربوس التدريب أثناء فك التشفير. لزيادة تحسين الإخلاص وتنوع الترجمات، نقترح مقاربتين بسيطة ولكنها فعالة لتحديد أزواج جملة متنوعة في كوربوس التدريب وضبط وزن الاستيفاء لكل زوج في المقابل. علاوة على ذلك، من خلال التحكم في وزن الاستيفاء، يمكن لطريقتنا تحقيق المفاضلة بين الإخلاص والتنوع دون أي تدريب إضافي، وهو مطلوب في معظم الأساليب السابقة. تتم تجارب WMT'16 EN-RO، WMT'14 EN-DE، و WMT'17 Zh-en لإظهار أن طريقتنا تتفوق بشكل كبير على جميع أساليب الترجمة الآلية المتنوعة السابقة.
تصف هذه الورقة تقديم LIT-NLP LAB إلى المهمة المشتركة للترجمة الثلاثي WMT-21 Triangular.لا يسمح للمشاركين باستخدام البيانات الأخرى واتجاه الترجمة لهذه المهمة هو الروسية إلى الصينية.في هذه المهمة، نستخدم المحول كنموذج الأساس لدينا، ودمج العديد من التقن يات لتعزيز أداء الأساس، بما في ذلك تصفية البيانات، واختيار البيانات، والضبط الناعم، والتحرير بعد التحرير.علاوة على ذلك، للاستفادة من موارد اللغة الإنجليزية، مثل البيانات الروسية / الإنجليزية والصينية / الإنجليزية الموازية، يتم إنشاء مثلث العلاقة من خلال أنظمة الترجمة الآلية العصبية متعددة اللغات.نتيجة لذلك، يحقق تقديمنا نقاطا بلو 21.9 في الروسية إلى الصينية.
نقدم نتائج المهمة الأولى على الترجمة ذات الجهاز متعدد اللغات على نطاق واسع.تتكون المهمة على التقييم المتعدد إلى العديد من النماذج الفردية عبر مجموعة متنوعة من اللغات المصدر والمستهدفة.هذا العام، تتألف المهمة على ثلاثة إعدادات مختلفة: (1) المهمة الصغي رة 1 (لغات أوروبا الوسطى / الجنوبية الشرقية)، (2) المهمة الصغيرة 2 (لغات جنوب شرق آسيا)، و (3) مهمة كاملة (كل 101 × 100 زوج أزواج).استخدمت جميع المهام DataSet Flores-101 كمعيار التقييم.لضمان طول العمر من مجموعة البيانات، لم يتم إصدار مجموعات الاختبار علنا وتم تقييم النماذج في بيئة خاضعة للرقابة على Dynabench.كان هناك ما مجموعه 10 فرق مشاركة للمهام، بما مجموعه 151 من العروض النموذجية المتوسطة و 13 نماذج نهائية.تظهر نتائج هذا العام تحسنا كبيرا على خطوط الأساس المعروفة مع +17.8 بلو ل Task-Task2، +10.6 للمهمة الكاملة و +3.6 للمهمة الصغيرة 1.
نحن نصف أنظمة الترجمة الآلية العصبية لدينا المهمة المشتركة 2021 على MT غير الخاضعة للإشراف على الموارد الخلفية والمنخفضة للغاية، والترجمة بين السوربيين العليا والألمانية (الموارد المنخفضة) وبين السوربيان السفلي والألمانية (غير المعدل).أنظمة أدرجت تصف ية البيانات، والخلفية، والانسقاط BPE، والكثير، ونقل التعلم من لغات عالية (إيه) -ReSource.كما تقاس بواسطة مقاييس أوتوماتيكية، أظهرت أنظمتنا أداءا قويا، ووضعها باستمرار أولا أو مرتبط لأول مرة عبر معظم مؤشرات المقاييس والترجمة.
اكتسبت الترجمة الآلية المتزامنة الجر مؤخرا، بفضل تحسينات الجودة المهمة ومختام تطبيقات البث.تحتاج أنظمة الترجمة المتزامنة إلى إيجاد مفاضلة بين جودة الترجمة ووقت الاستجابة، وبالتالي تم اقتراح تدابير الكمون المتعددة.ومع ذلك، يتم تقدير تقييمات الكمون للت رجمة الفورية على مستوى الجملة، ولا تأخذ في الاعتبار الطبيعة المتسلسلة لسيناريو البث.في الواقع، هذه تدابير الكمون على مستوى الجملة ليست مناسبة تماما للترجمة المستمرة، مما أدى إلى وجود أرقام غير متماسكة مع سياسة الترجمة المتزامنة للنظام التي يتم تقييمها.يقترح هذا العمل تكيف مستوى دفق من تدابير الكمون الحالية بناء على نهج إعادة تجزئة مطبق على ترجمة الناتج، والتي يتم تقييمها بنجاح على شروط البث لمهمة الإشارة IWSLT.
تصف هذه الورقة أنظمة الترجمة الآلية العصبية Niutrans لمهام الترجمة من الأخبار WMT 2021.لقد جعلنا التقديمات إلى 9 اتجاهات لغة، بما في ذلك محاميات اللغة الإنجليزية، اليابانية والروسية والأيسلندية والأيسلندية والإنجليزية.بنيت أنظمتنا الأساسية على العديد من المتغيرات الفعالة من المحولات، على سبيل المثال، محول DLCL، ODE-Transformer.نحن نستخدم أيضا الترجمة مرة أخرى، وقطاع المعرفة، وتقنيات ما بعد الفرقة، والتقنيات الدقيقة للتكرار لتعزيز الأداء النموذجي كذلك.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا