ترغب بنشر مسار تعليمي؟ اضغط هنا

مسائل معالجة البيانات: نظام الترجمة SRPH-KONVERGEN AI ل WMT'21

Data Processing Matters: SRPH-Konvergen AI's Machine Translation System for WMT'21

420   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نصف تقديم فريق مشترك لبحوث Samsung Philippines-Konvergen AI لمهمة الترجمة متعددة اللغات متعددة اللغات WMT'21 - المسار الصغير 2. نقدم نموذج محول SEQ2SEQ قياسي إلى المهمة المشتركة دون أي حيل تدريب أو عمارة، تعتمد بشكل رئيسي على قوة تقنيات ما قبل البيانات الخاصة بنا لتعزيز الأداء.سجل طراز التقديم النهائي لدينا 22.92 متوسط بلو على مجموعة Flores-101 Devtest، وسجل 22.97 متوسط بلو على مجموعة الاختبارات الخفية للمسابقة، المرتبة السادسة بشكل عام.على الرغم من استخدام محول قياسي فقط، في المرتبة النموذجية المرتبة الأولى في الإندونيسية إلى الجاوية، مما يدل على المسائل المعالجة المسبقة للبيانات على قدم المساواة، إن لم تكن أكثر، من تقنيات النموذج المتطورة وتقنيات التدريب.

المراجع المستخدمة
https://aclanthology.org/

قيم البحث

اقرأ أيضاً

نقدم تطوير نظام الترجمة الآلي متعدد اللغات لمهمة الترجمة متعددة اللغات متعددة اللغات المهمة متعددة اللغات في WMT 2021. بدء تشغيل نظام الأساس المحتمل، حققنا في العديد من التقنيات لتحسين جودة الترجمة على المجموعة الفرعية المستهدفة من اللغات.تمكنا من تح سين جودة الترجمة بشكل كبير من خلال تكييف النظام باتجاه المجموعة الفرعية المستهدفة من اللغات وتوليد بيانات اصطناعية باستخدام النموذج الأولي.التقنيات المطبقة بنجاح في الترجمة متعددة اللغز المزدوجة (E.G. التشابه العادي) كان لها تأثير بسيط فقط على أداء الترجمة النهائي.
تصف هذه الورقة أنظمة الترجمة الآلية العصبية MiningLamp لمهام الترجمة الأخبار WMT2021.لقد شاركنا في ثمانية اتجاهات مهام ترجمة لنص الأخبار بما في ذلك الصينية من / الإنجليزية، الهوسا من / إلى الإنجليزية، الألمانية من / إلى / اللغة الإنجليزية والفرنسية م ن / إلى الألمانية.استند نظامنا الأساسي إلى بنية المحولات، مع بناء أوسع أو أصغر لمهام ترجمة أخبار مختلفة.استخدمنا بشكل رئيسي طريقة الترجمة الخلفي، وقراءة المعرفة والضبط بشكل جيد لتعزيز نموذج واحد، في حين تم استخدام الفرقة للجمع بين النماذج الفردية.احتل تقديمنا النهائي الأول لأول مرة في مهمة Hausa.
تصف هذه الورقة تقديم ISTIC إلى مهمة الترجمة الآلية الثلاثية من الترجمة الآلية الروسية إلى الصينية ل WMT '2021. من أجل الاستفادة الكاملة من الشركة المقدمة وتعزيز أداء الترجمة من الروسية إلى الصينية، يتم استخدام طريقة المحور في موقعناالنظام الذي خط أنا بيب الترجمة الروسية إلى الإنجليزية والمترجم الإنجليزي إلى الصيني لتشكيل مترجم روسي إلى صيني.يعتمد نظامنا على بنية المحولات ويتم اعتماد العديد من الاستراتيجيات الفعالة لتحسين جودة الترجمة، بما في ذلك تصفية Corpus ومعالجة البيانات ومجمع النظام وفرقة النموذج.
توضح هذه الورقة نظام الترجمة متعددة الاستخدامات على نطاق واسع ل WMT 2021. نشارك في المسار الصغير 2 في خمسة لغات جنوب شرق آسيا، والثلاثين الاتجاهات: الجاوية، الإندونيسية، الملايو، التاغالوغية، التاميل، الإنجليزية.نحن نستخدم أساسا إلى الأمام / الترجمة إلى الوراء، واختيار بيانات داخل المجال، وقطاع المعرفة، والضبط الجماعي التدريجي من الطراز المدرب مسبقا فلوريس 101.نجد أن الترجمة إلى الأمام / الخلفي يحسن بشكل كبير من نتائج الترجمة، واختيار البيانات والضبط الجمنيات التدريجية فعالة بشكل خاص أثناء مجال التكيف، في حين أن تقطير المعرفة يجلب تحسين أداء طفيف.أيضا، يستخدم متوسط المتوسط لتحسين أداء الترجمة بناء على هذه الأنظمة.يحقق نظامنا النهائي درجة بلو متوسط قدره 28.89 عبر ثلاثين اتجاهين في مجموعة الاختبار.
توضح هذه الورقة نظام Anvita-1.0 MT، Architeted for Survision To Wath2021 Multiindicmt Task من فريق Mcairt، حيث شارك الفريق في 20 اتجاهات ترجمة: الإنجليزية → Werc و Indic → الإنجليزية؛ تشدد مجموعة تشل من 10 لغات هندية. نظام Anvita-1.0 MT يتكون من نماذ ج NMT متعددة اللغات واحد للغة الإنجليزية → اتجاهات MEDISTION وغيرها من الإرشادات وغيرها من الإرشادات الإنجليزية مع فك التشفير المشترك، والتموين 10 أزواج اللغة والعشرون اتجاهي الترجمة. بنيت النماذج الأساسية بناء على بنية المحولات وتدريبها على Multiindicmt Wat 2021 Corpora وزيادة الترجمة والترجمة الترجمة والترجمة الخاصة بتزوير البيانات الانتقائية، وفرقة نموذجية لتحسين التعميم. بالإضافة إلى ذلك، تم تقطير Multiindicmt Wat 2021 Corpora باستخدام سلسلة من عمليات التصفية قبل طرح التدريب. anvita-1.0 حقق أعلى درجة AM-FM النتيجة للغة الإنجليزية → البنغالية، 2nd للغة الإنجليزية → التاميل و 3 للإنجليزية → الهندية، البنغالية → الإنجليزية الاتجاهات في مجموعة الاختبار الرسمية. بشكل عام، فإن الأداء الذي حققه Anvita للتشج ← اتجاهات إنجليزية أفضل نسبيا من أن الإنجليزي → اتجاهات MEDIAL لجميع أزواج اللغة 10 عند تقييمها باستخدام Bleu and Ribes، على الرغم من أن الاتجاه نفسه غير مريح باستمرار عند تقييم AM-FM نفذت. بالمقارنة مع Bleu، فإن RIBES و AM-FM تستند إلى أنفيتا أفضل نسبيا بين جميع المشاركين المهام.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا