تقدم هذه الورقة تقديم مختبر Bering إلى المهام المشتركة للورشة الثامنة حول الترجمة الآسيوية (WAT 2021) على JPC2 و SAP.شاركنا في جميع المهام على JPC2 ومهام مجال تكنولوجيا المعلومات على NICT-SAP.نهجنا لجميع المهام يركز بشكل أساسي على بناء أنظمة NMT في كورسا خاصة بالمجال.لقد زحفنا أزواج وثيقة براءات الاختراع للغة الإنجليزية اليابانية والصينية اليابانية والكورية واليابانية.بعد تنظيف البيانات الصاخبة، بنينا كوربا متوازيا عن طريق مواءمة هذه الجمل مع درجات التشابه على مستوى الجملة.أيضا، للحصول على بيانات اختبار SAP، جمعنا مجموعة بيانات OPUS بما في ذلك ثلاثة كورسور كورسا.ثم تدريب محول على مجموعة البيانات التي تم جمعها.احتل إرسالنا في المرتبة الأولى في ثمانية من أربعة عشر مهام، وتحقيق ما يصل إلى تحسين 2.87 ل JPC2 و 8.79 ل SAP NIST-SAP في النتيجة بلو.
This paper presents the Bering Lab's submission to the shared tasks of the 8th Workshop on Asian Translation (WAT 2021) on JPC2 and NICT-SAP. We participated in all tasks on JPC2 and IT domain tasks on NICT-SAP. Our approach for all tasks mainly focused on building NMT systems in domain-specific corpora. We crawled patent document pairs for English-Japanese, Chinese-Japanese, and Korean-Japanese. After cleaning noisy data, we built parallel corpus by aligning those sentences with the sentence-level similarity scores. Also, for SAP test data, we collected the OPUS dataset including three IT domain corpora. We then trained transformer on the collected dataset. Our submission ranked 1st in eight out of fourteen tasks, achieving up to an improvement of 2.87 for JPC2 and 8.79 for NICT-SAP in BLEU score .
المراجع المستخدمة
https://aclanthology.org/
توضح هذه الورقة نظام Anvita-1.0 MT، Architeted for Survision To Wath2021 Multiindicmt Task من فريق Mcairt، حيث شارك الفريق في 20 اتجاهات ترجمة: الإنجليزية → Werc و Indic → الإنجليزية؛ تشدد مجموعة تشل من 10 لغات هندية. نظام Anvita-1.0 MT يتكون من نماذ
تقدم هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى المهمة المشتركة MT Triangular 2021.نشارك في المهمة الروسية إلى الصينية بموجب الحالة المقيدة.نحن نستخدم بنية المحولات والحصول على أفضل أداء عبر متغير بأحجام أكبر معلمة.نقوم بإجراء بيانات مفصل
نحن تصف تقديم DCU-EPFL إلى مهمة مشتركة IWPT 2021: من النص الخام لتعزيز التبعيات العالمية. تتضمن المهمة تحليل الرسوم البيانية UD المحسنة، والتي تعد امتدادا لأشجار التبعية الأساسية المصممة لتكون أكثر تسهيلا نحو تمثيل الهيكل الدلالي. يتم التقييم على 29
في هذه الورقة، نبلغ عن النتائج التجريبية لنماذج الترجمة الآلية التي أجرتها فريق Nectec لمهام ترجمة WAT-2021. أساسا، تستند نماذجنا إلى الأساليب العصبية لكلا اتجاهين أزواج اللغة الإنجليزية ميانمار وميانمار الإنجليزية. تركز معظم نماذج الترجمة العصبية ال
تصف الورقة طرز 3 NMT المقدمة من فريق ETRANSLEATION إلى مهمة مشتركة من WMT 2021 الأخبار.قمنا بتطوير أنظمة في أزواج اللغة المستخدمة بنشاط في خدمة إبعاد المفوضية الأوروبية.في مهمة أخبار WMT، شهدت السنوات الأخيرة زيادة مطردة في الحاجة إلى موارد حسابية لت