في هذه الورقة، نصف تقاريرنا للمهمة المشتركة ل Loresmt مؤتمر قمة MT 2021.بنينا أنظمة ترجمة إحصائية في كل اتجاه للإنجليزية ⇐⇒ زوج لغة الماراثي.تحدد هذه الورقة تجارب خط الأساس الأولية مع مخططات التزخم المختلفة لتدريب النماذج.باستخدام مخطط التزامن الأمثل، نقوم بإنشاء بيانات اصطناعية ومزيد من البيانات المعززة لمجموعة البيانات لإنشاء المزيد من النماذج الإحصائية.أيضا، نقوم بإعادة ترتيب اللغة الإنجليزية لتتناسب مع بناء جملة الماراثي لتعزيز مجموعة أخرى من النماذج الأساسية والبيانات باستخدام مخططات التكامل المختلفة.نبلغ عن تكوين الأنظمة والنتائج المقدمة التي تنتجها.
In this paper, we describe our submissions for LoResMT Shared Task @MT Summit 2021 Conference. We built statistical translation systems in each direction for English ⇐⇒ Marathi language pair. This paper outlines initial baseline experiments with various tokenization schemes to train models. Using optimal tokenization scheme we create synthetic data and further train augmented dataset to create more statistical models. Also, we reorder English to match Marathi syntax to further train another set of baseline and data augmented models using various tokenization schemes. We report configuration of the submitted systems and results produced by them.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نحن نصف مجموعتنا لمهمة مشاركة اللغة المشتركة للغة 2021. لقد بنينا 3 أنظمة في كل اتجاه لزوج لغة التاميل.تحدد هذه الورقة تجارب مع مخططات التوت المختلفة لتدريب النماذج الإحصائية.نبلغ أيضا عن تكوين الأنظمة والنتائج المقدمة التي ينتجها من قبلها.
نقدم أنظمة جامعة وسط فلوريدا للمهمة المشتركة ل LORESMT 2021، والمشاركة في أزواج الترجمة الإنجليزية والأيرلندية والإنجليزية المهاراتية.ركزنا جهودنا على تتبع المهمة المقيدة، وذلك باستخدام تعلم التحويل تجزئة الكلمات الفرعية لتعزيز نماذجنا بالنظر إلى كمي
تصف هذه الورقة تقديم LIT-NLP LAB إلى المهمة المشتركة للترجمة الثلاثي WMT-21 Triangular.لا يسمح للمشاركين باستخدام البيانات الأخرى واتجاه الترجمة لهذه المهمة هو الروسية إلى الصينية.في هذه المهمة، نستخدم المحول كنموذج الأساس لدينا، ودمج العديد من التقن
في هذه الورقة، نصفنا (Team - Onenlp-IITH) مناهج الترجمة الآلية العصبية الخاصة بنا للماراثية الإنجليزية (كلا الاتجاه) ل LORESMT-20211.جربنا الترجمة الآلية العصبية القائمة على المحولات واستكشف استخدام ميزات لغوية مختلفة مثل نقاط البيع والتحول في وحدة ا
توضح هذه الورقة نظام Anvita-1.0 MT، Architeted for Survision To Wath2021 Multiindicmt Task من فريق Mcairt، حيث شارك الفريق في 20 اتجاهات ترجمة: الإنجليزية → Werc و Indic → الإنجليزية؛ تشدد مجموعة تشل من 10 لغات هندية. نظام Anvita-1.0 MT يتكون من نماذ