أصبح نموذج الترجمة الآلي غير المقترح (MT)، الذي لديه القدرة على أداء MT دون جمل متوازية باستخدام كورسا مماثلة، نهجا واعدا لتطوير MT بلغات الموارد المنخفضة.ومع ذلك، فإن غالبية الدراسات في MT غير المنشأة قد نظرت في أزواج لغوية غنية بالموارد ذات خصائص لغوية مماثلة.في هذه الورقة، نحقق في فعالية نماذج MT غير الخاضعة للكشف عن كائن قابلة للمقارنة من مانيبوري.Manipuri هي لغة موارد منخفضة لها خصائص لغوية مختلفة من اللغة الإنجليزية.تركز هذه الورقة على تحديد التحديات في بناء نماذج MT غير المقدمة على الكائنات القابلة للمقارنة.من الملاحظات التجريبية المختلفة، من الواضح أن تطوير MT على Corpus المقارنة باستخدام الأساليب غير المعروضة غير ممكن.علاوة على ذلك، تحدد الورقة أيضا الاتجاهات المستقبلية لتطوير MT فعالة لزوج لغة مانيبوري والإنجليزية في ظل سيناريوهات غير مخالفة.
Unsupervised Machine Translation (MT) model, which has the ability to perform MT without parallel sentences using comparable corpora, is becoming a promising approach for developing MT in low-resource languages. However, majority of the studies in unsupervised MT have considered resource-rich language pairs with similar linguistic characteristics. In this paper, we investigate the effectiveness of unsupervised MT models over a Manipuri-English comparable corpus. Manipuri is a low-resource language having different linguistic characteristics from that of English. This paper focuses on identifying challenges in building unsupervised MT models over the comparable corpus. From various experimental observations, it is evident that the development of MT over comparable corpus using unsupervised methods is feasible. Further, the paper also identifies future directions of developing effective MT for Manipuri-English language pair under unsupervised scenarios.
References used
https://aclanthology.org/
Multilingual neural machine translation (MNMT) learns to translate multiple language pairs with a single model, potentially improving both the accuracy and the memory-efficiency of deployed models. However, the heavy data imbalance between languages
This paper describes the systems submitted to WAT 2021 MultiIndicMT shared task by IITP-MT team. We submit two multilingual Neural Machine Translation (NMT) systems (Indic-to-English and English-to-Indic). We romanize all Indic data and create subwor
When building machine translation systems, one often needs to make the best out of heterogeneous sets of parallel data in training, and to robustly handle inputs from unexpected domains in testing. This multi-domain scenario has attracted a lot of re
Code-mixing has become a moving method of communication among multilingual speakers. Most of the social media content of the multilingual societies are written in code-mixed text. However, most of the current translation systems neglect to convert co
In this work, we investigate methods for the challenging task of translating between low- resource language pairs that exhibit some level of similarity. In particular, we consider the utility of transfer learning for translating between several Indo-