ترغب بنشر مسار تعليمي؟ اضغط هنا

الهجين الإحصائي الترجمة للغة الإنجليزية ميانمار: uTyCC تم تقديمها إلى WAT-2021

Hybrid Statistical Machine Translation for English-Myanmar: UTYCC Submission to WAT-2021

421   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقوم بصف أن نقوم بتقديم طلباتنا إلى WAT-2021 (Nakazawa et al.، 2021) لمهمة اللغة الإنجليزية إلى ميانمار (بورمي).فريقنا، ID: YCC-MT1 ''، ركز على جلب معرفة حرفية إلى وحدة فك الترميز دون تغيير النموذج.لقد استخرجنا يدويا أزواج الكلمة / عبارة الترجمة من ALT Corpus وتطبيق ميزة علامات XML على وحدة فك ترميز موسى (I.E. -XML-إدخال Exclive، -xml -XML-Input شاملة).نوضح أن تقنية الترجمة الهجينة يمكن أن تتحسن بشكل كبير (حوالي 6 درجات بلو) خط الأساس من ثلاثة SMT '' نموذج تسلسل نموذجي "من العبارات المعروفة القائمة على العبارات المعروفة.علاوة على ذلك، حققت هذه الطريقة الهجينة البسيطة ثاني أعلى النتائج بين أنظمة MT المقدمة لمهمة مشاركة الترجمة الإنجليزي إلى ميسمار WAT2021 وفقا ل Bleu (بابينيني وآخرون، 2002) وعشرات AMFM (Banchs et al.، 2015).



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه الورقة نظام Anvita-1.0 MT، Architeted for Survision To Wath2021 Multiindicmt Task من فريق Mcairt، حيث شارك الفريق في 20 اتجاهات ترجمة: الإنجليزية → Werc و Indic → الإنجليزية؛ تشدد مجموعة تشل من 10 لغات هندية. نظام Anvita-1.0 MT يتكون من نماذ ج NMT متعددة اللغات واحد للغة الإنجليزية → اتجاهات MEDISTION وغيرها من الإرشادات وغيرها من الإرشادات الإنجليزية مع فك التشفير المشترك، والتموين 10 أزواج اللغة والعشرون اتجاهي الترجمة. بنيت النماذج الأساسية بناء على بنية المحولات وتدريبها على Multiindicmt Wat 2021 Corpora وزيادة الترجمة والترجمة الترجمة والترجمة الخاصة بتزوير البيانات الانتقائية، وفرقة نموذجية لتحسين التعميم. بالإضافة إلى ذلك، تم تقطير Multiindicmt Wat 2021 Corpora باستخدام سلسلة من عمليات التصفية قبل طرح التدريب. anvita-1.0 حقق أعلى درجة AM-FM النتيجة للغة الإنجليزية → البنغالية، 2nd للغة الإنجليزية → التاميل و 3 للإنجليزية → الهندية، البنغالية → الإنجليزية الاتجاهات في مجموعة الاختبار الرسمية. بشكل عام، فإن الأداء الذي حققه Anvita للتشج ← اتجاهات إنجليزية أفضل نسبيا من أن الإنجليزي → اتجاهات MEDIAL لجميع أزواج اللغة 10 عند تقييمها باستخدام Bleu and Ribes، على الرغم من أن الاتجاه نفسه غير مريح باستمرار عند تقييم AM-FM نفذت. بالمقارنة مع Bleu، فإن RIBES و AM-FM تستند إلى أنفيتا أفضل نسبيا بين جميع المشاركين المهام.
نحن نستخدم مجموعة اختبار شبه آلية من أجل توفير تقييم لغوي محمول من أجل أنظمة الترجمة الآلية الحديثة. يشمل التقييم 18 الألمانية إلى الإنجليزية و 18 الإنجليزية إلى الألمانية، قدمت إلى مهمة مشتركة للترجمة بمؤتمر 2021 حول الترجمة الآلية. يضيف تقديمنا إلى إعدادات السنوات السابقة عن طريق إنشاء وتطبيق جناح اختبار واسع النطاق للغة الإنجليزية إلى الألمانية كزوج لغة جديدة. يسمح التقييم الراسخ في اكتشاف اختلافات كبيرة بين الأنظمة التي لا يمكن تمييزها من خلال التقييم المباشر لحملة التقييم البشرية. نجد أن معظم الأنظمة تحقق عقوبة جيدة في غالبية الظواهر اللغوية ولكن هناك عدد قليل من الظواهر مع دقة منخفضة، مثل التعابير، والمطبقة مشروط والمسندات الألمانية الناتجة. نظمتين تتمتعان بدقة اختبار أفضل بكثير في المتوسط ​​في المتوسط ​​الكلي في كل اتجاه لغة، عبر الإنترنت-W و Facebook-AI للألمانية إلى الإنجليزية والمرافقين وبرنامج Volctrans وعلى الإنترنت-W للإنجليزية إلى الألمانية. تظهر الأنظمة تحسنا مطردا مقارنة بالسنوات السابقة.
في هذه الورقة، نصفنا (Team - Onenlp-IITH) مناهج الترجمة الآلية العصبية الخاصة بنا للماراثية الإنجليزية (كلا الاتجاه) ل LORESMT-20211.جربنا الترجمة الآلية العصبية القائمة على المحولات واستكشف استخدام ميزات لغوية مختلفة مثل نقاط البيع والتحول في وحدة ا لكلمات الفرعية لكل من اللغة الإنجليزية والماراثية والإنجليزية.بالإضافة إلى ذلك، استكشفنا أيضا الترجمة إلى الأمام والخلف باستخدام بيانات مونولجة الزحف على الويب.حصلنا على 22.2 (عموما 2 ND) و 31.3 (إجمالي 1 سانت) درجات بلو للإنجليزية - المراثي والماراثي - الإنجليزية على التوالي
في هذه الورقة، نقدم تفاصيل النظم التي قدمناها مقابل WAT 2021 Multiindicmt: مهمة متعددة اللغات.لقد قدمنا نماذج NMT متعددة اللغات منفصلة: واحد للغة الإنجليزية إلى 10 لغات ind وآخر ل 10 لغات ind للغة الإنجليزية.نناقش تفاصيل تنفيذ نهجين منفصلين متعدد الل غات NMT، وهما واحدا وكثير من الأحيان والعديد من إلى واحد، والذي يستفيد من وحدة فك ترميز مشتركة ومشمير مشترك، على التوالي.من تجاربنا، نلاحظ أن أنظمة NMT متعددة اللغات تتفوق على أنظمة طيران الأساس ثنائية اللغة لكل من أزواج اللغة قيد الدراسة.
الترجمة الآلية العصبية (NMT) هي تكنولوجيا ترجمة آلية سائدة في الوقت الحاضر بسبب مرونةها التدريبية المتنقلة المحيرة.ومع ذلك، لا يزال NMT يكافح من أجل الترجمة بشكل صحيح في إعدادات الموارد المنخفضة خصيصا على أزواج اللغة البعيدة.طريقة واحدة للتغلب على ذل ك هي استخدام المعلومات من طرائق أخرى إذا كانت متوفرة.الفكرة هي أنه على الرغم من الاختلافات في اللغات، فإن كل من المصدر والمتحدثين اللغوي المستهدف يرون نفس الشيء والتمثيل المرئي لكل من المصدر والهدف هو نفسه، والذي يمكن أن يساعد النظام بشكل إيجابي.يمكن أن تساعد المعلومات متعددة الوسائط نظام NMT لتحسين الترجمة عن طريق إزالة الغموض على بعض العبارات أو الكلمات.نحن نشارك في ورشة العمل الثامنة حول الترجمة الآسيوية (WAT - 2021) لمهمة الترجمة الإنجليزية العربية الهندية وتحقيق 42.47 و 37.50 نقطة بلو للتقييم والتحدي الفرعي، على التوالي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا