ترغب بنشر مسار تعليمي؟ اضغط هنا

أنظمة UCF للمهمة المشتركة لشبكة LORESMT 2021

The UCF Systems for the LoResMT 2021 Machine Translation Shared Task

303   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم أنظمة جامعة وسط فلوريدا للمهمة المشتركة ل LORESMT 2021، والمشاركة في أزواج الترجمة الإنجليزية والأيرلندية والإنجليزية المهاراتية.ركزنا جهودنا على تتبع المهمة المقيدة، وذلك باستخدام تعلم التحويل تجزئة الكلمات الفرعية لتعزيز نماذجنا بالنظر إلى كميات صغيرة من بيانات التدريب.حققت نماذجنا أعلى درجات بلو على المسارات المقيدة بالكامل للغة الإنجليزية والأيرلندية والأيرلندية والإنجليزية والماراثية - الإنجليزية مع عشرات 13.5 و 21.3 و 17.9 على التوالي



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نصف تقاريرنا للمهمة المشتركة ل Loresmt مؤتمر قمة MT 2021.بنينا أنظمة ترجمة إحصائية في كل اتجاه للإنجليزية ⇐⇒ زوج لغة الماراثي.تحدد هذه الورقة تجارب خط الأساس الأولية مع مخططات التزخم المختلفة لتدريب النماذج.باستخدام مخطط التزامن الأمثل ، نقوم بإنشاء بيانات اصطناعية ومزيد من البيانات المعززة لمجموعة البيانات لإنشاء المزيد من النماذج الإحصائية.أيضا، نقوم بإعادة ترتيب اللغة الإنجليزية لتتناسب مع بناء جملة الماراثي لتعزيز مجموعة أخرى من النماذج الأساسية والبيانات باستخدام مخططات التكامل المختلفة.نبلغ عن تكوين الأنظمة والنتائج المقدمة التي تنتجها.
نقدم نتائج المهمة المشتركة ل LORESMT 2021 التي تركز على الترجمة الآلية (MT) من بيانات CovID-19 لكل من اللغات المنطوقة والتسوق المنخفضة الموارد. تم إجراء تنظيم هذه المهمة كجزء من ورشة العمل الرابعة حول تكنولوجيات الترجمة الآلية لغات الموارد المنخفضة ( LORESMT). يتم تقديم Corpora المتوازي والمتاحة للجمهور والتي تتضمن الاتجاهات التالية: English↔irish، English↔marathi، وتايوانية Language Language Chinese. تتكون بيانات التدريب من 8112 و 20933 و 128608، على التوالي. هناك مجموعات بيانات أحادية الأحادية الإضافية للماراثية والإنجليزية التي تتكون من 21901 شريحة. تعتمد النتائج المقدمة هنا على مداخل من إجمالي ثمانية فرق. قدم ثلاثة فرق أنظمة للإنجليز في حين أن خمسة فرق قدمت أنظمة ل EnglishMarathi. لسوء الحظ، لم تكن هناك عروض أنظمة لمهمة التايوانية للتايوانية. تم حساب أقصى أداء النظام باستخدام BLEU ومتابعة AS 36.0 للغة الإنجليزية - الأيرلندية، 34.6 للأيرلندية - الإنجليزية، 24.2 للغة الإنجليزية - الماراثي، و 31.3 للماراثي - الإنجليزية.
في هذه الورقة، نصفنا (Team - Onenlp-IITH) مناهج الترجمة الآلية العصبية الخاصة بنا للماراثية الإنجليزية (كلا الاتجاه) ل LORESMT-20211.جربنا الترجمة الآلية العصبية القائمة على المحولات واستكشف استخدام ميزات لغوية مختلفة مثل نقاط البيع والتحول في وحدة ا لكلمات الفرعية لكل من اللغة الإنجليزية والماراثية والإنجليزية.بالإضافة إلى ذلك، استكشفنا أيضا الترجمة إلى الأمام والخلف باستخدام بيانات مونولجة الزحف على الويب.حصلنا على 22.2 (عموما 2 ND) و 31.3 (إجمالي 1 سانت) درجات بلو للإنجليزية - المراثي والماراثي - الإنجليزية على التوالي
يصف هذا التقرير أن أنظمة ترجمة آلات Microsoft للمهمة المشتركة WMT21 على الترجمة ذات الجهاز متعدد اللغات على نطاق واسع.شاركنا في مسارات التقييم الثلاثة بما في ذلك المسار الكبير والمسارين الصغيرين حيث لا يتم حدوث المرء السابق وأن الأخيران مقيدان تماما. تم تهيئة الطلبات النموذجية الخاصة بنا إلى المهمة المشتركة مع Deltalm، وهو نموذج فك ترميز ترميز متعدد اللغز متعدد اللغات مسبقا، ويتم ضبطه بشكل جيد في المقابل مع البيانات الموازية المستديرة ومصادر البيانات المسموح بها وفقا لإعدادات المسار، جنبا إلى جنب مع تطبيق التعلم التدريجي والتكرارمناهج الترجمة الخلفية لمزيد من تحسين الأداء.تم تصنيف التقديمات النهائية لدينا في المرتبة الأولى على ثلاثة مسارات من حيث مقياس التقييم التلقائي.
في هذه الورقة، نحن نصف مجموعتنا لمهمة مشاركة اللغة المشتركة للغة 2021. لقد بنينا 3 أنظمة في كل اتجاه لزوج لغة التاميل.تحدد هذه الورقة تجارب مع مخططات التوت المختلفة لتدريب النماذج الإحصائية.نبلغ أيضا عن تكوين الأنظمة والنتائج المقدمة التي ينتجها من قبلها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا