ترغب بنشر مسار تعليمي؟ اضغط هنا

تقييم أداء الترجمة الخلفي لزوج LOWN-ROUNDUNTION English-Marathi زوج: CFILT-IITBOBBAY @ Loresmt 2021

Evaluating the Performance of Back-translation for Low Resource English-Marathi Language Pair: CFILT-IITBombay @ LoResMT 2021

399   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نناقش تفاصيل أنظمة الترجمة المختلفة (MT) التي قدمناها لمهمة Loresmt الإنجليزية Marathi.كجزء من هذه المهمة، قدمنا ثلاثة أنظمة ترجمة آلية عصبية مختلفة (NMT)؛نظام أساسي في اللغة الإنجليزية - المراثي، نظام ماريثي-إنجليزي خط الأساس، ونظام إنجليزي - مراثي يعتمد على تقنية الترجمة الخلفي.نستكشف أداء أنظمة NMT هذه بين لغات اللغة الإنجليزية والمراثي، والتي تشكل زوج لغة موارد منخفضة بسبب عدم توفر بيانات متوازية كافية.نستكشف أيضا أداء تقنية الترجمة الخلفي عندما يتم الحصول على البيانات المترجمة الخلفي من أنظمة NMT التي يتم تدريبها على كمية أقل من البيانات.من تجاربنا، نلاحظ أن تقنية الترجمة الخلفي يمكن أن تساعد في تحسين جودة MT على خط الأساس لزوج اللغة الإنجليزية المهاراتية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نصفنا (Team - Onenlp-IITH) مناهج الترجمة الآلية العصبية الخاصة بنا للماراثية الإنجليزية (كلا الاتجاه) ل LORESMT-20211.جربنا الترجمة الآلية العصبية القائمة على المحولات واستكشف استخدام ميزات لغوية مختلفة مثل نقاط البيع والتحول في وحدة ا لكلمات الفرعية لكل من اللغة الإنجليزية والماراثية والإنجليزية.بالإضافة إلى ذلك، استكشفنا أيضا الترجمة إلى الأمام والخلف باستخدام بيانات مونولجة الزحف على الويب.حصلنا على 22.2 (عموما 2 ND) و 31.3 (إجمالي 1 سانت) درجات بلو للإنجليزية - المراثي والماراثي - الإنجليزية على التوالي
في هذه الورقة ونحن نستكشف تقنيات مختلفة للتغلب على تحديات الموارد المنخفضة في الترجمة الآلية العصبية (NMT) وتركز على وجه التحديد على حالة اللغة الإنجليزية الماراثية NMT. تتطلب أنظمة NMT كمية كبيرة من كورسا الموازية للحصول على ترجمات ذات نوعية جيدة. ن حاول تخفيف مشكلة الموارد المنخفضة عن طريق زيادة Corpora الموازية أو باستخدام تعلم النقل. تستخدم تقنيات مثل حقن الجدول العبارة (PTI) والترجمة الخلفي وخلط لغة اللغة لتعزيز البيانات الموازية؛ في حين أن المظلات المحورية والمحسبات متعددة اللغات تستخدم للاستفادة من تعلم التحويل. بالنسبة للمحور المحوري، تأتي الهندية في اللغة المساعدة للترجمة الإنجليزية المهاراتية. بالمقارنة مع نموذج محول الأساس، يلاحظ اتجاه تحسن كبير في درجة بلو عبر تقنيات مختلفة. لقد قمنا بإجراء تقييم واسع النطاق والتولي والنوعي لأنظمنا. نظرا لأن الاتجاه في الترجمة الآلية (MT) اليوم هو ما بعد التحرير وقياس الحد من الجهود البشرية (لها)، ونعطينا ملاحظاتنا الأولية لمعدل تحرير الترجمة (TER) مقابل دراسة درجة بلو وحيث يعتبر TER كتدبير لها.
نقدم نتائج المهمة المشتركة ل LORESMT 2021 التي تركز على الترجمة الآلية (MT) من بيانات CovID-19 لكل من اللغات المنطوقة والتسوق المنخفضة الموارد. تم إجراء تنظيم هذه المهمة كجزء من ورشة العمل الرابعة حول تكنولوجيات الترجمة الآلية لغات الموارد المنخفضة ( LORESMT). يتم تقديم Corpora المتوازي والمتاحة للجمهور والتي تتضمن الاتجاهات التالية: English↔irish، English↔marathi، وتايوانية Language Language Chinese. تتكون بيانات التدريب من 8112 و 20933 و 128608، على التوالي. هناك مجموعات بيانات أحادية الأحادية الإضافية للماراثية والإنجليزية التي تتكون من 21901 شريحة. تعتمد النتائج المقدمة هنا على مداخل من إجمالي ثمانية فرق. قدم ثلاثة فرق أنظمة للإنجليز في حين أن خمسة فرق قدمت أنظمة ل EnglishMarathi. لسوء الحظ، لم تكن هناك عروض أنظمة لمهمة التايوانية للتايوانية. تم حساب أقصى أداء النظام باستخدام BLEU ومتابعة AS 36.0 للغة الإنجليزية - الأيرلندية، 34.6 للأيرلندية - الإنجليزية، 24.2 للغة الإنجليزية - الماراثي، و 31.3 للماراثي - الإنجليزية.
تم تطوير نماذج الترجمة للمجال المحدد لترجمة بيانات CovID من الإنجليزية إلى الأيرلندية لمهمة LORESMT 2021 المشتركة.تم تطبيق تقنيات التكيف عن المجال، باستخدام كوربوس 55K 55K تكييفها كوفي من المديرية العامة للترجمة.تم مقارنة أداء الدقيقة والضبط الجمنيات المختلطة ومقارنة أساليب البيانات المشتركة مع النماذج المدربة على مجموعة بيانات داخلية ممتدة.كجزء من هذه الدراسة، تم تطوير مجموعة بيانات باللغة الإنجليزية والأيرلندية من البيانات ذات الصلة بالكوفت، من المجالات الصحية والتعليمية.يستخدم نموذج أعلى مستوياته بنية محول مدربة مع مجموعة بيانات Covid داخل المجال.في سياق هذه الدراسة، أظهرنا أن تمديد مجموعة بيانات أساسية 8K داخل المجال من خلال خطوط 5K فقط تحسنت درجة بلو بمقدار 27 نقطة.
نقدم أنظمة جامعة وسط فلوريدا للمهمة المشتركة ل LORESMT 2021، والمشاركة في أزواج الترجمة الإنجليزية والأيرلندية والإنجليزية المهاراتية.ركزنا جهودنا على تتبع المهمة المقيدة، وذلك باستخدام تعلم التحويل تجزئة الكلمات الفرعية لتعزيز نماذجنا بالنظر إلى كمي ات صغيرة من بيانات التدريب.حققت نماذجنا أعلى درجات بلو على المسارات المقيدة بالكامل للغة الإنجليزية والأيرلندية والأيرلندية والإنجليزية والماراثية - الإنجليزية مع عشرات 13.5 و 21.3 و 17.9 على التوالي

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا