ترغب بنشر مسار تعليمي؟ اضغط هنا

آدم ميكيكيز جامعة هوسا التقديمات الإنجليزي والهوسا لمهمة الترجمة من WMT 2021

Adam Mickiewicz University's English-Hausa Submissions to the WMT 2021 News Translation Task

132   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة التقديمات بجامعة ADAM MICKIECZ (AMU) لمهمة الترجمة الإخبارية WMT 2021.التركيز التقديمات على اتجاهات ترجمة English↔hausa، وهي سيناريو ترجمة موارد منخفضة بين اللغات البعيدة.ينطوي نهجنا على تنظيف بيانات شامل، ونقل التعلم باستخدام زوج لغة الموارد عالية الموارد، والتدريب التكراري، واستخدام بيانات أحادية المونولينغ عبر الترجمة الخلفي.نقوم بتجربة نهج NMT و PB-SMT على حد سواء، باستخدام بنية المحولات الأساسية لجميع نماذج NMT أثناء الاستفادة من أنظمة PB-SMT كحلول أساسية مماثلة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه الورقة تقييدات جامعة إدنبرة المقيدة لأنظمة اللغة الإنجليزية والألمانية والإنجليزية إلى المهمة المشتركة WMT 2021 بشأن ترجمة الأخبار.نحن نبني أنظمة EN-DE في ثلاث مراحل: تصفية Corpus، الترجمة الخلفية، والضبط الجميل.بالنسبة إلى EN-HA، نستخدم نهج ا للترجمة مرة أخرى في أعلى نماذج الإنشاء المدرب مسبقا والتحقيق في رسم الخرائط المفردات.
تصف الورقة طرز 3 NMT المقدمة من فريق ETRANSLEATION إلى مهمة مشتركة من WMT 2021 الأخبار.قمنا بتطوير أنظمة في أزواج اللغة المستخدمة بنشاط في خدمة إبعاد المفوضية الأوروبية.في مهمة أخبار WMT، شهدت السنوات الأخيرة زيادة مطردة في الحاجة إلى موارد حسابية لت دريب البنيات العميقة والمعقدة لإنتاج أنظمة تنافسية.أخذنا نهجا مختلفا واستعرضنا استراتيجيات بديلة تركز على اختيار البيانات وتصفية لتحسين أداء أنظمة الأساس.في المجال المهمة المقيدة للزوج باللغة الفرنسية - الألمانية نتج عنه نهجنا في أفضل نظام لهامش مهم في بلو.بالنسبة للأنظمة الأخرى (الإنجليزية - الألمانية والإنجليزية - التشيكية) حاولنا بناء نماذج تنافسية باستخدام أفضل الممارسات القياسية.
الترجمة الآلية العصبية (NMT) هي تكنولوجيا ترجمة آلية سائدة في الوقت الحاضر بسبب مرونةها التدريبية المتنقلة المحيرة.ومع ذلك، لا يزال NMT يكافح من أجل الترجمة بشكل صحيح في إعدادات الموارد المنخفضة خصيصا على أزواج اللغة البعيدة.طريقة واحدة للتغلب على ذل ك هي استخدام المعلومات من طرائق أخرى إذا كانت متوفرة.الفكرة هي أنه على الرغم من الاختلافات في اللغات، فإن كل من المصدر والمتحدثين اللغوي المستهدف يرون نفس الشيء والتمثيل المرئي لكل من المصدر والهدف هو نفسه، والذي يمكن أن يساعد النظام بشكل إيجابي.يمكن أن تساعد المعلومات متعددة الوسائط نظام NMT لتحسين الترجمة عن طريق إزالة الغموض على بعض العبارات أو الكلمات.نحن نشارك في ورشة العمل الثامنة حول الترجمة الآسيوية (WAT - 2021) لمهمة الترجمة الإنجليزية العربية الهندية وتحقيق 42.47 و 37.50 نقطة بلو للتقييم والتحدي الفرعي، على التوالي.
نقدم تطوير نظام الترجمة الآلي متعدد اللغات لمهمة الترجمة متعددة اللغات متعددة اللغات المهمة متعددة اللغات في WMT 2021. بدء تشغيل نظام الأساس المحتمل، حققنا في العديد من التقنيات لتحسين جودة الترجمة على المجموعة الفرعية المستهدفة من اللغات.تمكنا من تح سين جودة الترجمة بشكل كبير من خلال تكييف النظام باتجاه المجموعة الفرعية المستهدفة من اللغات وتوليد بيانات اصطناعية باستخدام النموذج الأولي.التقنيات المطبقة بنجاح في الترجمة متعددة اللغز المزدوجة (E.G. التشابه العادي) كان لها تأثير بسيط فقط على أداء الترجمة النهائي.
تحديات مهمة كفاءة ترجمة الآلات التي تحديات المشاركين لجعل أنظمتهم أسرع وأصغر مع الحد الأدنى من التأثير على جودة الترجمة.ما مقدار الجودة للتضحية بالكفاءة يعتمد على التطبيق، لذلك تم تشجيع المشاركين على تقديم عروض متعددة تغطي مساحة المقاضيات.في المجموع، كان هناك 53 طلب من 4 فرق.كان هناك GPU، وحدة المعالجة المركزية واحدة النواة، ومقطوعات الأجهزة وحدة المعالجة المركزية متعددة النواة وكذلك الإنتاجية المركبة أو ظروف الكمون الجملة واحدة.أظهرت التقديمات مئات الملايين من الكلمات يمكن ترجمتها مقابل الدولار، متوسط الكمون هو 5--17 مللي ثانية، ونماذج تناسبها 7.5-150 ميغابايت.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا