ترغب بنشر مسار تعليمي؟ اضغط هنا

مشاركة HW-TSC في المهمة المشتركة WMT 2021 الأخبار

HW-TSC's Participation in the WMT 2021 News Translation Shared Task

433   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة تقديم مركز خدمات Translate Huawei (HW-TSC) إلى مهمة مشتركة من WMT 2021.نشارك في 7 أزواج لغوية، بما في ذلك ZH / EN، DE / EN، JA / en، HA / EN، هي / EN، HI / BN، و XH / ZU في كلا الاتجاهين تحت الحالة المقيدة.نحن نستخدم بنية المحولات والحصول على أفضل أداء عبر المتغيرات المتعددة بأحجام أكبر معلمة.نحن نقوم بتنفيذ ما قبل المعالجة المفصلة والتصفية على مجموعات بيانات ثنائية اللغة وأنتجة على نطاق واسع.يتم استخدام العديد من الاستراتيجيات الشائعة الاستخدام لتدريب نماذجنا، مثل الترجمة الخلفية، الترجمة الأمامية، الترجمة إلى الأمام، الترجمة متعددة اللغات، تقطير المعرفة الفرعية، إلخ. يحصل تقديمنا نتائج تنافسية في التقييم النهائي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه الورقة تقديم مركز خدمات الترجمة Huawei (HW-TSC) إلى مهمة مشتركة من WMT 2021.نستكشف تقنية تقطير الطالبات على مستوى الجملة وتدريب العديد من النماذج الصغيرة التي تجد التوازن بين الكفاءة والجودة.تتميز نماذجنا بمثابة تشفير عميق ومكتشف ضحل وخفيف ا لوزن RNN مع طبقة SSRU.نستخدم بولت هواوي نوح، مكتبة فعالة ووزن خفيفة للاستدلال على الجهاز.الاستفادة من كمية INT8 الكمي، مشغل مصفوفة العام (GEMM) العام المعرفة ذاتيا (GEMM)، القائمة المختصرة، البحث الجشع والتخزين المؤقت، نقدم أربعة نماذج ترجمة صغيرة الحجم وكفاءة مع جودة الترجمة عالية لمسار الكمون CPU واحد.
تقدم هذه الورقة عملنا في مهمة تقدير الجودة WMT 2021 (QE).لقد شاركنا في جميع المهام الفرعية الثلاثة، بما في ذلك مهمة التقييم المباشر على مستوى الجملة، والكلمة ومهمة جهود جهود ما بعد التحرير للكلمة وحكم الجملة ومهمة الكشف عن الأخطاء الحرجة، في جميع أزو اج اللغات.تستخدم أنظمتنا إطار النبة المقدرة، بشكل ملموس باستخدام XLM-Roberta مدربة مسبقا كقسم مؤشر ومجموعة من المهام أو التراجع كمقيم.بالنسبة لجميع المهام، نحسن أنظمتنا من خلال دمج الجملة بعد التعديل أو جملة ترجمة إضافية عالية الجودة في طريقة التعلم المتعدد أو ترميزها مع التنبؤ مباشرة.علاوة على ذلك، في وضع صفري بالرصاص، فإن استراتيجية تكبير البيانات الخاصة بنا تعتمد على تراجع مونت كارلو يجلب تحسنا كبيرا في مهمة DA Sub.والجدير بالذكر أن عروضنا تحقق نتائج ملحوظة على جميع المهام.
تقدم هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى المهمة المشتركة MT Triangular 2021.نشارك في المهمة الروسية إلى الصينية بموجب الحالة المقيدة.نحن نستخدم بنية المحولات والحصول على أفضل أداء عبر متغير بأحجام أكبر معلمة.نقوم بإجراء بيانات مفصل ة مسبقا وتصفية البيانات المقدمة على نطاق ثنائي اللغة قدمها.تستخدم العديد من الاستراتيجيات لتدريب نماذجنا، مثل الترجمة متعددة اللغات، الترجمة الترجمة متعددة اللغات، الترجمة إلى الأمام، وتنظيم البيانات، ونقطة التفتيش المتوسطة، والوقاحة، والضبط الجميل، وما إلى ذلك. يحصل نظامنا على 32.5 بلو على مجموعة DEAS و 27.7 بلو على مجموعة الاختبار، أعلى الدرجات بين جميع التقديمات.
تصف هذه الورقة تقديم Lingua Custodia إلى المهمة المشتركة WMT21 على الترجمة الآلية باستخدام المصطلحات.نحن نعتبر ثلاث اتجاهات، وهي الإنجليزية إلى الفرنسية والروسية والصينية.نحن نعتمد على بنية قائمة على المحولات كمنظمة بناء، ونحن نستكشف طريقة تقدم تغيير تين رئيسيتين على الإجراء القياسي للتعامل مع المصطلحات.أول واحد يتكون في زيادة البيانات التدريبية بطريقة تشجيع النموذج لتعلم سلوك النسخ عند مواجهة مصطلحات قواعد المصطلحات.التغيير الثاني هو عبيد موضعي اخفاء، والغرض منه هو تخفيف التعلم سلوك النسخ وتحسين تعميم النموذج.تظهر النتائج التجريبية أن طريقتنا تلبي معظم قيود المصطلين مع الحفاظ على جودة الترجمة عالية.
تحديات مهمة كفاءة ترجمة الآلات التي تحديات المشاركين لجعل أنظمتهم أسرع وأصغر مع الحد الأدنى من التأثير على جودة الترجمة.ما مقدار الجودة للتضحية بالكفاءة يعتمد على التطبيق، لذلك تم تشجيع المشاركين على تقديم عروض متعددة تغطي مساحة المقاضيات.في المجموع، كان هناك 53 طلب من 4 فرق.كان هناك GPU، وحدة المعالجة المركزية واحدة النواة، ومقطوعات الأجهزة وحدة المعالجة المركزية متعددة النواة وكذلك الإنتاجية المركبة أو ظروف الكمون الجملة واحدة.أظهرت التقديمات مئات الملايين من الكلمات يمكن ترجمتها مقابل الدولار، متوسط الكمون هو 5--17 مللي ثانية، ونماذج تناسبها 7.5-150 ميغابايت.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا