ترغب بنشر مسار تعليمي؟ اضغط هنا

توضح هذه الورقة تقديم NetMarble إلى مهمة مشاركة WMT21 التلقائية بعد التحرير (القرد) لزوج اللغة الإنجليزية الألمانية. أولا، نقترح استراتيجية تدريب المناهج الدراسية في مراحل التدريب. تم اختيار نموذج الترجمة من WMT19 Face Facebook لإشراك الشبكات العصبية الكبيرة والقوية المدربة مسبقا. ثم، نقوم بتنفيذ نموذج الترجمة بمستويات مختلفة من البيانات في كل مراحل تدريبية. مع استمرار مراحل التدريب، نجعل النظام يتعلم حل مهام متعددة عن طريق إضافة معلومات إضافية في مراحل التدريب المختلفة تدريجيا. نعرض أيضا طريقة لاستخدام البيانات الإضافية في حجم كبير لمهام القرد. لمزيد من التحسين، نطبق استراتيجية التعلم متعددة المهام مع متوسط ​​الوزن الديناميكي خلال مرحلة ضبط الدقيقة. لضبط Corpus القرد مع بيانات محدودة، نضيف بعض المهام الفرعية ذات الصلة لتعلم تمثيل موحد. أخيرا، للحصول على أداء أفضل، نستفيد الترجمات الخارجية كترجمة آلية ازدهار (MT) أثناء التدريب على ما بعد التدريب والضبط. كما تظهر النتائج التجريبية، يعمل نظام القرد لدينا بشكل كبير على تحسين ترجمات نتائج MT المقدمة بنسبة -2.848 و +3.74 على مجموعة بيانات التطوير من حيث TER و Bleu، على التوالي. كما يوضح فعاليته في مجموعة بيانات الاختبار بجودة أعلى من مجموعة بيانات التطوير.
تقدم هذه الورقة تقديم مركز خدمات الترجمة Huawei (HW-TSC) إلى مهمة مشتركة من WMT 2021.نستكشف تقنية تقطير الطالبات على مستوى الجملة وتدريب العديد من النماذج الصغيرة التي تجد التوازن بين الكفاءة والجودة.تتميز نماذجنا بمثابة تشفير عميق ومكتشف ضحل وخفيف ا لوزن RNN مع طبقة SSRU.نستخدم بولت هواوي نوح، مكتبة فعالة ووزن خفيفة للاستدلال على الجهاز.الاستفادة من كمية INT8 الكمي، مشغل مصفوفة العام (GEMM) العام المعرفة ذاتيا (GEMM)، القائمة المختصرة، البحث الجشع والتخزين المؤقت، نقدم أربعة نماذج ترجمة صغيرة الحجم وكفاءة مع جودة الترجمة عالية لمسار الكمون CPU واحد.
تصف هذه الورقة مهمة Charles University الفرعية للمصطلحات المهمة المشتركة للترجمة في WMT21.الهدف من هذه المهمة هو تصميم نظام يترجم مع شروط معينة بناء على قاعدة بيانات المصطلحات المقدمة، مع الحفاظ على جودة الترجمة الشاملة عالية.تنافسنا في زوج اللغة الإ نجليزية الفرنسية.يعتمد نهجنا على توفير الترجمات المرغوبة إلى جانب جملة الإدخال وتدريب النموذج لاستخدام هذه المصطلحات المقدمة.نحن Lemmatize المصطلحات على حد سواء أثناء التدريب والاستدلال، للسماح للنموذج لمعرفة كيفية إنتاج الأشكال السطحية الصحيحة للكلمات، عندما تختلف عن النماذج المتوفرة في قاعدة بيانات المصطلحات.
تصف الورقة طرز 3 NMT المقدمة من فريق ETRANSLEATION إلى مهمة مشتركة من WMT 2021 الأخبار.قمنا بتطوير أنظمة في أزواج اللغة المستخدمة بنشاط في خدمة إبعاد المفوضية الأوروبية.في مهمة أخبار WMT، شهدت السنوات الأخيرة زيادة مطردة في الحاجة إلى موارد حسابية لت دريب البنيات العميقة والمعقدة لإنتاج أنظمة تنافسية.أخذنا نهجا مختلفا واستعرضنا استراتيجيات بديلة تركز على اختيار البيانات وتصفية لتحسين أداء أنظمة الأساس.في المجال المهمة المقيدة للزوج باللغة الفرنسية - الألمانية نتج عنه نهجنا في أفضل نظام لهامش مهم في بلو.بالنسبة للأنظمة الأخرى (الإنجليزية - الألمانية والإنجليزية - التشيكية) حاولنا بناء نماذج تنافسية باستخدام أفضل الممارسات القياسية.
في هذه الورقة، نقدم نظام FJWU مقدم إلى المهمة المشتركة الطبية الحيوية في WMT21.أعدت أنظمة الترجمة الآلية العصبية متعددة اللغات لمدة ثلاث لغات (أي الألمانية والإسبانية والفرنسية) مع اللغة الإنجليزية كلغة مستهدفة.تم تدريب أنظمة NMT الخاصة بنا المستندة إلى بنية المحولات، على مجموعة من كورسيا الموازية داخل المجال والخروج المستخدمة باستخدام تقنيات استرجاع المعلومات (IR) وتقنيات تكيف المجال.
تقدم هذه الورقة نتائج المهمة المشتركة للمقاييس WMT21. طلب من المشاركين تسجيل مخرجات أنظمة الترجمة المتنافسة في مهمة الترجمة الأخبار WMT21 مع مقاييس أوتوماتيكية على مجطتين مختلفتين: أخبار ومحادثات تيد. تم تقييم جميع المقاييس على مدى ارتباطها على مستوى النظام والقطاع مع التصنيفات البشرية. على عكس إصدارات السنوات السابقة، فقد استحوذنا هذا العام على تصنيفاتنا الإنسانية الخاصة بنا على أساس التقييم البشري القائم على الخبراء عبر مقاييس الجودة متعددة الأبعاد (MQM). يحتوي هذا الإعداد على العديد من المزايا: (1) قد أظهر التقييم القائم على الخبراء أنه أكثر موثوقية، (2) تمكنا من تقييم جميع المقاييس على مجاليين مختلفين باستخدام ترجمات نفس أنظمة MT، (III) أضفنا 5 إضافية الترجمات القادمة من نفس النظام أثناء تطوير النظام. بالإضافة إلى ذلك، صممنا ثلاث مجموعات تحدي تقيم متانة جميع المقاييس التلقائية. نقدم تحليلا مكثفا حول مدى أداء المقاييس على أزواج ثلاث لغات: الإنجليزية إلى الألمانية والإنجليزية إلى الروسية والصينية إلى الإنجليزية. نوضح تأثير الترجمات المرجعية المختلفة على المقاييس المستندة إلى المرجع ومقارنة شرح MQM القائم على الخبراء مع درجات DA المكتسبة بواسطة WMT.
اجتذبت التحقق من الحقائق التلقائي اهتماما بالبحوث الحديثة باعتباره نشر متزايد للتضليل على منصات وسائل التواصل الاجتماعي.تقدم المهمة المشتركة الحميرة معيارا للتحقق من الحقائق، حيث يتم تحدي النظام للتحقق من المطالبة المعينة باستخدام العناصر الواضحة الم ستخرجة من وثائق ويكيبيديا.في هذه الورقة، نقترح نظامنا الثالث الذي يتكون نظامنا الثالث من ثلاثة مراحل يتكون من استرجاع المستندات، واسترجاع العناصر، والاستدلال الحكم للمهمة المشتركة الحمية.من خلال النظر في أهمية السياق في مهمة استخراج الحقائق والتحقق، فإن نظامنا يحقق 0.29 درجة حمامة على مجموعة التطوير و 0.25 درجة حمامة على مجموعة الاختبار العمياء، سواء تتفوق على خط الأساس الحمير.
تقدم هذه الورقة عملنا في مهمة تقدير الجودة WMT 2021 (QE).لقد شاركنا في جميع المهام الفرعية الثلاثة، بما في ذلك مهمة التقييم المباشر على مستوى الجملة، والكلمة ومهمة جهود جهود ما بعد التحرير للكلمة وحكم الجملة ومهمة الكشف عن الأخطاء الحرجة، في جميع أزو اج اللغات.تستخدم أنظمتنا إطار النبة المقدرة، بشكل ملموس باستخدام XLM-Roberta مدربة مسبقا كقسم مؤشر ومجموعة من المهام أو التراجع كمقيم.بالنسبة لجميع المهام، نحسن أنظمتنا من خلال دمج الجملة بعد التعديل أو جملة ترجمة إضافية عالية الجودة في طريقة التعلم المتعدد أو ترميزها مع التنبؤ مباشرة.علاوة على ذلك، في وضع صفري بالرصاص، فإن استراتيجية تكبير البيانات الخاصة بنا تعتمد على تراجع مونت كارلو يجلب تحسنا كبيرا في مهمة DA Sub.والجدير بالذكر أن عروضنا تحقق نتائج ملحوظة على جميع المهام.
تصف هذه الورقة التقديمات SYSTRAN إلى المهمة المشتركة لمصطلحات WMT 2021.نشارك في اتجاه الترجمة الإنجليزي إلى الفرنسية مع شبكة الترجمة الآلية العذبة القياسية التي نعززها مع القدرة على تضمين قيود المصطلحات بشكل حيوي، وهي ممارسة صناعية مشتركة للغاية.يتم تقييم أساليب إدراج مصطلحتين لمصطلحات حديثة مقرها (ط) على استخدام العناصر النائبة التي تستكمل مع التعليق التوضيحي المورفوسنيتات و (2) بشأن استخدام القيود المستهدفة حقنها في مجرى المصدر.تظهر النتائج مدى ملاءمة النهج المقدمة في السيناريو المقيم حيث يتم استخدام المصطلحات في نظام مدرب على البيانات العامة فقط.
مجالات اللغة التي تتطلب الاستخدام الدقيق للغاية للمصطلحات وفيرة وتعكس جزءا كبيرا من صناعة الترجمة.في هذا العمل، نقدم معيارا لتقييم نوعية الترجمة المصطلحات والاتساق، مع التركيز على المجال الطبي (والكوفي 19 على وجه التحديد) لمدة خمسة أزواج لغوية: الإنج ليزية إلى الفرنسية والصينية والروسية والكورية، وكذلك جمهورية التشيكألمانية.نبلغ عن أوصاف النظم المشاركة ونتائجها، وتعليقا على الحاجة إلى مزيد من الجهود البحثية فيما يتعلق بتعامل مع المصطلحات الأكثر ملاءمة أيضا نحو صياغة وتقييم مناسبة للمهمة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا