ترغب بنشر مسار تعليمي؟ اضغط هنا

نتائج المهمة المشتركة WMT على الترجمة الآلية باستخدام المصطلحات

Findings of the WMT Shared Task on Machine Translation Using Terminologies

354   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مجالات اللغة التي تتطلب الاستخدام الدقيق للغاية للمصطلحات وفيرة وتعكس جزءا كبيرا من صناعة الترجمة.في هذا العمل، نقدم معيارا لتقييم نوعية الترجمة المصطلحات والاتساق، مع التركيز على المجال الطبي (والكوفي 19 على وجه التحديد) لمدة خمسة أزواج لغوية: الإنجليزية إلى الفرنسية والصينية والروسية والكورية، وكذلك جمهورية التشيكألمانية.نبلغ عن أوصاف النظم المشاركة ونتائجها، وتعليقا على الحاجة إلى مزيد من الجهود البحثية فيما يتعلق بتعامل مع المصطلحات الأكثر ملاءمة أيضا نحو صياغة وتقييم مناسبة للمهمة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة تقديم Lingua Custodia إلى المهمة المشتركة WMT21 على الترجمة الآلية باستخدام المصطلحات.نحن نعتبر ثلاث اتجاهات، وهي الإنجليزية إلى الفرنسية والروسية والصينية.نحن نعتمد على بنية قائمة على المحولات كمنظمة بناء، ونحن نستكشف طريقة تقدم تغيير تين رئيسيتين على الإجراء القياسي للتعامل مع المصطلحات.أول واحد يتكون في زيادة البيانات التدريبية بطريقة تشجيع النموذج لتعلم سلوك النسخ عند مواجهة مصطلحات قواعد المصطلحات.التغيير الثاني هو عبيد موضعي اخفاء، والغرض منه هو تخفيف التعلم سلوك النسخ وتحسين تعميم النموذج.تظهر النتائج التجريبية أن طريقتنا تلبي معظم قيود المصطلين مع الحفاظ على جودة الترجمة عالية.
تحديات مهمة كفاءة ترجمة الآلات التي تحديات المشاركين لجعل أنظمتهم أسرع وأصغر مع الحد الأدنى من التأثير على جودة الترجمة.ما مقدار الجودة للتضحية بالكفاءة يعتمد على التطبيق، لذلك تم تشجيع المشاركين على تقديم عروض متعددة تغطي مساحة المقاضيات.في المجموع، كان هناك 53 طلب من 4 فرق.كان هناك GPU، وحدة المعالجة المركزية واحدة النواة، ومقطوعات الأجهزة وحدة المعالجة المركزية متعددة النواة وكذلك الإنتاجية المركبة أو ظروف الكمون الجملة واحدة.أظهرت التقديمات مئات الملايين من الكلمات يمكن ترجمتها مقابل الدولار، متوسط الكمون هو 5--17 مللي ثانية، ونماذج تناسبها 7.5-150 ميغابايت.
نقدم نتائج المهمة الأولى على الترجمة ذات الجهاز متعدد اللغات على نطاق واسع.تتكون المهمة على التقييم المتعدد إلى العديد من النماذج الفردية عبر مجموعة متنوعة من اللغات المصدر والمستهدفة.هذا العام، تتألف المهمة على ثلاثة إعدادات مختلفة: (1) المهمة الصغي رة 1 (لغات أوروبا الوسطى / الجنوبية الشرقية)، (2) المهمة الصغيرة 2 (لغات جنوب شرق آسيا)، و (3) مهمة كاملة (كل 101 × 100 زوج أزواج).استخدمت جميع المهام DataSet Flores-101 كمعيار التقييم.لضمان طول العمر من مجموعة البيانات، لم يتم إصدار مجموعات الاختبار علنا وتم تقييم النماذج في بيئة خاضعة للرقابة على Dynabench.كان هناك ما مجموعه 10 فرق مشاركة للمهام، بما مجموعه 151 من العروض النموذجية المتوسطة و 13 نماذج نهائية.تظهر نتائج هذا العام تحسنا كبيرا على خطوط الأساس المعروفة مع +17.8 بلو ل Task-Task2، +10.6 للمهمة الكاملة و +3.6 للمهمة الصغيرة 1.
نبلغ عن نتائج المهمة المشتركة WMT 2021 بشأن تقدير الجودة، حيث يتحدى التحدي هو التنبؤ بجودة إخراج أنظمة الترجمة الآلية العصبية على مستوى الكلمة ومستويات الجملة.ركزت هذه الطبعة على إضافات رواية رئيسيتين: (1) التنبؤ باللغات غير المرئية، أي إعدادات صفرية ، و (2) التنبؤ بالأحكام ذات الأخطاء الكارثية.بالإضافة إلى ذلك، تم إصدار بيانات جديدة لعدة من اللغات، وخاصة البيانات التي تم تحريرها بعد التحرير.قدمت الفرق المشاركة من 19 مؤسسة تماما 1263 أنظمة لمتغيرات المهام المختلفة وأزواج اللغة.
تصف هذه الورقة تقديم Kakao Enterprise إلى الترجمة الآلية المشتركة WMT21 باستخدام مهمة المصطلحات.نحن ندمج قيود المصطلحات من خلال التدريب المسبق مع التوضيحات المستهدفة التلقائية والضبط بشكل جيد مع التعليقات التوضيحية المستهدفة الدقيقة باستخدام مجموعة ب يانات المصطلحات المحددة.ينتجج هذا النهج نموذجا يحقق نتائج رائعة من حيث جودة الترجمة واتساق الأجل، المرتبة الأولى بناء على المذنب في اتجاه لغة EN → FR.علاوة على ذلك، نستكشف أساليب مختلفة مثل الترجمة الخلفية، ومصطلحات تدريب صريحة كبيانات متوازية إضافية، واختيار بيانات داخل المجال.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا