ترغب بنشر مسار تعليمي؟ اضغط هنا

وصف نظام Spectrans لمهمة مصطلحات WMT21

The SPECTRANS System Description for the WMT21 Terminology Task

503   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تناقش هذه الورقة المهمة المشتركة لمصطلحات WMT 2021 من منظور "Meta".نقدم نتائج تجاربنا باستخدام مجموعة بيانات المصطلحات و OpenNMT (Klein et al.، 2017) و Joeynmt (Kreutzer et al.، 2019) Toolkits لاتجاه اللغة الإنجليزية إلى الفرنسية.تجربتنا 1 يقارن تنبؤات مجموعة الأدوات.تستخدم التجربة 2 OpenNMT لضبط النموذج.نبلغ عن نتائجنا للحصول على المهمة مع البرنامج النصي التقييم ولكن في الغالب مناقشة الخصائص اللغوية لمجموعة بيانات المصطلحات المقدمة للمهمة.نحن نقدم دليلا على أهمية أنواع الأنواع النصية عبر الدرجات، بعد أن تم تكرار البرامج النصية للتقييم.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة التقديمات PROMT لمهمة ترجمة المصطلحات WMT21.نشارك في اتجاهين: الإنجليزية إلى الفرنسية والإنجليزية إلى الروسية.التقديمات النهائية لدينا هي النظم العصبية القائمة على mariannmt.نقدم تقنيين للترجمة المصطلحات: تعديل دينو وآخرون.(2019) نهج ض عيف مقيد ونهجنا يسمى PROMT القاموس الذكي العصبي (Smartnd).نحقق نتائج جيدة في كلا الاتجاهين.
تصف هذه الورقة أنظمة Tencent Translation ذات المهمة المشتركة WMT21. نشارك في مهمة ترجمة الأخبار على ثلاث أزواج لغة: الصينية-الإنجليزية والإنجليزية والصينية والألمانية والإنجليزية. يتم بناء أنظمتنا على نماذج محولات مختلفة مع تقنيات جديدة تتكيف من عملن ا البحثي الأخير. أولا، نجمع بين طرق تكبير البيانات المختلفة بما في ذلك الترجمة المرجودة والترجمة الأمامية والتدريب من اليمين إلى اليسار لتوسيع بيانات التدريب. نستخدم أيضا تحيز التغطية اللغوية وتجديد البيانات ونهج أخذ العينات المستندة إلى عدم اليقين لتحديد بيانات ذات صلة بالمحتوى وعالية الجودة من كوربورا متوازية ومونولجة كبيرة. نتوقع أن يتم ضبطه بشكل جيد في المجال، ونقترح أيضا نماذج واحدة المحبوثة نموذج واحد "" لنموذج خصائص نموذجية لأنواع الأخبار المختلفة عند مراحل الركود الدقيقة وفك التشفير. علاوة على ذلك، نستخدم خوارزمية الفرقة القائمة على الجشع وطريقة الفرقة المتناقلة لتعزيز أنظمتنا. بناء على نجاحنا في آخر WMT، فإننا أعملنا باستمرار تقنيات متقدمة مثل التدريب الدفاعي الكبير واختيار البيانات وتصفية البيانات. أخيرا، يحقق نظامنا الصيني والإنجليزي المقيد 33.4 درجة بلو حساسة للحالة، وهو الأعلى بين جميع التقديمات. يتم تصنيف نظام اللغة الإنجليزية الألمانية في المركز الثاني وفقا لذلك.
تصف هذه الورقة تقديم LIT-NLP LAB إلى المهمة المشتركة للترجمة الثلاثي WMT-21 Triangular.لا يسمح للمشاركين باستخدام البيانات الأخرى واتجاه الترجمة لهذه المهمة هو الروسية إلى الصينية.في هذه المهمة، نستخدم المحول كنموذج الأساس لدينا، ودمج العديد من التقن يات لتعزيز أداء الأساس، بما في ذلك تصفية البيانات، واختيار البيانات، والضبط الناعم، والتحرير بعد التحرير.علاوة على ذلك، للاستفادة من موارد اللغة الإنجليزية، مثل البيانات الروسية / الإنجليزية والصينية / الإنجليزية الموازية، يتم إنشاء مثلث العلاقة من خلال أنظمة الترجمة الآلية العصبية متعددة اللغات.نتيجة لذلك، يحقق تقديمنا نقاطا بلو 21.9 في الروسية إلى الصينية.
في تجربة حالية، كنا نقوم باختبار DataSet Commongen للمهمة الهيكلية إلى النص من GEM Living Benchmark مع نموذج مؤشر القيد القائم.يمثل المؤشر هندسة هجينة، والجمع بين النماذج القائمة على الإدراج والمحول، والتنبؤ بالكمية وموقع الإدراج في نفس الوقت.لذلك يت م إنشاء النص تدريجيا بطريقة غير متوازية غير تلقائية، بالنظر إلى مجموعة الكلمات الرئيسية.كان النموذج المحدد ضبطه بشكل جيد على تقسيم تدريب لمجموعة بيانات Commungen وتم مقارنة نتيجة الجيل بالتحقق من الصحة والتحدي.تتم مناقشة مخرجات المقاييس المستلمة، والتي تقيس المعادلات المعجمية، التشابه الدلالي والتنوع، في التفاصيل في وصف النظام الحالي.
توضح هذه الورقة تقديم TENTRANS إلى مهمة مشتركة من Translation Translation منخفضة اللغات WMT21 لأزواج اللغة الرومانسية.تركز هذه المهمة على تحسين جودة الترجمة من الكاتالونية إلى Occitan والرومانية والإيطالية، بمساعدة لغات الموارد ذات الصلة ذات الصلة.نح ن نستخدم أساسا الترجمة المرجانية، والطرق القائمة على المحور، ونماذج متعددة اللغات، ونقل النموذج المدربين مسبقا، ونقل المعرفة داخل المجال لتحسين جودة الترجمة.في مجموعة الاختبار، يحقق نظامنا الأفضل المقدم بمتوسط 43.45 درجات بلو حساسة لحالة الأحرف عبر جميع أزواج الموارد المنخفضة.تتوفر بياناتنا ورمز النماذج المدربة مسبقا مسبقا في هذا العمل في أمثلة تقييم Tentrans.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا