تقارير هذه الورقة تحسين استخدام البيانات خارج المجال في مهمة الترجمة الطبية الحيوية.حددنا أولا مجموعة بيانات التدريب الموازية باستخدام كلمات مصطلحات Babelnet داخل المجال.بعد ذلك، لزيادة مجموعة التدريب، درسنا آثار بيانات خارج المجال حول مهام الترجمة الطبية الحيوية، وقد أنشأنا مزيجا من مجموعات التدريب داخل المجال والخروج وإضافة بيانات أكثر داخل المجال باستخدامالترجمة إلى الأمام في المهمة الإنجليزية الإسبانية.أخيرا، مع طريقة تحسين BPE بسيطة، قمنا بزيادة عدد الكلمات الفرعية داخل المجال في مجموعة التدريب المختلطة لدينا وتدريب طراز المحول على البيانات التي تم إنشاؤها.تظهر النتائج تحسينات باستخدام طريقة لدينا المقترحة.
This paper reports the optimization of using the out-of-domain data in the Biomedical translation task. We firstly optimized our parallel training dataset using the BabelNet in-domain terminology words. Afterward, to increase the training set, we studied the effects of the out-of-domain data on biomedical translation tasks, and we created a mixture of in-domain and out-of-domain training sets and added more in-domain data using forward translation in the English-Spanish task. Finally, with a simple bpe optimization method, we increased the number of in-domain sub-words in our mixed training set and trained the Transformer model on the generated data. Results show improvements using our proposed method.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نقدم نظام FJWU مقدم إلى المهمة المشتركة الطبية الحيوية في WMT21.أعدت أنظمة الترجمة الآلية العصبية متعددة اللغات لمدة ثلاث لغات (أي الألمانية والإسبانية والفرنسية) مع اللغة الإنجليزية كلغة مستهدفة.تم تدريب أنظمة NMT الخاصة بنا المستندة
تصف هذه الورقة تقديم مختبر Tencent AI المهمة المشتركة WMT2021 على الترجمة الطبية الحيوية في ثمانية اتجاهات اللغة: الإنجليزية والألمانية والفرنسية والفرنسية والإنجليزية والإسبانية والإنجليزية الروسية.استغلنا بديكنات محولات مختلفة واستراتيجيات الترجمة
تصف هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى مهمة الترجمة الطبية الحيوية WMT21 في أزواج لغتان باللغة: Chinese↔english و German↔english (اسم فريقنا المسجل هو Huaweitsc).يتم تقديم التفاصيل الفنية في هذه الورقة، بما في ذلك الإطار النموذجي
تصف هذه الورقة أنظمة Fujitsu Dmath المستخدمة لترجمة WMT 2021، ومهام الترجمة الطبية الحيوية.ركزنا على أزواج منخفضة الموارد، باستخدام نظام بسيط.أجرينا تجارب على اللغة الإنجليزية هوسا، Xhosa-Zulu والإنجليزية-الباسك، وقدمت نتائج Xhosa → Zulu في مهمة ترجم
تصف هذه الورقة أنظمة Tencent Translation ذات المهمة المشتركة WMT21. نشارك في مهمة ترجمة الأخبار على ثلاث أزواج لغة: الصينية-الإنجليزية والإنجليزية والصينية والألمانية والإنجليزية. يتم بناء أنظمتنا على نماذج محولات مختلفة مع تقنيات جديدة تتكيف من عملن