تحدي لغة مفاجأة: تطوير نظام ترجمة آلية عصبية بين البشتونية والإنجليزية في شهرين


الملخص بالعربية

في صناعة وسائل الإعلام وتركيز التقارير العالمية قد تحول بين عشية وضحاها. هناك حاجة ملحة إلى أن تكون قادرة على تطوير أنظمة ترجمة آلية جديدة في فترة زمنية قصيرة وللغطي بشكل أكثر كفاءة تطوير القصص بسرعة أكبر. كجزء من مشروع EU Gourmet ورفع التركيز على الترجمة ذات الآلات المنخفضة وشركاؤنا الإعلامي لغة مفاجئة يجب أن يتم بناء نظام الترجمة الآلي وتقييمه خلال شهرين (فبراير وآذار / مارس 2021). كانت اللغة المختارة كانت الباشتونية ولغة هندية إيرانية تحدثت في أفغانستان وباكستان والهند. في هذه الفترة، أكملنا خط الأنابيب الكامل لتنمية نظام الترجمة الآلية العصبية: الزحف البيانات والتنظيف ومحاذاة وإنشاء مجموعات الاختبار وتطوير ونماذج الاختبار وتقديمها إلى شركاء المستخدمين. في هذه الورق، نطبق إنشاء البيانات والتجارب السريعة مع التعلم والنقل الاحتياطي لهذا زوج لغة الموارد المنخفضة. نجد أن بدءا من نموذج كبير موجود مدرب مسبقا على 50 لغة يؤدي إلى نتائج بلو أفضل بكثير من الاحيلية على زوج لغة موارد عالية مع نموذج أصغر. نقدم أيضا تقييم بشري لأنظمنا والتي تشير إلى أن النظم الناتجة أداء أفضل من النظام التجاري المتاح بحرية عند ترجمة من اللغة الإنجليزية إلى اتجاه البشتونية وبالمثل عند ترجمة من البشتو إلى الإنجليزية.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث