ترغب بنشر مسار تعليمي؟ اضغط هنا

يحقق هذا العمل في أنظمة الترجمة الآلية العصبية (NMT) لترجمة مراجعات المستخدم الإنجليزية إلى الكرواتية والصربية، وهنايتان لغات معقدة مماثلة مورفولوجية. يتم استخدام نوعين من المراجعات لاختبار الأنظمة: تقييم الأفلام IMDB ومراجعات منتجات الأمازون. يتم اس تكشاف نوعين من بيانات التدريب: كورسا متوازية كبيرة من النطاق، بالإضافة إلى كوربوس الموازية الاصطناعية الصغيرة التي تم الحصول عليها بواسطة الترجمة الآلية لمراجعات الأمازون الإنجليزية أحادية الأمازون في اللغات المستهدفة. تظهر كل من الدرجات التلقائية والتقييم البشري أن استخدام Corpus في المجال الصناعي مع مجموعة فرعية مختارة من بيانات خارج المجال هو الخيار الأفضل. تشير النتائج المنفصلة على مراجعات IMDB و Amazon إلى أن أنظمة MT تؤدي بشكل مختلف عن أنواع المراجعة المختلفة بحيث لا ينبغي اعتبار مراجعات المستخدمين بشكل عام كندي متجانس. ومع ذلك، فإن البحث أكثر تفصيلا حول أكبر قدر من المراجعات المختلفة التي تغطي النطاقات / الموضوعات المختلفة ضرورية لفهم هذه الاختلافات بشكل كامل.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا