ترغب بنشر مسار تعليمي؟ اضغط هنا

العلامة بمساعدة آلة الجهاز العصبي ترجمات الأفلام

Tag Assisted Neural Machine Translation of Film Subtitles

212   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نفذنا نظام ترجمة آلات عصبية يستخدم علامات التسلسل التلقائي لتحسين جودة الترجمة.بدلا من التشغيل في أزواج الجملة غير المركبة، يستخدم نظامنا أنظمة العلامات المدربة مسبقا لإضافة ميزات لغوية إلى المصدر الجمل المستهدفة.تتعلم بنية العصبية المقترحة لدينا تضمين مشترك للرموز والعلامات في التشفير، والرمز المتزامن والتنبؤ بالعلامة في وحدة فك التشفير.بالمقارنة مع خط الأساس مع التدريب غير المرفقي، زادت هذه الهيكل هذه النتيجة بلو للألمانية إلى إخراج الترجمة الفرعية للفيلم الإنجليزي بمقدار 1.61 نقطة باستخدام علامات الكيان المسماة؛ومع ذلك، انخفضت النتيجة بلو بمقدار 0.38 نقطة باستخدام علامات جزء من الكلام.وهذا يدل على أن مخرجات العلامات على مستوى الرمز المميز من أنظمة العلامات خارج الرف يمكن أن تحسن إخراج أنظمة الترجمة العصبية باستخدام التضمين المشترك ومجموعات فك التشفير المتزامنة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في معظم سيناريوهات جهاز التقطير أو سرقة الترجمة الآلية العصبية، يتم استخدام فرضية التسجيل أعلى النموذج المستهدف (المعلم) لتدريب نموذج جديد (طالب).إذا كانت الترجمات المرجعية متاحة أيضا، فيمكن إظهار الفرضيات الأفضل (فيما يتعلق بالمراجع) وفرضيات فقراء إ ما إما إما إما أو إشرافها.تستكشف هذه الورقة طريقة مشهد أخذ العينات (تشذيب، فرضية ترشيحها وتشكيلها، واستكريسيا ومجمديها) مع الإنجليزية إلى التشيكية والإنجليزية إلى طرازات MT الألمانية باستخدام مقاييس تقييم MT القياسية.نظرا لأن الإرتفاع الدقيق والتركيبة مع البيانات الأصلية يؤدي إلى أداء أفضل عند مقارنتها بالتدريب فقط على البيانات الأصلية أو المركبة أو تركيها المباشر.
نحن تصف أمين البرنامج النصي بمساعدة الماكينة (MASC)، وهو نظام للتأليف البرمجي التعاوني للآلة البشرية.تشمل البرامج النصية التي تم إنتاجها مع MASC (1) الأوصاف الإنجليزية للأحداث الفرعية التي تشمل حدث أكبر ومعقدة؛(2) أنواع الأحداث لكل من تلك الأحداث؛(3) سجل من الكيانات المتوقعة للمشاركة في أحداث فرعية متعددة؛و (4) التسلسل الزمني بين الأحداث الفرعية.MASC أتمتة أجزاء من عملية إنشاء البرنامج النصي مع اقتراحات لأنواع الأحداث، والروابط إلى Wikidata، والأحداث الفرعية التي قد نسيانها.نوضح كيف تكون هذه الأوتوماتية مفيدة لكاتب البرنامج النصي مع عدد قليل من البرامج النصية دراسة الحالة.
تصف هذه الورقة شركة Tone Communication Global Co.، Ltd. لتقديم مهمة ترجمة الأخبار المشتركة WMT21.نشارك في ست اتجاهات: إنجليزي منادر إلى / من الهوسا، الهندية من / إلى / من البنغالية وزولو إلى / من Xhosa.أنظمتنا المقدمة غير مقيدة والتركيز على الترجمة م تعددة اللغات أوديل، الترجمة إلى الأمام.نحن نطبق أيضا قواعد ونموذج اللغة لتصفية أحكام أحادية الاتجاه والجمل الاصطناعية.
يتطلب نشر الترجمة الآلية الناجحة (MT) فهم ليس فقط الصفات الجوهرية لإخراج MT، مثل الطلاقة وكفاية، ولكن أيضا تصورات المستخدمين.يستجيب المستخدمون الذين لا يفهمون لغة المصدر إخراج MT بناء على تصورهم للحصول على احتمال أن يطابق معنى إخراج MT معنى النص المص در.نشير إلى ذلك باعتباره القدرة على الصيغة.قد يكون الإخراج غير القابل للصدق خارج المستخدمين، ولكن إخراج MT قابل للصدق مع معنى غير صحيح قد يضللها.في هذا العمل، ندرس علاقة المقابل بالطلاقة والكفااة من خلال تطبيق بروتوكولات التقييم المباشرة التقليدية التقليدية للتعليق على جميع الميزات الثلاثة على إخراج أنظمة MT العصبية.يوضح التحليل الكمي لهذه التعليقات التعليقات التوضيحية أن المعتقاة مرتبطة ارتباطا وثيقا من الطلاقة، ويقترح التحليل النوعي الأولي أن الميزات الدلالية قد حساب الفرق.
تعلم الترجمة الآلية العصبية متعددة اللغات (MNMT) ترجمة أزواج متعددة اللغات بنموذج واحد، يحتمل أن يحسن كل من الدقة وكفاءة الذاكرة للنماذج المنتشرة. ومع ذلك، فإن عدم اختلال البيانات الثقيلة بين اللغات يعوق النموذج من الأداء بشكل موحد عبر أزواج اللغة. ف ي هذه الورقة، نقترح هدفا تعليميا جديدا ل MNMT بناء على التحسين القوي التويضي، مما يقلل من الخسارة المتوقعة الأسوأ في مجموعة أزواج اللغة. نوضح كذلك كيفية تحسين هذا الهدف من الناحية العملية للترجمة الكبيرة باستخدام مخطط أفضل استجابة مزخرف، وهو فعاليتان فعالة وتتحمل تكلفة حسابية إضافية ضئيلة مقارنة بقليل المخاطر التجريبية القياسية. نقوم بإجراء تجارب مكثفة على ثلاث مجموعات من اللغات من مجموعة بيانات وتظهر أن طريقتنا تتفوق باستمرار على أساليب خطية قوية من حيث المتوسط ​​والأداء لكل لغة تحت كلا من إعدادات الترجمة متعددة إلى واحدة وواحدة متعددة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا