ترغب بنشر مسار تعليمي؟ اضغط هنا

ترجمة غير تلقائية من خلال تعلم الرموز الفئوية المستهدفة

Non-Autoregressive Translation by Learning Target Categorical Codes

304   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

محول غير تلقائي هو نموذج توليد نص واعد.ومع ذلك، لا تزال النماذج الحالية غير التلقائية التي لا تزال تقف وراء نظرائها التلقائي في جودة الترجمة.نحن نعزو فجوة الدقة هذه إلى عدم وجود نمذجة التبعية بين مدخلات فك التشفير.في هذه الورقة، نقترح CNAT، والتي تتعلم الرموز الفئوية الضمنية بمثابة متغيرات كامنة في فك التشفير غير التشغيلي التشغيلي.إن التفاعل بين هذه الرموز الفئوية سيلم على التبعيات المفقودة ويحسن القدرة النموذجية.تظهر نتائج التجربة أن نموذجنا يحقق أداء قابلا أو أفضل في مهام الترجمة الآلية من العديد من خطوط الأساس القوية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعاني نماذج الترجمة الآلية العصبية غير التلقائية (NART) من مشكلة الوسائط المتعددة والتي تسبب عدم تناسق الترجمة مثل تكرار الرمز المميز. حاولت معظم الأساليب الأخيرة حل هذه المشكلة من خلال النمذجة الضمنية التبعيات بين المخرجات. في هذه الورقة، نقدم Align art، الذي يرفع معلومات المحاذاة الكاملة إلى تقليل طريقة التوزيع المستهدف بشكل صريح. تقسم AlignArt مهمة ترجمة الآلة في (1) تقدير المحاذاة و (2) الترجمة مع مدخلات فك تشفير محاذاة، توجيه وحدة فك التركيز للتركيز على الترجمة المبسطة الواحدة المبسطة. لتخفيف مشكلة تقدير المحاذاة، فإننا نقترح كذلك طريقة تحلل المحاذاة الجديدة. تظهر تجاربنا أن Alignart تفوق النماذج السابقة غير التكرارية التي تركز على تخفيض طريقة صريحة على WMT14 EN↔DE و WMT16 RO → EN. علاوة على ذلك، تحقق Alignart درجات بلو مماثلة لتلك النماذج القائمة على التصنيف الزمني للدولة من الفنون على WMT14 En↔de. نلاحظ أيضا أن Alignart يعالج بشكل فعال مشكلة تكرار الرمز المميز حتى دون تقطير المعرفة على مستوى التسلسل.
حققت الترجمة الآلية العصبية غير التلقائية، التي تتحلل الاعتماد على الرموز المستهدفة السابقة من مدخلات وحدة فك التشفير، تسريع استنتاج مثير للإعجاب ولكن بتكلفة الدقة السفلى. Works السابق توظف فك تشفير تكريري لتحسين الترجمة عن طريق تطبيق تكرارات تحسين م تعددة. ومع ذلك، فإن العيب الخطير هو أن هذه الأساليب تعرض الضعف الخطير في الاعتراف بقطع الترجمة الخاطئة. في هذه الورقة، نقترح بنية المعمارية المسماة rewritenat للتعلم صراحة إعادة كتابة قطع الترجمة الخاطئة. على وجه التحديد، يستخدم ReWritEnat وحدة تحديد المواقع لتحديد موقع تلك الخاطئة، والتي يتم تنقيحها بعد ذلك في الوحدة النمطية الصحيحة. نحو الحفاظ على اتساق توزيع البيانات مع فك التشفير التكراري، يتم استخدام استراتيجية تدريبية تكرارية لزيادة تحسين قدرة إعادة كتابة. تظهر تجارب واسعة أجريت على العديد من المعايير المستخدمة على نطاق واسع أن إعادة البيع يمكن أن تحقق أداء أفضل مع تقليل وقت فك التشفير بشكل كبير، مقارنة باستراتيجيات فك التشفير السابقة السابقة. على وجه الخصوص، يمكن إعادة كتابة النتائج التنافسية مع الترجمة التلقائية على معايير الترجمة AutoreGressive على معايير الترجمة WMT14 EN-DE، EN-FR و WMT16 RO-en.
أظهرت نماذج الترجمة الآلية غير التلقائية (NAT) تسريعا كبيرا للاستدلال، لكنها تعاني من دقة ترجمة أدنى. الممارسة الشائعة لمعالجة المشكلة هي نقل الترجمة الآلية التلقائي (في) معرفة نماذج NAT، على سبيل المثال، مع تقطير المعرفة. في هذا العمل، نحن نفترض وال تحقق تجريبيا من أن ترميز اللوائح في و NAT التقاط خصائص لغوية مختلفة من الجمل المصدر. لذلك، نقترح اعتماد التعلم متعدد المهام لنقل المعرفة إلى نماذج NAT من خلال تقاسم التشفير. على وجه التحديد، نأخذ النموذج في المهمة المساعدة لتعزيز أداء نموذج NAT. تظهر النتائج التجريبية على مجموعات بيانات WMT14 EN-DE و WMT16 EN-RO أن المهمة المتعددة المقترحة NAT تحقق تحسينات كبيرة على نماذج الأساس NAT. علاوة على ذلك، تؤكد الأداء الموجود على مجموعات بيانات WMT19 و WMT20 و WMT20 واسعة النطاق اتساق طريقةنا المقترحة. بالإضافة إلى ذلك، توضح النتائج التجريبية أن لدينا NAT متعددة المهام لدينا مكملة لتقطير المعرفة، وسيلة نقل المعرفة القياسية لل NAT.
نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط ول VAD، ويمكن أن تصنف في وقت واحد فئات العاطفة وتتنبؤ بعشرات VAD للحصول على عقوبة معينة. نحن نستخدم Roberta-Large Roberta المدربة مسبقا على ثلاثة كوربورا مختلفة مع ملصقات واضحة وتقييم على Emobank Corpus مع درجات VAD. نظهر أن نهجنا يصل إلى أداء قابلا للمقارنة مع وجود أحدث من المصنفات في تصنيف العاطفة الفئوية ويظهر ارتباطا إيجابيا كبيرا مع درجات فاد للحقيقة الأرضية. أيضا، يؤدي المزيد من التدريب مع الإشراف على تسميات VAD إلى تحسين الأداء خاصة عندما تكون مجموعة البيانات الصغيرة. نقدم أيضا أمثلة على تنبؤات كلمات العاطفة المناسبة التي ليست جزءا من التعليقات التوضيحية الأصلية.
نحن نعتبر مشكلة تعلم إصلاح برامج ج خاطئة عن طريق تعلم المحاذاة المثلى مع البرامج الصحيحة. نظرا لأن الأساليب السابقة إصلاح خطأ واحد في السطر، فمن المحتمل أنه لا مفر منه لتكرار عملية التثبيت حتى لا تبقى أخطاء. في هذا العمل، نقترح إطارا تعليمي تسلسل تسل سل جديد لتحديد أخطاء برنامج متعددة في وقت واحد. نقدم نهج وضع العلامات على البيانات المسافة من المسافة لتصحيح خطأ البرنامج. بدلا من وصف مثال إصلاح البرنامج عن طريق إقران برنامج خاطئ مع إصلاح خط، نعلم المثال عن طريق تحديد برنامج خاطئ مع محاذاة مثالية إلى البرنامج الصحيح المقابل الناتج عن حساب التحرير المسافة. نقيم نهجنا المقترح في مجموعة بيانات متاحة للجمهور (Deepfix DataSet) التي تتكون من برامج C الخاطئة المقدمة من طلاب البرمجة المبتدئين. على مجموعة من 6،975 برنامجا خاطئا من بيانات DataSet Deepfix، فإن نهجنا يحقق النتيجة الحديثة من حيث معدل الإصلاح الكامل على DeepFix DataSet (بدون بيانات إضافية مثل رسالة خطأ التحويل البرمجي أو رموز مصدر إضافية مسبقا -تمرين).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا