ترغب بنشر مسار تعليمي؟ اضغط هنا

اثنين من رؤساء هي أفضل من واحدة؟التحقق من تأثير الفرقة في الترجمة الآلية العصبية

Two Heads are Better than One? Verification of Ensemble Effect in Neural Machine Translation

166   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في مجال معالجة اللغة الطبيعية، من المعروف أن الكفارات فعالة في تحسين الأداء.تحلل هذه الورقة كيف تؤثر فرقة نماذج الترجمة الآلية العصبية (NMT) على تحسين الأداء من خلال تصميم مختلف الإعدادات التجريبية (I.E.، Intra-، Inter-Ertern-Erbergble، وغير غير التقاعد).لفحص متعمق، نقوم بتحليل كل طريقة فرقة فيما يتعلق بالعديد من جوانب مثل نماذج الاهتمام المختلفة واستراتيجيات VOCAB.تظهر النتائج التجريبية أن الكوغرات لا يؤدي دائما إلى زيادة الأداء وتقديم النتائج السلبية الجديرة بالملاحظة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يقدم هذا العمل مجموعة متنوعة بسيطة لتقييم جودة الترجمة الآلية بناء على مجموعة من الرواية ومقاييس ثابتة.نقيم الفرقة باستخدام ارتباط لعشرات MQM القائم على الخبراء ورشة عمل WMT 2021 المقاييس.في كل من إعدادات المونولينغوية والصفرية القصيرة، نعرض تحسنا كب يرا في الأداء على مقاييس واحدة.في الإعدادات المتبادلة، نوضح أيضا أن نهج الفرع ينطبق جيدا على اللغات غير المرئية.علاوة على ذلك، نحدد خط أساس قوي خال من المرجعية التي تتفوق باستمرار على تدابير بلو واستخدامها بشكل شائع وتحسين أداء فرقنا بشكل كبير.
في هذا العمل، ندرس الهلوسة في الترجمة الآلية العصبية (NMT)، والتي تكمن في نهاية متطرفة على طيف أمراض NMT.أولا، نربط ظاهرة الهلوسة تحت اضطراب المصدر إلى النظرية الطويلة للذيل من فيلدمان، وتقديم فرضية صحيحة تجريبية تشرح الهلوسة تحت اضطرابات المصدر.ثاني ا، نفكر في الهلوسة بموجب الضوضاء على مستوى Corpus (بدون أي اضطراب مصدر) وإظهار أن هناك نوعين بارزين من الهلوسة الطبيعية (النواتج المنفجرة والتذمر) يمكن أن يتم توليدها وشرحها من خلال أنماط ضوضاء ذات مستوى كوربوس معين.أخيرا، نوضح ظاهرة التضخيم الهلوسي في عمليات توليد البيانات الشعبية مثل تقطير المعارف على مستوى البيانات والتسلسل.لقد أصدرنا مجموعات البيانات والرمز لتكرار نتائجنا.
نحن ندرس مشكلة تكيف المجال في الترجمة الآلية العصبية (NMT) عند مشاركة البيانات الخاصة بالمجال بسبب سرية أو مشكلات حقوق النشر.كخطوة أولى، نقترح بيانات الشظية في أزواج العبارة واستخدام عينة عشوائية لحن نموذج NMT عام بدلا من الجمل الكاملة.على الرغم من ف قدان شرائح طويلة من أجل حماية السرية، نجد أن جودة NMT يمكن أن تستفيد كثيرا من هذا التكيف، وأنه يمكن الحصول على مزيد من المكاسب مع تقنية علامات بسيطة.
يهدف مشروع Multitrainmt Erasmus + + إلى تطوير منهج مبتكر مفتوح في الترجمة الآلية العصبية (NMT) للمتعلمين اللغوي والمترجمين كمواطنين متعدد اللغات.ينظر إلى الترجمة الآلية كمورد يمكن أن يدعم المواطنين في محاولتهم للحصول على المهارات اللغوية وتطويرها إذا تم تدريبهم بطريقة مستنيرة وحاسمة.وبالتالي يمكن أن تساعد الترجمة الآلية في معالجة عدم التطابق بين الاتحاد الأوروبي المطلوب من وجود مواطنين متعدد اللغات الذين يتحدثان لغتين أجنبية على الأقل والوضع الحالي الذي يسقط المواطنون بشكل عام هذا الهدف عموما.تتكون المواد التدريبية من كتاب سيارات مفتوح، وهو تطبيق ويب مفتوح المصدر يسمى Mutnmt لأغراض التدريب، والأنشطة المقابلة.
تحتاج أنظمة الإنتاج NMT عادة إلى خدمة مجالات المتخصصة التي لا تغطيها كوربيا كبيرة ومتاحة بسهولة بشكل مناسب.ونتيجة لذلك، غالبا ما يكون الممارسون نماذج غرضا عاما نماذج عامة على كل من المجالات التي يلبيها منظمةها.ومع ذلك، يمكن أن يصبح عدد المجالات كبيرا ، مما يتجمع مع عدد اللغات التي تحتاج إلى خدمة يمكن أن تؤدي إلى وضع أسطول غير قابل للحل من النماذج والمحافظة عليها.نقترح علامات متعددة الأبعاد، وهي طريقة لضبط نموذج NMT واحد على عدة مجالات في وقت واحد، وبالتالي تقليل تكاليف التطوير والصيانة بشكل كبير.نحن ندير تجارب حيث يقارن نموذج واحد MDT بشكل إيجابي لمجموعة من نماذج SOTA متخصصة، حتى عند تقييمها على المجال كانت تلك الأساس التي تم ضبطها بشكل جيد.إلى جانب بلو، نبلغ عن نتائج التقييم البشري.تعيش نماذج MDT الآن في Booking.com، مما يؤدي إلى تشغيل محرك MT الذي يخدم ملايين الترجمات يوميا في أكثر من 40 لغة مختلفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا