ترغب بنشر مسار تعليمي؟ اضغط هنا

الترجمة الآلة العصبية في وقت واحد مع التنبؤ التسمية التأسيسي

Simultaneous Neural Machine Translation with Constituent Label Prediction

170   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الترجمة المتزامنة هي مهمة تبدأ فيها الترجمة قبل انتهاء المتكلم من التحدث، لذلك من المهم أن تقرر متى تبدأ عملية الترجمة.ومع ذلك، فإن اتخاذ قرار بشأن قراءة المزيد من كلمات الإدخال أو بدء الترجمة من الصعب على أزواج اللغة مع أوامر كلمة مختلفة مثل اللغة الإنجليزية واليابانية.بدافع من مفهوم إعادة ترتيب المسبق، نقترح بضع قواعد قرارات بسيطة باستخدام تسمية التأسيس التالي المتوقع من خلال التنبؤ التسمي التأسيسي التدريجي.في تجارب على الترجمة الفورية الإنجليزية إلى اليابانية، الطريقة المقترحة تفوق خطوط الأساس في مفاضلة جودة الكمون.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في الترجمة الآلية المتزامنة، والعثور على وكيل مع تسلسل العمل الأمثل للقراءة والكتابة التي تحتفظ بمستوى عال من جودة الترجمة مع التقليل من التأخر المتوسط ​​في إنتاج الرموز المستهدفة لا يزال مشكلة صعبة للغاية. نقترح نهج تعليمي تحت إشراف رواية لتدريب وكي ل يمكنه اكتشاف الحد الأدنى لعدد القراءة المطلوبة لتوليد كل رمزية مستهدفة من خلال مقارنة الترجمات المتزامنة ضد ترجمات الجملة الكاملة أثناء التدريب لإنشاء تسلسل عمل أوراكل. يمكن بعد ذلك استخدام تسلسل أوراكل هذه لتدريب نموذج إشراف لتوليد العمل في وقت الاستدلال. يوفر نهجنا بديلا عن طرق التشكيل الحالية في الترجمة المتزامنة من خلال تقديم هدف تدريب جديد، وهو أمر أسهل للتدريب من المحاولات السابقة في تدريب الوكيل باستخدام تقنيات تعليم التعزيز لهذه المهمة. تظهر نتائجنا التجريبية أن طريقة التدريب الجديدة لتوليد العمل تنتج ترجمات عالية الجودة مع تقليل التأخر المتوسط ​​في الترجمة الفورية.
في وضع الترجمة في الوقت الحقيقي للترجمة في الوقت الفعلي، تبدأ نماذج الترجمة الآلية العصبية (NMT) بتوليد الرموز الرموز اللغوية المستهدفة من جمل لغة مصدر غير كاملة وجعلها أكثر صعوبة في ترجمة وجودة الترجمة السيئة. أظهرت الأبحاث السابقة أن NMT على مستوى الوثيقة وتشمل الجملة والترميز السياق والكشف عن السياق من الجمل المجاورة ويساعد على تحسين جودة الترجمة. في إعدادات الترجمة المتزامنة، يجب أن يكون السياق من الجمل السابقة أكثر أهمية. تحقيقا لهذه الغاية وفي هذه الورقة، نقترح NMT على مستوى الوثيقة المتزامنة للانتظار حيث نحتفظ بمثابة تشفير السياق كما هو الحال واستبدال تشفير جملة المصدر ومكتشف اللغة المستهدف مع ما يعادله. نقوم بتجربة إعدادات الموارد المنخفضة والعالية باستخدام ALT و OPENSUBTITLES2018 Corpora وأين لاحظنا تحسينات طفيفة في جودة الترجمة. بعد ذلك إجراء تحليل للترجمات التي تم الحصول عليها باستخدام نماذجنا من خلال التركيز على الجمل التي يجب أن تستفيد من السياق حيث اكتشفنا أن النموذج يفعل وفي الواقع والاستفادة من السياق ولكنه غير قادر على الاستفادة من ذلك بشكل فعال وخاصة في انخفاض إعداد الموارد. هذا يدل على أن هناك حاجة لمزيد من الابتكار في طريقة تحديد السياق المفيد والاستفادة منها.
تقدم الورقة تجارب في الترجمة الآلية العصبية مع القيود المعجمية في لغة غنية مورمية.على وجه الخصوص، نقدم طريقة واستنادا إلى فك التشفير المقيد والتي تتعامل مع الأشكال المصدرة للإدخالات المعجمية ولا تتطلب أي تعديل بيانات التدريب أو الهندسة المعمارية النم وذجية.لتقييم فعاليتها ونقوم بإجراء تجارب في سيناريوهات مختلفة: عام ومخصص خاص.قارنا طريقنا مع ترجمة خط الأساس، وهي ترجمة بدون قيود معجمية ومن حيث سرعة الترجمة وجودة الترجمة.لتقييم مدى جودة معالجة القيود ونقترح مقاييس تقييم جديدة تأخذ في الاعتبار وجود وتنسيب وازدواجية وصحة الانهيار المصطلحات المعجمية في جملة الإخراج.
تعتمد الترجمة الآلية عادة على Corpora الموازي لتوفير إشارات متوازية للتدريب.جلبت ظهور الترجمة الآلية غير المنشورة ترجمة آلة بعيدا عن هذا الاعتماد، على الرغم من أن الأداء لا يزال يتخلف عن الترجمة التقليدية للإشراف الآلية.في الترجمة الآلية غير المنشورة ، يسعى النموذج إلى أوجه تشابه لغة متماثلة كمصدر للإشارة الموازية الضعيفة لتحقيق الترجمة.إن نظرية تشومسكي العالمي النجمية تفترض أن القواعد هي شكل فطري من المعرفة للبشر ويحكمها المبادئ والقيود العالمية.لذلك، في هذه الورقة، نسعى إلى الاستفادة من هذه الأدلة القواعد المشتركة لتوفير إشارات متوازية لغة أكثر صراحة لتعزيز تدريب نماذج الترجمة الآلية غير المنشورة.من خلال تجارب على أزواج لغة متعددة النموذجية، نوضح فعالية مناهجنا المقترحة.
تعرض نهج الترجمة الآلية العصبية (NMT) التي توظف بيانات أحادية الأحادية تحسينات ثابتة في الظروف الغنية بالموارد. ومع ذلك، فإن التقييمات باستخدام لغات العالم الحقيقي LowResource لا تزال تؤدي إلى أداء غير مرضي. يقترح هذا العمل نهج نمذجة Zeroshot NMT NMT NMT يتعلم بدون افتراض لغة محورية الآن بتقاسم البيانات الموازية مع المصدر الصفر واللغات المستهدفة. يعتمد نهجنا على ثلاث مراحل: التهيئة من أي نموذج NMT المدرب مسبقا مراقبة اللغة المستهدفة على الأقل، وتعزيز جوانب المصدر التي تستفيد من بيانات الأحادية المستهدفة، وتعلم تحسين النموذج الأولي إلى زوج الطلقة الصفرية، حيث الأخيران تشكل دورة selflearyling. تظهر النتائج التجريبية التي تنطوي على أربعة متنوعة (من حيث أسرة اللغة، البرنامج النصي ورابطتها) أزواج صفرية بالرصاص فعالية نهجنا مع ما يصل إلى +5.93 لتحسين بلو على خط الأساس ثنائي اللغة الخاضع للإشراف. بالمقارنة مع NMT غير المدعومة، يلاحظ التحسينات المستمرة حتى في إعداد عدم تطابق المجال، مما يدل على قابلية استخدام طريقتنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا