ترغب بنشر مسار تعليمي؟ اضغط هنا

آلة تصرف الترجمة

Machine Translation Believability

556   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتطلب نشر الترجمة الآلية الناجحة (MT) فهم ليس فقط الصفات الجوهرية لإخراج MT، مثل الطلاقة وكفاية، ولكن أيضا تصورات المستخدمين.يستجيب المستخدمون الذين لا يفهمون لغة المصدر إخراج MT بناء على تصورهم للحصول على احتمال أن يطابق معنى إخراج MT معنى النص المصدر.نشير إلى ذلك باعتباره القدرة على الصيغة.قد يكون الإخراج غير القابل للصدق خارج المستخدمين، ولكن إخراج MT قابل للصدق مع معنى غير صحيح قد يضللها.في هذا العمل، ندرس علاقة المقابل بالطلاقة والكفااة من خلال تطبيق بروتوكولات التقييم المباشرة التقليدية التقليدية للتعليق على جميع الميزات الثلاثة على إخراج أنظمة MT العصبية.يوضح التحليل الكمي لهذه التعليقات التعليقات التوضيحية أن المعتقاة مرتبطة ارتباطا وثيقا من الطلاقة، ويقترح التحليل النوعي الأولي أن الميزات الدلالية قد حساب الفرق.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم اقتراح العديد من المقاييس العصبية مقرا لها مؤخرا لتقييم جودة الترجمة الآلية. ومع ذلك، فإن كل منهم يلجأون إلى تقديرات نقطة، والتي توفر معلومات محدودة في مستوى القطاع. وهذا ما هو أسوأ لأنهم مدربون على الأحكام البشرية الصاخبة والتحازة والصحيحة، وغالب ا ما يؤدي إلى تنبؤات عالية الجودة. في هذه الورقة، نقدم تقييم MT على دراية عدم اليقين وتحليل الجدارة بالثقة للجودة المتوقعة. نحن نجمع بين إطار المذنب مع أساليب تقدير عدم اليقين، مونتي كارلو التسرب والكميمات العميقة، للحصول على درجات عالية الجودة إلى جانب فترات الثقة. نحن نقارن أداء أساليب تقييم MT على دراية بعملية عدم اليقين عبر أزواج متعددة اللغات من مجموعة بيانات QT21 ومهمة مقاييس WMT20، المعزز بالشروح MQM. نقوم بتجربة أعداد متفاوتة من المراجع وأكثر مناقشة فائدة تقدير الجودة على علم عدم اليقين (بدون مراجع) لإعلام أخطاء الترجمة الهامة المحتملة.
تصف هذه الورقة شركة Tone Communication Global Co.، Ltd. لتقديم مهمة ترجمة الأخبار المشتركة WMT21.نشارك في ست اتجاهات: إنجليزي منادر إلى / من الهوسا، الهندية من / إلى / من البنغالية وزولو إلى / من Xhosa.أنظمتنا المقدمة غير مقيدة والتركيز على الترجمة م تعددة اللغات أوديل، الترجمة إلى الأمام.نحن نطبق أيضا قواعد ونموذج اللغة لتصفية أحكام أحادية الاتجاه والجمل الاصطناعية.
تحسنت أداء أنظمة NMT بشكل كبير في السنوات القليلة الماضية ولكن ترجمة الكلمات متعددة الإحساس لا تزال تشكل تحديا. نظرا لأن حواس الكلمات ليست ممثلة بشكل موحد في الشركة الموازية المستخدمة للتدريب، فهناك استخدام مفرط من المعنى الأكثر شيوعا في إخراج MT. في هذا العمل، نقترح CMBT (الترجمة ذات الاحتياط بالسياقة)، ​​وهو نهج لتحسين ترجمة كلمة متعددة الشعور بالاستفادة من تمثيل الكلمات السياقية المتبادلة المدربة مسبقا (CCWRS). بسبب حساسية السياق الخاصة بهم وبياناتها السابقة للتدريب الكبيرة، يمكن ل CCWRS الوصول بسهولة إلى حواس الكلمات المفقودة أو نادرة جدا في ولاية فورانيا المستخدمة لتدريب MT. على وجه التحديد، تطبق CMBT تحريض معجم ثنائي اللغة على CCWRS الجمل المستهدفة ذات المحور المنطقي من مجموعة بيانات أحادية الأحادية، ثم يترجم هذه الجمل لإنشاء كورب موازية زائفة كبيانات تدريبية إضافية لنظام MT. نحن نختبر جودة الترجمة من الكلمات الغامضة على جناح اختبار المخاط المخاطي، والتي تم بناؤها لاختبار فعالية حذف كلمة معنى الكلمة لأنظمة MT. نظهر أن نظامنا يتحسن على ترجمة حواس كلمة متعددة الترددات الصعبة والثانية.
توضح هذه الورقة نظام Anvita-1.0 MT، Architeted for Survision To Wath2021 Multiindicmt Task من فريق Mcairt، حيث شارك الفريق في 20 اتجاهات ترجمة: الإنجليزية → Werc و Indic → الإنجليزية؛ تشدد مجموعة تشل من 10 لغات هندية. نظام Anvita-1.0 MT يتكون من نماذ ج NMT متعددة اللغات واحد للغة الإنجليزية → اتجاهات MEDISTION وغيرها من الإرشادات وغيرها من الإرشادات الإنجليزية مع فك التشفير المشترك، والتموين 10 أزواج اللغة والعشرون اتجاهي الترجمة. بنيت النماذج الأساسية بناء على بنية المحولات وتدريبها على Multiindicmt Wat 2021 Corpora وزيادة الترجمة والترجمة الترجمة والترجمة الخاصة بتزوير البيانات الانتقائية، وفرقة نموذجية لتحسين التعميم. بالإضافة إلى ذلك، تم تقطير Multiindicmt Wat 2021 Corpora باستخدام سلسلة من عمليات التصفية قبل طرح التدريب. anvita-1.0 حقق أعلى درجة AM-FM النتيجة للغة الإنجليزية → البنغالية، 2nd للغة الإنجليزية → التاميل و 3 للإنجليزية → الهندية، البنغالية → الإنجليزية الاتجاهات في مجموعة الاختبار الرسمية. بشكل عام، فإن الأداء الذي حققه Anvita للتشج ← اتجاهات إنجليزية أفضل نسبيا من أن الإنجليزي → اتجاهات MEDIAL لجميع أزواج اللغة 10 عند تقييمها باستخدام Bleu and Ribes، على الرغم من أن الاتجاه نفسه غير مريح باستمرار عند تقييم AM-FM نفذت. بالمقارنة مع Bleu، فإن RIBES و AM-FM تستند إلى أنفيتا أفضل نسبيا بين جميع المشاركين المهام.
تعلم الترجمة الآلية العصبية متعددة اللغات (MNMT) ترجمة أزواج متعددة اللغات بنموذج واحد، يحتمل أن يحسن كل من الدقة وكفاءة الذاكرة للنماذج المنتشرة. ومع ذلك، فإن عدم اختلال البيانات الثقيلة بين اللغات يعوق النموذج من الأداء بشكل موحد عبر أزواج اللغة. ف ي هذه الورقة، نقترح هدفا تعليميا جديدا ل MNMT بناء على التحسين القوي التويضي، مما يقلل من الخسارة المتوقعة الأسوأ في مجموعة أزواج اللغة. نوضح كذلك كيفية تحسين هذا الهدف من الناحية العملية للترجمة الكبيرة باستخدام مخطط أفضل استجابة مزخرف، وهو فعاليتان فعالة وتتحمل تكلفة حسابية إضافية ضئيلة مقارنة بقليل المخاطر التجريبية القياسية. نقوم بإجراء تجارب مكثفة على ثلاث مجموعات من اللغات من مجموعة بيانات وتظهر أن طريقتنا تتفوق باستمرار على أساليب خطية قوية من حيث المتوسط ​​والأداء لكل لغة تحت كلا من إعدادات الترجمة متعددة إلى واحدة وواحدة متعددة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا