ترغب بنشر مسار تعليمي؟ اضغط هنا

مخطط التقييم الترجمة التركيزية للبيانية المعدلة جزئيا

Evaluation Scheme of Focal Translation for Japanese Partially Amended Statutes

193   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لتحديث ترجمات النظام الأساسي الياباني بناء على تعديلاتهم، نحتاج إلى النظر في الترجمة؛ "وهذا هو، يجب علينا فقط تعديل التعبيرات ذات الصلة بالتعديل والاحتفاظ بالآخرين لتجنب سوء فهم محتوياتها. في هذه الورقة، نقدم تقييما تقييما وجزعة لتحسين تقييمات التركيز. يسمى Metric لدينا درجة شاملة للترجمة التفاضلية: (ISDIT). يتكون ISDIT من عاملين: (1) يتذكر N-Gram التعبيرات التي تتأثر بتعديلها و (2) الدقة N-Gram للمخرجات مقارنة بالرجوع إليها. يحل هذه المترية محل واحد موجود للهوية من خلال حساب جودة الترجمة في وقت واحد من التعبيرات التي تم تغييرها بالإضافة إلى ذلك من التعبيرات دون تغيير. كما نصدر حديثا على تجميع وجزعة للترجمة اليابانية للتعديل جزئيا تؤمن الترجمات بعد التعديل، في حين أن كوربوس التقييم الحالي لا. مع متري والجوربوس، ندرس أداء طرق الترجمة الحالية لترجمات التعديل الجزئي الياباني.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

البرامج النصية - تسلسل الأحداث النموذجية التي تصف الأنشطة اليومية - تساعد في فهم الروايات من خلال توفير التوقعات، وحل الغموض، وملء المعلومات غير المستحقة. ومع ذلك، حتى الآن أثبتوا صعوبة في المؤلف أو استخراج النص. في هذا العمل، نوضح لأول مرة يمكن تصوي ر نماذج اللغات العصبية المدربة مسبقا لتوليد البرامج النصية عالية الجودة، في مستويات مختلفة من الحبيبية، لمجموعة واسعة من السيناريوهات اليومية (E.G.، خبز كعكة). للقيام بذلك، نقوم بجمع Growdsourced كبيرة (6.4K) من البرامج النصية التي أمرت جزئيا (المسمى المحترفات)، وهي أكبر بكثير من مجموعات البيانات السابقة، وتطوير النماذج التي تولد البرامج النصية من خلال الجمع بين توليد اللغة والتنبؤ بنية الرسم البياني. نحدد اثنين من المهام التكميلية: (1) التنبؤ الحافة: بالنظر إلى السيناريو والأحداث غير المدرجة، قم بتنظيم الأحداث في البرنامج النصي ساري المفعول (ربما بالترتيب الجزئي)، و (2) جيل البرنامج النصي: معطى سيناريو فقط، توليد الأحداث وتنظيمها في البرنامج النصي (ربما النظام الجزئي). تظهر تجاربنا أن نماذجنا تؤدي جيدا (على سبيل المثال، F1 = 75.7 في المهمة (1))، مما يوضح نهجا جديدا للتغلب على الحواجز السابقة أمام جمع البرنامج النصي. نظهر أيضا أنه لا يزال هناك مجال مهم للتحسين نحو أداء مستوى الإنسان. معا، توفر المهام الخاصة بنا ومجموعة البيانات والنماذج اتجاها بحثا جديدا لتعلم معرفة البرنامج النصي.
نحن نستخدم مجموعة اختبار شبه آلية من أجل توفير تقييم لغوي محمول من أجل أنظمة الترجمة الآلية الحديثة. يشمل التقييم 18 الألمانية إلى الإنجليزية و 18 الإنجليزية إلى الألمانية، قدمت إلى مهمة مشتركة للترجمة بمؤتمر 2021 حول الترجمة الآلية. يضيف تقديمنا إلى إعدادات السنوات السابقة عن طريق إنشاء وتطبيق جناح اختبار واسع النطاق للغة الإنجليزية إلى الألمانية كزوج لغة جديدة. يسمح التقييم الراسخ في اكتشاف اختلافات كبيرة بين الأنظمة التي لا يمكن تمييزها من خلال التقييم المباشر لحملة التقييم البشرية. نجد أن معظم الأنظمة تحقق عقوبة جيدة في غالبية الظواهر اللغوية ولكن هناك عدد قليل من الظواهر مع دقة منخفضة، مثل التعابير، والمطبقة مشروط والمسندات الألمانية الناتجة. نظمتين تتمتعان بدقة اختبار أفضل بكثير في المتوسط ​​في المتوسط ​​الكلي في كل اتجاه لغة، عبر الإنترنت-W و Facebook-AI للألمانية إلى الإنجليزية والمرافقين وبرنامج Volctrans وعلى الإنترنت-W للإنجليزية إلى الألمانية. تظهر الأنظمة تحسنا مطردا مقارنة بالسنوات السابقة.
الملخص ندرس التعلم التعرف على الكيان المسمى في وجود التعليقات التوضيحية في الكيان المفقود.نحن نقترب من هذا الإعداد باسم وضع علامات مع المتغيرات الكامنة واقتراح خسارة جديدة، ونسبة الكيان المتوقعة، لتعلم النماذج بحضور العلامات المفقودة بشكل منهجي.نظرا لأن نهجنا صوتي من الناحية النظرية ومفيدة تجريبيا.تجريفيا، نجد أنه يجتمع أو يتجاوز أداء خطوط أساس قوية وحديثة من بين الفنون عبر مجموعة متنوعة من اللغات والسيناريوهات التوضيحية ومبالغ البيانات المسمى.على وجه الخصوص، نجد أنه يتفوق بشكل كبير على الطرق السابقة من الأساليب السابقة من Mayhew et al.(2019) ولي وآخرون.(2021) بواسطة +12.7 و +2.3 F1 النتيجة في بيئة صعبة مع فقط 1000 عرض توضيحية متحيزة، بلغ متوسطها عبر 7 مجموعات من مجموعات البيانات.نظهر أيضا أنه عندما يقترن نهجنا، فإن مخطط التعليق التوضيحي رواية متفوقة تفوق التعليق التوضيحي الشامل لميزانيات التوضيحية المتواضعة
تم تقييم الترجمة الآلية (MT) حاليا بأحد طريقتين: بطريقة أحادية الأجل، بالمقارنة مع إخراج النظام إلى ترجمات مرجعية بشرية واحدة أو أكثر، أو في أزياء تقاطعات مدربة، من خلال بناء نموذج إشرافي للتنبؤ بعشرات الجودة من البيانات ذات العلامات على الإنسان. في هذه الورقة، نقترح بديل أكثر فعالية من حيث التكلفة، ومع ذلك أدائين جيدا من حيث التكلفة، والاعتماد على كلمة متعددة المحاكمات متعددة اللغات وتمثيلات الجملة، ونحن نقارن مباشرة المصدر مع الجملة ترجمت الآلة، وبالتالي تجنب الحاجة إلى كل من الترجمات المرجعية والمسمى بيانات التدريب. يعتمد المقياس على النهج القائم على أحدث الولاية - وهي مسافة BertScore و Word Mover - من خلال دمج فكرة التشابه الدلالي الحكم. من خلال القيام بذلك، فإنه يحقق ارتباطا أفضل مع درجات بشرية على مجموعات بيانات مختلفة. نظظ أنه يتفوق على هذه المقاييس وغيرها من المقاييس الأخرى في إعداد أحادي الأحادي القياسي (الترجمة المرجعية MT)، كما هو الحال في إعداد ثنائي اللغة المصدر - MT، حيث تنفذ على قدم المساواة مع نهج المربع الزجاجي لتقدير الجودة التي تعتمد على نموذج MT معلومة.
يقدم هذا العمل مجموعة متنوعة بسيطة لتقييم جودة الترجمة الآلية بناء على مجموعة من الرواية ومقاييس ثابتة.نقيم الفرقة باستخدام ارتباط لعشرات MQM القائم على الخبراء ورشة عمل WMT 2021 المقاييس.في كل من إعدادات المونولينغوية والصفرية القصيرة، نعرض تحسنا كب يرا في الأداء على مقاييس واحدة.في الإعدادات المتبادلة، نوضح أيضا أن نهج الفرع ينطبق جيدا على اللغات غير المرئية.علاوة على ذلك، نحدد خط أساس قوي خال من المرجعية التي تتفوق باستمرار على تدابير بلو واستخدامها بشكل شائع وتحسين أداء فرقنا بشكل كبير.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا