ترغب بنشر مسار تعليمي؟ اضغط هنا

مثل الطباشير والجبن؟في آثار الترجمة في تدريب MT

Like Chalk and Cheese? On the Effects of Translationese in MT Training

354   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نؤيد موضوع اتجاه الترجمة في البيانات المستخدمة لتدريب أنظمة الترجمة الآلية العصبية والتركيز على سيناريو في العالم الحقيقي مع اتجاه الترجمة المعروفة والاختلالات في اتجاه الترجمة: هانزارد الكندي.وفقا للمقاييس التلقائية ونحن نلاحظ أنه باستخدام البيانات الموازية التي تم إنتاجها في "اتجاه الترجمة" المطابقة (الهدف الأصيل والترجمة) يحسن جودة الترجمة.في حالات عدم توازن البيانات من حيث اتجاه الترجمة ونتجد أن وضع العلامات على اتجاه الترجمة يمكن إغلاق فجوة الأداء.نقوم بإجراء تقييم بشري يختلف قليلا عن المقاييس التلقائية، لكنه يؤكد ذلك على هذه البيانات الفرنسية الإنجليزية المعروفة لاحتواء ترجمات عالية الجودة ومصدر مختلط أصيل أو مختار على تحسين المصدر المرتبط بالترجمة للتدريب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يصف هذا العمل تحليل طبيعة وأسباب أخطاء MT التي لوحظها مقيمين مختلفين بموجب إرشادات لمعايير الجودة المختلفة: كفاية والفهم وعدم تحديد خليط عام من كفايته والطلاقة.نبلغ عن نتائج ثلاثة أزواج لغوية ومجالات ونظم من طراز MT.تشير النتائج الخاصة بنا إلى أنه وع لى الرغم من حقيقة أن بعض الظواهر المحددة تعتمد على المجال و / أو اللغة ويمكن اعتبار مجموعة الظواهر التالية تحديا عموما لأنظمة MT الحديثة: إعادة صياغة مجموعات الكلمات والترجمة للكلمات المصدر الغامضة والترجمةعبارات الاسم والأحساس.علاوة على ذلك، نوضح أن معيار الجودة له تأثير على تصور الخطأ.تشير النتائج الخاصة بنا إلى أن الفهم والكفايات يمكن تقييمها في وقت واحد من قبل مقيمين مختلفين، وبذلك بحيث الفهم وكمعيار جودة مهم ويمكن إدراجه في كثير من الأحيان في التقييمات البشرية.
اللغة هي السياق مثل المعاني من الكلمات تعتمد على سياقاتها.السياق هو، من المفهوم المحدد جيدا في ميكانيكا الكم حيث يعتبر موردا كبيرا لحسابات الكمومية.نحن نحقق في ما إذا كانت اللغة الطبيعية تعرض أي من الميزات السياقية الميكانيكية الكمومية.نظير على أنه ي مكن تصميم مجموعات المعنى في عبارات غامضة في الإطار النظري للحز في السياق الكمومي، حيث يمكن أن تصبح حيازة حيازة.باستخدام إطار عمل السياق من قبل الافتراضي (CBD)، نستكشف المتغيرات الاحتمالية لهذه وإظهار أن سياق CBD هو ممكن أيضا.
في هذه الورقة، نقدم النظم المقدمة من فريقنا من معهد تكنولوجيا المعلومات والاتصالات (HIGH-VD / HES-SO) إلى مهمة MT غير الخاضعة للرقابة والموارد منخفضة للغاية.ندرس أولا التحسينات التي جلبت إلى نظام أساسي من خلال تقنيات مثل الترجمة الخلفي والتهيئة من نم وذج الوالدين.نجد أن كلتا التقنيتين مفيدة وكافية للوصول إلى الأداء الذي يقارن مع أنظمة أكثر تطورا من مهمة 2020.بعد ذلك، نقدم تطبيق هذا النظام إلى مهمة 2021 للمزيد من الأغراض السربية العلوي تحت الإشراف (HSB) إلى الترجمة الألمانية، في كلا الاتجاهين.أخيرا، نقدم نظاما نظعا ل HSB-DE في كلا الاتجاهين، وللترجمة الألمانية غير الخاضعة للرقابة إلى أسفل ترجمة Sorbian (DSB)، والتي تستخدم التدريب المتعدد المهام مع مختلف جداول التدريب لتحسين الخط الأساسي.
نقدم نتائج المهام المشتركة WMT2021 في MT غير المنضدة والموارد منخفضة للغاية.في هذه المهمة، درس المجتمع ترجمة الموارد المنخفضة جدا بين اللغة الألمانية والصربية العليا، والترجمة غير المنخفضة بين الترجمة من اللغة الألمانية والسوربية والمنخفضة الموارد بي ن الروسية والجواد، وجميع لغات الأقليات مع المجتمعات اللغوية النشطة تعمل على الحفاظ على اللغات، والذين هم شركاء فيالتقييم.شكرا بذلك، تمكنا من الحصول على معظم البيانات الرقمية المتاحة لهذه اللغات وتقديمها للمشاركين في المهام.في المجموع، شارك ست فرق في المهمة المشتركة.تناقش الورقة الخلفية، وتعرض المهام والنتائج، ويناقش أفضل الممارسات للمستقبل.
نماذج لغة محول كبيرة مدربة مسبقا، والتي تكون منتشرة في مهام معالجة اللغة الطبيعية، تكون مكلفة للغاية للتدريب. لتقليل تكلفة التدريب هذه النماذج الكبيرة، طورت العمل السابق طرزا أصغر وأكثر ضغطا تحقق تسريعا كبيرا في وقت التدريب مع الحفاظ على دقة تنافسية للنموذج الأصلي على مهام المصب. على الرغم من أن هذه النماذج الصغيرة المدربة مسبقا تم اعتمادها على نطاق واسع من قبل المجتمع، إلا أنه ليس معروفا مدى جودة معايرة مقارنة بنظيراتهم الأكبر. في هذه الورقة، مع التركيز على مجموعة واسعة من المهام، يمكننا التحقيق بدقة في خصائص المعايرة للمحولات المدربين مسبقا، كدالة لحجمها. نوضح أنه عند تقييم النماذج داخل المجال، تكون النماذج الصغيرة قادرة على تحقيق معايرة تنافسية وغالبا ما تكون أفضل، مقارنة بالنماذج الكبيرة، مع تحقيق تسريع كبير في وقت التدريب. تقنيات المعايرة بعد المخصص تقلل من خطأ المعايرة لجميع النماذج في المجال. ومع ذلك، عند تقييم النماذج الكبيرة التي تم تقييمها، تميل النماذج الكبيرة إلى أن تكون معايرة أفضل، وتعويض التسمية بدلا من ذلك استراتيجية فعالة لمعايرة النماذج في هذا الإعداد.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا