ترغب بنشر مسار تعليمي؟ اضغط هنا

وظيفة المسرد في الترجمة الآلية التجارية: هل يساعد؟الخطوة الأولى لتحديد أفضل الممارسات لمزود خدمة اللغة

Glossary functionality in commercial machine translation: does it help? A first step to identify best practices for a language service provider

281   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في الآونة الأخيرة، بدأ عدد من مقدمي الترجمة الآلات التجارية (MT) تقديم ميزات مسرد يسمح للمستخدمين بتنفيذ المصطلحات في إخراج نموذج عام. ومع ذلك، على حد علمنا، ليس من الواضح كيف ستؤثر هذه الميزات على دقة المصطلحات والنوعية الشاملة للإخراج. تهدف المساهمة الحالية إلى توفير نظرة أولية في أداء النماذج العامة المحسنة المسرد التي تقدمها أربعة مقدمي خدمات. تنطوي اختباراتنا على اثنين من المجالات المختلفة وأزواج اللغات، I.E.STSSWEAR EN - FR ومعدات صناعية DE - EN. سيتم تقييم إخراج كل طراز عام وعلى Glossaryenenhanced One الاعتماد على معدل خطأ الترجمة (TER) لمراعاة جودة الإخراج الإجمالية وعلى الدقة لتقييم الامتثال لمصطلان المسرد. يتبع ذلك تقييم يدوي. تركز المساهمة الحالية أساسا على فهم كيفية استغلال ميزات المسرد هذه بشكل مثمر من قبل مقدمي خدمات اللغة (LSPs)، وخاصة في سيناريو يتوفر فيه مشرق العميل بالفعل ويضاف إلى النموذج العام كما هو.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقدم رؤية تجاه إنشاء منصة مالطا لتكنولوجيا اللغات الوطنية؛جهد مستمر يهدف إلى توفير أساس لتعزيز اللغات الرسمية في مالطا، أي المالطية والإنجليزية، باستخدام الترجمة الآلية.سيؤدي ذلك إلى المساهمة في تحسين دعم تكنولوجيا اللغة الحالية لغوية لغة الموارد المنخفضة المالطية، عبر حقول اللغويات الحسابية المتعددة، مثل معالجة الكلام والترجمة الآلية وتحليل النصوص ومصادر متعددة الوسائط.تتمثل الأهداف النهائية في إزالة الحواجز اللغوية، وزيادة إمكانية الوصول، وتعزيز الخدمات عبر الحدود، والأهم من ذلك لتسهيل الحفاظ على اللغة المالطية.
في هذا العمل، تم تطوير وتقييم وتقييم أنظمة الترجمة الآلية العصبيةين كجزء من BILIRECTIONAL TAMIL-TELUGU Transmation Language Translation Transke Subtask في WMT21. تم استخدام مجموعة أدوات OpenNMT-PY لإنشاء النماذج النماذج الخاصة بالأنظمة السريعة، والتي تتابع النماذج التي تم تدريبها على مجموعات البيانات التدريبية التي تحتوي على Corpus الموازي وأخيرا تم تقييم النماذج على مجموعات بيانات Dev المقدمة كجزء من المهمة. تم تدريب كل من الأنظمة على محطة DGX مع 4 -V100 GPUs. أول نظام NMT في هذا العمل هو طراز ترميز تشفير من 6 طبقة محول، تدرب على 100000 خطوة تدريبية، مما يشبه تكوينه الجديد الذي يوفره OpenNMT-PY وهذا يستخدم لإنشاء نموذج للحصول على ترجمة ثنائية الاتجاه. يحتوي نظام NMT الثاني على نماذج ترجمة أحادية الاتجاه مع نفس التكوين كنظام أول كأول، مع إضافة ترميز زوج البايت البايت (BPE) لتخشيص الكلمات الفرعية من خلال طراز MultiBPEMB المدرب مسبقا. بناء على مقاييس تقييم DEV DataSet لكل من النظم، فإن النظام الأول I.E. لقد تم تقديم نموذج محول الفانيليا كنظام أساسي. نظرا لعدم وجود تحسينات في المقاييس أثناء تدريب النظام الثاني مع BPE، فقد تم تقديمه كأنظمة مضادة للتناقض.
الترجمة الآلية تؤدي الترجمة الآلية من لغة طبيعية إلى أخرى. تكمن ترجمة الآلات العصبية بمهارة أحدث في الترجمة الآلية، لكنها تتطلب بيانات تدريبية كافية، وهي مشكلة شديدة لترجمة أزواج لغة الموارد المنخفضة. يتم تقديم مفهوم Multimodal في الترجمة الآلية العص بية (NMT) عن طريق دمج الميزات النصية مع ميزات مرئية لتحسين ترجمة الزوج منخفض الموارد. WAT2021 (ورشة العمل حول الترجمة الآسيوية 2021) تنظم مهمة مشتركة من الترجمة متعددة الوسائط للإنجليزية إلى الهندية. لقد شاركنا نفس الشيء مع اسم الفريق CNLP-NITS-PP في طلبين: متعددة الوسائط والنصية فقط NMT. يحقق هذا العمل في حقن أزواج العبارة عن طريق نهج تكبير البيانات ويحمل تحسين عملنا السابق في Wat2020 في نفس المهمة في كل من NMT النصي فقط و Multimodal NMT. لقد حققنا المرتبة الثانية على مجموعة اختبار التحدي للغة الإنجليزية إلى الهندية الترجمة متعددة الوسائط حيث تقييم ثنائي اللغة من النتيجة 39.28، درجة التقييم البدياسية بديهية سهلة الاستخدام (RIBES) 0.792097، ومقاييس كفاية الطلاقة (AMFM) 0.830230 على التوالي وبعد
ما مدى صعوبة ذلك بالنسبة لمتعلمي اللغة الإنجليزية (ESL) للغة الإنجليزية (ESL) قراءة النصوص الإنجليزية الصاخبة؟هل يحتاج المتعلمون ESL إلى التطبيع المعجمي لقراءة النصوص الإنجليزية الصاخبة؟قد تؤثر هذه الأسئلة أيضا على تكوين المجتمع على مواقع الشبكات الا جتماعية حيث يمكن أن تعزى الاختلافات إلى متعلمي ESL ومكبرات الصوت الإنجليزية الأصلية.ومع ذلك، فقد عالجت بعض الدراسات هذه الأسئلة.تحقيقا لهذه الغاية، بنينا مقيمين دقيقين للغاية لقراءة القراءة لتقييم قابلية قراءة النصوص للمتعلمين ESL.ثم طبقنا هذا المقيمين للنصوص الإنجليزية الصاخبة لمزيد من تقييم قابلية قراءة النصوص.أظهرت النتائج التجريبية أنه على الرغم من أن متعلمي ESL على المستوى المتوسطين يمكنهم قراءة معظم النصوص الإنجليزية الصاخبة في المقام الأول، فإن التطبيع المعجمي يحسن بشكل كبير من قراءة النصوص الإنجليزية الصاخبة للمتعلمين ESL.
في هذه الورقة ونحن نستكشف تقنيات مختلفة للتغلب على تحديات الموارد المنخفضة في الترجمة الآلية العصبية (NMT) وتركز على وجه التحديد على حالة اللغة الإنجليزية الماراثية NMT. تتطلب أنظمة NMT كمية كبيرة من كورسا الموازية للحصول على ترجمات ذات نوعية جيدة. ن حاول تخفيف مشكلة الموارد المنخفضة عن طريق زيادة Corpora الموازية أو باستخدام تعلم النقل. تستخدم تقنيات مثل حقن الجدول العبارة (PTI) والترجمة الخلفي وخلط لغة اللغة لتعزيز البيانات الموازية؛ في حين أن المظلات المحورية والمحسبات متعددة اللغات تستخدم للاستفادة من تعلم التحويل. بالنسبة للمحور المحوري، تأتي الهندية في اللغة المساعدة للترجمة الإنجليزية المهاراتية. بالمقارنة مع نموذج محول الأساس، يلاحظ اتجاه تحسن كبير في درجة بلو عبر تقنيات مختلفة. لقد قمنا بإجراء تقييم واسع النطاق والتولي والنوعي لأنظمنا. نظرا لأن الاتجاه في الترجمة الآلية (MT) اليوم هو ما بعد التحرير وقياس الحد من الجهود البشرية (لها)، ونعطينا ملاحظاتنا الأولية لمعدل تحرير الترجمة (TER) مقابل دراسة درجة بلو وحيث يعتبر TER كتدبير لها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا