ترغب بنشر مسار تعليمي؟ اضغط هنا

تحدي لغة مفاجأة: تطوير نظام ترجمة آلية عصبية بين البشتونية والإنجليزية في شهرين

Surprise Language Challenge: Developing a Neural Machine Translation System between Pashto and English in Two Months

238   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في صناعة وسائل الإعلام وتركيز التقارير العالمية قد تحول بين عشية وضحاها. هناك حاجة ملحة إلى أن تكون قادرة على تطوير أنظمة ترجمة آلية جديدة في فترة زمنية قصيرة وللغطي بشكل أكثر كفاءة تطوير القصص بسرعة أكبر. كجزء من مشروع EU Gourmet ورفع التركيز على الترجمة ذات الآلات المنخفضة وشركاؤنا الإعلامي لغة مفاجئة يجب أن يتم بناء نظام الترجمة الآلي وتقييمه خلال شهرين (فبراير وآذار / مارس 2021). كانت اللغة المختارة كانت الباشتونية ولغة هندية إيرانية تحدثت في أفغانستان وباكستان والهند. في هذه الفترة، أكملنا خط الأنابيب الكامل لتنمية نظام الترجمة الآلية العصبية: الزحف البيانات والتنظيف ومحاذاة وإنشاء مجموعات الاختبار وتطوير ونماذج الاختبار وتقديمها إلى شركاء المستخدمين. في هذه الورق، نطبق إنشاء البيانات والتجارب السريعة مع التعلم والنقل الاحتياطي لهذا زوج لغة الموارد المنخفضة. نجد أن بدءا من نموذج كبير موجود مدرب مسبقا على 50 لغة يؤدي إلى نتائج بلو أفضل بكثير من الاحيلية على زوج لغة موارد عالية مع نموذج أصغر. نقدم أيضا تقييم بشري لأنظمنا والتي تشير إلى أن النظم الناتجة أداء أفضل من النظام التجاري المتاح بحرية عند ترجمة من اللغة الإنجليزية إلى اتجاه البشتونية وبالمثل عند ترجمة من البشتو إلى الإنجليزية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعلق نظام ترجمة لغة الإشارة المتتالية في خرائط أول خريطة توقيع مقاطع فيديو لمعالجة التوضيحية ثم تترجم لمعان اللغات في لغات منطوقة.يركز هذا العمل على مكون الترجمة اللامع في المرحلة الثانية، وهو أمر صعب بسبب ندرة البيانات الموازية المتاحة للجمهور.نحن ن قترب الترجمة اللمعان كمهامة ترجمة آلية منخفضة الموارد والتحقيق في طريقتين شعبيتين لتحسين جودة الترجمة: فرط HyperParameter و Backtranslation.نناقش الإمكانات والمخاطر من هذه الأساليب بناء على تجارب في مجموعة بيانات RWTH-Phoenix-Weather 2014T.
تقدم هذه الورقة نظرة عامة على AVASAG؛مشروع أبحاث تطبيقي مستمر يقوم بتطوير نظام ترجمة من النص إلى تسجيل الدخول للخدمات العامة.نحن نصف نقاط الابتكار العلمي (الوصف SL على أساس الهندسة، الرسوم المتحركة ثلاثية الأبعاد والفيديو، نظام التوضيح المبسطة، استراتيجية التقاط الحركة) وخط أنابيب الترجمة الشاملة.
نظرا لأن الترجمة الآلية (MT) أصبحت أكثر قوة بشكل متزايد، والتي يمكن الوصول إليها، واستفادتها، فقد نمت إمكانات إدامة التحيز إلى جانب تقدمها.في حين تمت دراسة المؤشرات العلنية للحيز في الترجمة الآلية، فإننا نجادل بأن التحيزات السرية تعرض مشكلة ترسيخها.م ن خلال استخدام اللغة المحايدة بين الجنسين اللغة التركية واللغة الجنسية الإنجليزية، ندرس حالات التحيز بين الجنسين العلني والسرية في نماذج MT.على وجه التحديد، نقدم طريقة للتحقيق في العلامات الجنسانية غير المتماثلة.نقوم أيضا بتقييم التحيز في إسناد الشخصية وفحص الصور النمطية المهنية والشخصية من خلال مؤشرات التحيز العلنية في طرازات MT.يستكشف عملنا طبقة أعمق من التحيز في طرازات MT ويوضح الحاجة المستمرة لمنهجية متعددة التخصصات اللغوية في تطوير نموذج MT.
التواصل بين أخصائيي الرعاية الصحية والمرضى الصم يتحدىون، والوباء الحالي Covid-19 يجعل هذه المشكلة أكثر حادة.غالبا ما لا تدخل مفسر لغة الإشارة في كثير من الأحيان المستشفيات وأقنائك الوجهلمعالجة هذه المشكلة العاجلة، قمنا بتطوير نظام يسمح بمهنيي الرعاية الصحية بترجمة الجمل التي يتم استخدامها بشكل متكرر في تشخيص وعلاج CovID-19 في لغة هولندا (NGT).يتم عرض الترجمات عن طريق مقاطع الفيديو والرسوم المتحركة الرمزية.بنية النظام هي بحيث يمكن تمديدها إلى تطبيقات أخرى ولغات تسجيل أخرى بطريقة واضحة نسبيا.
تم تطوير نماذج الترجمة للمجال المحدد لترجمة بيانات CovID من الإنجليزية إلى الأيرلندية لمهمة LORESMT 2021 المشتركة.تم تطبيق تقنيات التكيف عن المجال، باستخدام كوربوس 55K 55K تكييفها كوفي من المديرية العامة للترجمة.تم مقارنة أداء الدقيقة والضبط الجمنيات المختلطة ومقارنة أساليب البيانات المشتركة مع النماذج المدربة على مجموعة بيانات داخلية ممتدة.كجزء من هذه الدراسة، تم تطوير مجموعة بيانات باللغة الإنجليزية والأيرلندية من البيانات ذات الصلة بالكوفت، من المجالات الصحية والتعليمية.يستخدم نموذج أعلى مستوياته بنية محول مدربة مع مجموعة بيانات Covid داخل المجال.في سياق هذه الدراسة، أظهرنا أن تمديد مجموعة بيانات أساسية 8K داخل المجال من خلال خطوط 5K فقط تحسنت درجة بلو بمقدار 27 نقطة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا