ترغب بنشر مسار تعليمي؟ اضغط هنا

NRC-CNRC أنظمة للجهاز الصربي الألماني والألماني والألماني والألماني 2021

NRC-CNRC Systems for Upper Sorbian-German and Lower Sorbian-German Machine Translation 2021

284   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نحن نصف أنظمة الترجمة الآلية العصبية لدينا المهمة المشتركة 2021 على MT غير الخاضعة للإشراف على الموارد الخلفية والمنخفضة للغاية، والترجمة بين السوربيين العليا والألمانية (الموارد المنخفضة) وبين السوربيان السفلي والألمانية (غير المعدل).أنظمة أدرجت تصفية البيانات، والخلفية، والانسقاط BPE، والكثير، ونقل التعلم من لغات عالية (إيه) -ReSource.كما تقاس بواسطة مقاييس أوتوماتيكية، أظهرت أنظمتنا أداءا قويا، ووضعها باستمرار أولا أو مرتبط لأول مرة عبر معظم مؤشرات المقاييس والترجمة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نستخدم مجموعة اختبار شبه آلية من أجل توفير تقييم لغوي محمول من أجل أنظمة الترجمة الآلية الحديثة. يشمل التقييم 18 الألمانية إلى الإنجليزية و 18 الإنجليزية إلى الألمانية، قدمت إلى مهمة مشتركة للترجمة بمؤتمر 2021 حول الترجمة الآلية. يضيف تقديمنا إلى إعدادات السنوات السابقة عن طريق إنشاء وتطبيق جناح اختبار واسع النطاق للغة الإنجليزية إلى الألمانية كزوج لغة جديدة. يسمح التقييم الراسخ في اكتشاف اختلافات كبيرة بين الأنظمة التي لا يمكن تمييزها من خلال التقييم المباشر لحملة التقييم البشرية. نجد أن معظم الأنظمة تحقق عقوبة جيدة في غالبية الظواهر اللغوية ولكن هناك عدد قليل من الظواهر مع دقة منخفضة، مثل التعابير، والمطبقة مشروط والمسندات الألمانية الناتجة. نظمتين تتمتعان بدقة اختبار أفضل بكثير في المتوسط ​​في المتوسط ​​الكلي في كل اتجاه لغة، عبر الإنترنت-W و Facebook-AI للألمانية إلى الإنجليزية والمرافقين وبرنامج Volctrans وعلى الإنترنت-W للإنجليزية إلى الألمانية. تظهر الأنظمة تحسنا مطردا مقارنة بالسنوات السابقة.
نقدم أنظمة جامعة وسط فلوريدا للمهمة المشتركة ل LORESMT 2021، والمشاركة في أزواج الترجمة الإنجليزية والأيرلندية والإنجليزية المهاراتية.ركزنا جهودنا على تتبع المهمة المقيدة، وذلك باستخدام تعلم التحويل تجزئة الكلمات الفرعية لتعزيز نماذجنا بالنظر إلى كمي ات صغيرة من بيانات التدريب.حققت نماذجنا أعلى درجات بلو على المسارات المقيدة بالكامل للغة الإنجليزية والأيرلندية والأيرلندية والإنجليزية والماراثية - الإنجليزية مع عشرات 13.5 و 21.3 و 17.9 على التوالي
وصف النظم التي طورها مجلس البحوث القومي كندا للمهمة المشتركة لتحديد اللغة اليوراليك في حملة التقييم الفاديم 2021.قمنا بتقييم طريقتين مختلفتين لهذه المهمة: مصنف احتمالية استغلال حرف 5 غرامات فقط كميزات، وشبكة عصبية قائمة على الطابع مدربة مسبقا من خلال الإشراف الذاتي، ثم ضبطها على مهمة تحديد اللغة.تحولت الطريقة السابقة إلى أداء أفضل، مما يؤدي إلى الشك على فائدة أساليب التعلم العميق لتحديد اللغة، حيث لم يتمكنوا بعد بشكل مقنع وتفوقوا باستمرار على خوارزميات التصنيف أكثر بساطة وأقل تكلفة استغلال ميزات N-Gram.
نبلغ عن التجارب في تبسيط النص التلقائي (ATS) للألمانية مع مستويات تبسيط متعددة على طول الإطار الأوروبي المشترك المرجعي لغات (CEFR)، وتبسيط اللغة الألمانية القياسية إلى مستويات A1 و A2 و B1.لهذا الغرض، نحقق في استخدام تسميات المصدر وإحاطاء اللغة الألم انية القياسية، مما يسمح لنا بتبسيط اللغة القياسية إلى مستوى CEFR محدد.نظرا لأن هذه الأساليب فعالة بشكل خاص في سيناريوهات الموارد المنخفضة، حيث يمكننا أن نتفوق على خط الأساس المحول القياسي.علاوة على ذلك، نقدم نسخ ملصقات، والتي نظهرها يمكن أن تساعد النموذج في إجراء تمييز بين الجمل التي تتطلب مزيدا من التعديلات والجمل التي يمكن نسخها كما هو.
تصف الورقة أنظمة ترجمة الكلام (ST) ولكن الإنجليزية إلى الألمانية. وهي تستند إلى نماذج الترجمة الآلية المعرونة التي تم تدريبها بشكل مشترك. يتم تقييم أدائها على مجموعة اختبار MUSTC المشتركة. في هذا العمل، ندرس كفاءتها من وجهة نظر وجود كمية كبيرة من بيا نات التدريب ASR المنفصلة وبيانات التدريب MT، وكمية أصغر من بيانات التدريب على الكلام. يتم استخدام كميات كبيرة من البيانات التدريبية ASR و MT لتدريب نماذج ASR و MT مسبقا. يتم استخدام بيانات الترجمة من الكلام لتحسين نماذج ASR-MT بشكل مشترك عن طريق تحديد مسار قابل للتطبيق من الكلام من الكلام إلى الترجمات. لهذا الغرض، نستخدم التمثيلات المستمرة الداخلية من وحدة فك ترميز ASR كدخل إلى وحدة MT. نظرا لأن ترجمة الكلام يمكن تحسينها من خلال تدريب وحدة فك الترميز العادية بالاشتراك مع وحدة MT-Module باستخدام كمية كبيرة من بيانات التدريب فقط MT فقط. نعرض أيضا تحسينات كبيرة من خلال تدريب وحدة ASR القادرة على توليد نص مخلوق، بدلا من مغادرة مهمة علامات الترقيم إلى وحدة MT.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا