ترغب بنشر مسار تعليمي؟ اضغط هنا

على استقرار تصنيفات النظام في WMT

On the Stability of System Rankings at WMT

327   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

النهج الحالي لجمع الأحكام البشرية لجودة الترجمة الآلية لمهمة الترجمة الأخبار في WMT - تصنيف القطاع مع سياق المستند - هو الأحدث في سلسلة من التغييرات في بروتوكول التعليق البشري WMT.نظرا لأن البروتوكولات التوضيحية هذه تغيرت مع مرور الوقت، فقد انجرفت بعيدا عن بعض الافتراضات الإحصائية الأولية التي تدعمها، مع عواقب تسمون صحة تصنيفات نظام المهام الأخبار WMT إلى سؤال.في المحاكاة بناء على البيانات الحقيقية، نوضح أن التصنيفات يمكن أن تتأثر بوجود القيم المتطرفة (أنظمة عالية الجودة أو منخفضة الجودة)، مما أدى إلى تصنيفات ونظام مختلفة.ونحن ندرس أيضا أسئلة تكوين مهمة التوضيحية وكيف قد تؤثر سهولة ترجم أو صعوبة ترجمة المستندات المختلفة في تصنيفات النظام.نحن نقدم مناقشة طرق لتحليل هذه القضايا عند النظر في التغييرات المستقبلية في بروتوكولات التعليق التوضيحي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

هدف البحث إلى تحليل أثر المزارع الريحية في استقرار تردد الشبكة الكهربائية، و وصف أداء الشبكة السورية عند ربط مزارع ريحية في عدة مناطق من القطر السوري (القنيطرة - الهيجانة - غباغب) من خلال تقييم استقرار تردد نظام القدرة الكهربائية و زمن الفصل الحرج. درِس أثر المزارع الريحية في تردد الشبكة السورية و العوامل المرتبطة بذلك مثل تقنية التوليد عن طريق استبدال مصادر الطاقة المولدة بنوعين من المولدات التحريضية، و تغيير موقع ربط المزارع الريحية، و زيادة إسهام مصادر الطاقة المولدة من طاقة الرياح. طُبَقت الدراسة التحليلية على المنظومة الكهربائية السورية 230KV – 400KV باستخدام برنامج ال NEPLAN الذي يتميز باحتوائه على مكتبة واسعة لعناصر نظام القدرة الكهربائية و نماذج المولدات الريحية.
العديد من الأساليب الأخيرة تجاه استرجاع المعلومات العصبية تخفف من تكاليفها الحاسوبية باستخدام خط أنابيب الترتيب متعدد المراحل.في المرحلة الأولى، يتم استرجاع عدد من المرشحين المحتملين ذوي الصلة باستخدام نموذج استرجاع فعال مثل BM25.على الرغم من أن BM25 قد أثبت أداء لائق كمرفاة في المرحلة الأولى، فإنه يميل إلى تفويت الممرات ذات الصلة.في هذا السياق، نقترح كورت، وهو نموذج بسيط في المرحلة الأولى من المرحلة الأولى يرفع تمثيلات سياقية من نماذج اللغة المسبقة مسبقا مثل بيرت لاستكمال وظائف الترتيب القائمة على الأجل مع عدم التسبب في عدم وجود تأخير كبير في وقت الاستعلام.باستخدام DataSet MS Marco، نظهر أن Cort يزيد بشكل كبير من استدعاء المرشح من خلال استكمال BM25 مع المرشحين المفقودين.وبالتالي، نجد أن إعادة الراهنات اللاحقة تحقيق نتائج فائقة مع أقل مرشحين.نوضح كذلك أن استرجاع المرور باستخدام CORT يمكن تحقيقه مع انخفاض الآمون المنخفض بشكل مدهش.
تحديات مهمة كفاءة ترجمة الآلات التي تحديات المشاركين لجعل أنظمتهم أسرع وأصغر مع الحد الأدنى من التأثير على جودة الترجمة.ما مقدار الجودة للتضحية بالكفاءة يعتمد على التطبيق، لذلك تم تشجيع المشاركين على تقديم عروض متعددة تغطي مساحة المقاضيات.في المجموع، كان هناك 53 طلب من 4 فرق.كان هناك GPU، وحدة المعالجة المركزية واحدة النواة، ومقطوعات الأجهزة وحدة المعالجة المركزية متعددة النواة وكذلك الإنتاجية المركبة أو ظروف الكمون الجملة واحدة.أظهرت التقديمات مئات الملايين من الكلمات يمكن ترجمتها مقابل الدولار، متوسط الكمون هو 5--17 مللي ثانية، ونماذج تناسبها 7.5-150 ميغابايت.
مجالات اللغة التي تتطلب الاستخدام الدقيق للغاية للمصطلحات وفيرة وتعكس جزءا كبيرا من صناعة الترجمة.في هذا العمل، نقدم معيارا لتقييم نوعية الترجمة المصطلحات والاتساق، مع التركيز على المجال الطبي (والكوفي 19 على وجه التحديد) لمدة خمسة أزواج لغوية: الإنج ليزية إلى الفرنسية والصينية والروسية والكورية، وكذلك جمهورية التشيكألمانية.نبلغ عن أوصاف النظم المشاركة ونتائجها، وتعليقا على الحاجة إلى مزيد من الجهود البحثية فيما يتعلق بتعامل مع المصطلحات الأكثر ملاءمة أيضا نحو صياغة وتقييم مناسبة للمهمة.
نقدم تطوير نظام الترجمة الآلي متعدد اللغات لمهمة الترجمة متعددة اللغات متعددة اللغات المهمة متعددة اللغات في WMT 2021. بدء تشغيل نظام الأساس المحتمل، حققنا في العديد من التقنيات لتحسين جودة الترجمة على المجموعة الفرعية المستهدفة من اللغات.تمكنا من تح سين جودة الترجمة بشكل كبير من خلال تكييف النظام باتجاه المجموعة الفرعية المستهدفة من اللغات وتوليد بيانات اصطناعية باستخدام النموذج الأولي.التقنيات المطبقة بنجاح في الترجمة متعددة اللغز المزدوجة (E.G. التشابه العادي) كان لها تأثير بسيط فقط على أداء الترجمة النهائي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا