ترغب بنشر مسار تعليمي؟ اضغط هنا

هل هناك حاجة مراجع حقا؟GREXABEL-IST 2021 تقديم المهمة المشتركة للمقاييس

Are References Really Needed? Unbabel-IST 2021 Submission for the Metrics Shared Task

253   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم مساهمة مشتركة من المهمة المشتركة ومقاييس WMT 2021.مع تركيز هذا العام على متري الجودة متعددة الأبعاد (MQM) باعتباره التقييم البشري الحقيقة الأرضية، كان هدفنا هو توجيه المذنب نحو الارتباطات الأعلى مع MQM.نحن نقوم بذلك عن طريق التدريب المسبق أولا على التقييمات المباشرة ثم ضبط نتائج MQM تطبيع Z.في تجاربنا، نعرض أيضا أن نماذج المذنب المجانية المرجعية أصبحت تنافسية للنماذج القائمة على المراجع، حتى تتفوق على أفضل نموذج مذنب من عام 2020 في بيانات تطوير هذا العام.بالإضافة إلى ذلك، نقدم Cometinho، وهو نموذج مذنب خفيف الوزن هو 19x أسرع في وحدة المعالجة المركزية من النموذج الأصلي، مع تحقيق الارتباطات الحديثة أيضا مع MQM.أخيرا، في QE كمسار متري، شاركنا أيضا مع نموذج QE المدرب باستخدام إطار OpenKiwi الاستفادة من درجات MQM وشروح مستوى الكلمة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا لمعمارية المتنبئة ل OpenKiwi، باستخدام ترميزات متعددة اللغات المدربة مسبقا جنبا إلى جنب مع المحولات.نؤدي إلى مزيد من التجربة والأهداف والميزات المرتبطة بعدم اليقين بالإضافة إلى التدريب على بيانات التقييم المباشر خارج المجال.
تصف هذه الورقة تقديم Papago إلى مهمة تقدير الجودة WMT 2021 1: التقييم المباشر على مستوى الجملة.يستكشف نظام تقدير الجودة متعدد اللغات لدينا مزيج من نماذج اللغة المحددة مسبقا وبنية التعلم متعددة المهام.نقترح خط أنابيب تدريب تكراري يعتمد على ما يحقظ بكم يات كبيرة من البيانات الاصطناعية داخل المجال وتصفية البيانات الذهبية (المسمى).ثم قمنا بضغط نظامنا عبر تقطير المعرفة من أجل تقليل المعلمات بعد الحفاظ على أداء قوي.تنفذ أنظمتنا متعددة اللغات متعددة اللغات بشكل تنافسي في تعدد اللغات وجميع إعدادات زوج اللغة الفردية 11 بما في ذلك صفر النار.
في هذه الورقة، نصف إنشادنا إلى المهمة المشتركة بمقاييس WMT 2021.نستخدم الأسئلة والأجوبة التي تم إنشاؤها تلقائيا لتقييم جودة أنظمة الترجمة الآلية (MT).إن تقديمنا يبني على إطار MTEQA المقترح مؤخرا.تظهر التجارب على مجموعات بيانات تقييم WMT20 أنه على مست وى النظام، يحقق Mteqa Metric أداء قابلا للمقارنة مع حلول حديثة أخرى، مع مراعاة كمية معينة فقط من الترجمة بأكملها.
تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.
تقدم هذه الورقة التقديم المشترك JHU-Microsoft لتقدير جودة WMT 2021 المهمة المشتركة.نحن نشارك فقط في المهمة 2 (تقدير جهود ما بعد التحرير) للمهمة المشتركة، مع التركيز على تقدير الجودة على مستوى الكلمات المستهدف.التقنيات التي تجربناها مع تضمين تدريب محو ل Levenshtein وتعزيز البيانات مع مجموعة من الترجمة الأمامية والخلفية والرحلة الدائرية، والتحرير الزائف بعد إخراج MT.نوضح القدرة التنافسية لنظامنا مقارنة بناسي Openkiwi-XLM المعتمد على نطاق واسع.نظامنا هو أيضا نظام الترتيب العلوي في متري MT MCC لزوج اللغة الإنجليزية والألمانية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا