ترغب بنشر مسار تعليمي؟ اضغط هنا

تقديم نويج DSI إلى المعيار GEM 2021

NUIG-DSI's submission to The GEM Benchmark 2021

92   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة التقديم من قبل Nuig-DSI إلى Benchmark GEM 2021. نشارك في المهمة المشتركة النمذجة حيث نقدم مخرجات على أربع مجموعات بيانات للجيل إلى النص، وهي DART، WEBNLG (EN)، E2E و COMMINGEN.نتبع النهج الذي يشبه الواحدة الموصوفة في الورق القياسي GEM حيث نستخدم النموذج T5-Base المدرب مسبقا لتقديمنا.نحن ندرب هذا النموذج على بيانات أحادية الذهاب إضافية حيث نقوم بتجربة استراتيجيات اخفاء مختلفة تركز على وجه التحديد على كيانات إخفاء، وتندب المفاهيم وكذلك استراتيجية إخفاء عشوائية للتدريب المسبق.في نتائجنا، نجد أن الاخفاء العشوائي يؤدي الأفضل من حيث مقاييس التقييم التلقائي، على الرغم من أن النتائج ليست مختلفة بشكل كبير مقارنة باستراتيجيات اخفاء أخرى.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة Simplener، وهو نموذج تم تطويره لمهمة تبسيط الجملة في GEM-2021.نظامنا عبارة عن بنية محولات SEQ2SEQ أحادية مونولجة تستخدم الرموز المراقبة معلقة مسبقا إلى البيانات، مما يسمح للنموذج بتشكيل التبسيط الذي تم إنشاؤه وفقا للسمات التي تريدها ال مستخدم.بالإضافة إلى ذلك، نظهر أن البيانات التدريبية NER - بيانات التدريب قبل الاستخدام يساعد على تثبيت تأثير الرموز السيطرة وتحسين الأداء العام للنظام بشكل كبير.ونحن نوظف أيضا embeddings المسبق للحد من البيانات الخاصة بالبيانات والسماح للنموذج بإنتاج المزيد من النواتج القابلة للتعميم.
نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا لمعمارية المتنبئة ل OpenKiwi، باستخدام ترميزات متعددة اللغات المدربة مسبقا جنبا إلى جنب مع المحولات.نؤدي إلى مزيد من التجربة والأهداف والميزات المرتبطة بعدم اليقين بالإضافة إلى التدريب على بيانات التقييم المباشر خارج المجال.
تقدم هذه الورقة التقديمات الكلية الإمبراطورية لندن إلى المهمة المشتركة لتقدير الجودة WMT21 (QE) 3: اكتشاف الخطأ الحرج.ينشئ نهجنا على تمثيلات متدرب مسبقا عبر اللغات في نموذج تصنيف التسلسل.ونحن كذلك تحسين المصنف الأساسي من خلال (ط) إضافة عينات مرجحة لل تعامل مع البيانات غير المتوازنة و (2) إدخال هندسة ميزة، حيث يتم استخراج الميزات المتعلقة بالسمية، المسماة الكيانات والمعنويات، والتي من المحتمل أن تكون مؤشرا على الأخطاء الحرجة، باستخدامالأدوات الموجودة ومتكاملة للنموذج بطرق مختلفة.نحن ندرب النماذج مع نوع واحد من الميزات في وقت واحد وفرق تلك النماذج التي تتحسن عبر المصنف الأساسي على مجموعة تطوير (dev).إن عروضنا الرسمية تحقق نتائج تنافسية للغاية، ترتيب المرتبة الثانية لثلاثة من أزواج أربعة لغات.
في هذه الورقة، نقدم مساهمة مشتركة من المهمة المشتركة ومقاييس WMT 2021.مع تركيز هذا العام على متري الجودة متعددة الأبعاد (MQM) باعتباره التقييم البشري الحقيقة الأرضية، كان هدفنا هو توجيه المذنب نحو الارتباطات الأعلى مع MQM.نحن نقوم بذلك عن طريق التدري ب المسبق أولا على التقييمات المباشرة ثم ضبط نتائج MQM تطبيع Z.في تجاربنا، نعرض أيضا أن نماذج المذنب المجانية المرجعية أصبحت تنافسية للنماذج القائمة على المراجع، حتى تتفوق على أفضل نموذج مذنب من عام 2020 في بيانات تطوير هذا العام.بالإضافة إلى ذلك، نقدم Cometinho، وهو نموذج مذنب خفيف الوزن هو 19x أسرع في وحدة المعالجة المركزية من النموذج الأصلي، مع تحقيق الارتباطات الحديثة أيضا مع MQM.أخيرا، في QE كمسار متري، شاركنا أيضا مع نموذج QE المدرب باستخدام إطار OpenKiwi الاستفادة من درجات MQM وشروح مستوى الكلمة.
في هذه الورقة، نقوم بصف أن نقوم بتقديم طلباتنا إلى WAT-2021 (Nakazawa et al.، 2021) لمهمة اللغة الإنجليزية إلى ميانمار (بورمي).فريقنا، ID: YCC-MT1 ''، ركز على جلب معرفة حرفية إلى وحدة فك الترميز دون تغيير النموذج.لقد استخرجنا يدويا أزواج الكلمة / عبا رة الترجمة من ALT Corpus وتطبيق ميزة علامات XML على وحدة فك ترميز موسى (I.E. -XML-إدخال Exclive، -xml -XML-Input شاملة).نوضح أن تقنية الترجمة الهجينة يمكن أن تتحسن بشكل كبير (حوالي 6 درجات بلو) خط الأساس من ثلاثة SMT '' نموذج تسلسل نموذجي "من العبارات المعروفة القائمة على العبارات المعروفة.علاوة على ذلك، حققت هذه الطريقة الهجينة البسيطة ثاني أعلى النتائج بين أنظمة MT المقدمة لمهمة مشاركة الترجمة الإنجليزي إلى ميسمار WAT2021 وفقا ل Bleu (بابينيني وآخرون، 2002) وعشرات AMFM (Banchs et al.، 2015).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا