ترغب بنشر مسار تعليمي؟ اضغط هنا

Robertnlp في المهمة المشتركة Iwpt 2021: تحليل UD بسيط محسن لمدة 17 لغة

RobertNLP at the IWPT 2021 Shared Task: Simple Enhanced UD Parsing for 17 Languages

265   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة نظام تحليل التبعية متعدد اللغات كما هو مستخدم في المهمة المشتركة IWPT 2021 على التحليل في التبعيات العالمية المعززة.يتكون نظامنا من مصنف BiAffine غير المعسم الذي يعمل مباشرة على مدينتي XLM-R التي تم ضبطها بشكل مباشر ويولد الرسوم البيانية UD المحسنة من خلال التنبؤ بأفضل تسمية التبعية (أو عدم وجود اعتماد) لكل زوج من الرموز.لتجنب قضايا Sparsity الناتجة عن ملصقات التبعية المعجمية، نحل محل البنود المعجمية في العلاقات مع العناصر النائبة في وقت التدريب ووقت التنبؤ، لاحقا لاحقا من التحليل عبر نظام التعلم القائم على القاعدة / الجهاز الهجينة.بالإضافة إلى ذلك، نحن نستخدم نموذج النموذج في وقت التنبؤ.يحقق نظامنا دقة تحليل عالية على بيانات الاختبار العمياء، المرتبة الثالثة من أصل 9 مع متوسط درجة ELAS F1 من 86.97.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف مهمة IWPT الثانية على تحليل نهاية إلى نهاية من النص الخام لتعزيز التبعيات العالمية.نحن نقدم تفاصيل حول مقاييس التقييم ومجموعات البيانات المستخدمة للتدريب والتقييم.قارنا النهج التي اتخذتها الفرق المشاركة ومناقشة نتائج المهمة المشتركة، والمقارنة أيضا مع الطبعة الأولى من هذه المهمة.
نحن تصف تقديم DCU-EPFL إلى مهمة مشتركة IWPT 2021: من النص الخام لتعزيز التبعيات العالمية. تتضمن المهمة تحليل الرسوم البيانية UD المحسنة، والتي تعد امتدادا لأشجار التبعية الأساسية المصممة لتكون أكثر تسهيلا نحو تمثيل الهيكل الدلالي. يتم التقييم على 29 شجرة Treebanks في 17 لغة ومطلوبة للمشاركين لتحليل البيانات من كل لغة تبدأ من السلاسل الخام. يستخدم نهجنا خط أنابيب Stanza لمعالجة الملفات النصية، XLM-Roberta للحصول على تمثيلات رمزية في السياق، ونموذج تسجيل الحافة والعلامات للتنبؤ الرسم البياني المحسن. أخيرا، ندير نص PostProcessing لضمان جميع مخرجاتنا هي الرسوم البيانية UD المحسنة سارية المفعول. يضع نظامنا السادس من أصل 9 مشاركا مع درجة مرفق محسنة خشنة (ELAS) 83.57. نقوم بإجراء تجارب إضافية بعد الموعد النهائي والتي تشمل استخدام Trankit لمعالجة ما قبل المعالجة، XLM-Roberta Large Protectenation، وتعلم المتعدد التعلم بين محلل التبعية الأساسية والمعززة. جميع هذه التعديلات تحسن النتيجة الأولية ونظامنا النهائي لديه إيلاس خشن 88.04.
تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.
في هذه المهمة المشتركة، تقترح هذه الورقة طريقة للجمع بين نموذج ناقلات Word القائم على BERT ومقدمة تنبؤ LSTM للتنبؤ بقيم التكافؤ والإثارة في النص.من بينها، ناقل الكلمات المستند إلى بيرت هو 768 ثيم، ويتم تغذية كل ناقلات كلمة في الجملة بالتتابع لطراز LS TM للتنبؤ.تظهر النتائج التجريبية أن أداء طريقة لدينا المقترحة أفضل من نتائج نموذج الانحدار لاسو.
نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا لمعمارية المتنبئة ل OpenKiwi، باستخدام ترميزات متعددة اللغات المدربة مسبقا جنبا إلى جنب مع المحولات.نؤدي إلى مزيد من التجربة والأهداف والميزات المرتبطة بعدم اليقين بالإضافة إلى التدريب على بيانات التقييم المباشر خارج المجال.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا