ترغب بنشر مسار تعليمي؟ اضغط هنا

التقديم BME ل SIGMORPHON 2021 المهمة المشتركة 0. نهج تدريب ثلاثي خطوات مع تكبير البيانات للانضباط المورفولوجي

BME Submission for SIGMORPHON 2021 Shared Task 0. A Three Step Training Approach with Data Augmentation for Morphological Inflection

265   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم تقديم BME لمهمة Sigmorphon 2021 0 الجزء 1، التعميم عبر المهمة المشتركة بين اللغات المتنوعة من الناحية النموذجية.نحن نستخدم نموذج فك تشفير LSTM مع ثلاثة خطوات التدريب المدرب لأول مرة على جميع اللغات، ثم ضبطها على كل عائلة لغة وأخيرا ضبطها على اللغات الفردية.نستخدم نوع مختلف من تقنية تكبير البيانات في الخطوتين الأولين.تفوق نظامنا على التقديم الآخر الوحيد.على الرغم من أنه لا يزال أسوأ من خط الأساس المحول الذي أصدره المنظمون، فإن نموذجنا أبسط وأن تقنياتنا تكبير البيانات تنطبق بسهولة على لغات جديدة.نقوم بإجراء دراسات الاجتثاث وإظهار أن تقنيات المعزز والخطوات التدريبية الثلاثة غالبا ما تساعد ولكن في بعض الأحيان يكون لها تأثير سلبي.رمز لدينا هو متاح علنا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف مهمة Sigmorphon الثانية على التورفولوجيا غير المدعومة: الهدف من المهمة المشتركة SIGMORPHON 2021 على تجميع النماذج المورفولوجية غير المزدئة غير المنشأة هو أنواع الكلمات العنقودية من كوربوس نص الخام إلى النماذج.تحقيقا لهذه الغاية، نطلق سرورا لم دة 5 لغات تطوير و 9 لغات اختبار، وكذلك النماذج الجزئية الذهبية للتقييم.نتلقى 14 تقريرا من 4 فرق تتبع الاستراتيجيات المختلفة، ويستند أفضل نظام أداء على قواعد النحوية.تختلف النتائج بشكل كبير عبر اللغات.ومع ذلك، فإن جميع الأنظمة متفوقة من قبل Lemmmmmmmatizer تحت إشراف، مما يعني أنه لا يزال هناك مجال للتحسين.
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا ت اختبار الباحث البشري من الألمانيةوالإنجليزية والهولندية في مهمة SIGMORPHON-UNIMORPH 2021 المشتركة، مع نتائج تنافسية.وقد ثبت بعض الخصائص الرسمية لعملية التعميم الحد الأدنى.تم تطوير طريقة تلقائية لإنشاء محفزات اختبار Wug للتجارب المستقبلية التي تحقق ما إذا كانت التعميمات المورفولوجية النموذجية ضئيلة للغاية.
نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا لمعمارية المتنبئة ل OpenKiwi، باستخدام ترميزات متعددة اللغات المدربة مسبقا جنبا إلى جنب مع المحولات.نؤدي إلى مزيد من التجربة والأهداف والميزات المرتبطة بعدم اليقين بالإضافة إلى التدريب على بيانات التقييم المباشر خارج المجال.
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا العام. النظام عبارة عن محول عصبي يعمل على إجراءات تحرير صريحة ويتم تدريبه على التعلم التقليد. لهذا التحدي، جربنا التغييرات التالية: أ) شرائح صوتية تنبعث منها بدلا من صوتيات الشخصيات الفردية، ب) تسرب حرف الإدخال، ج) فك تشفير Mogrovifier LSTM (Melis et al.، 2019)، D) إثراء مدخلات وحدة فك الترميز حضر حاليا حرف الإدخال، ه) تشفير Bilstm الموازية، و) جدولة حجم الدفعة التكيفية. في الإعداد المنخفض، تحسن أفضل فرمنا على الأساس، ومع ذلك، في الإعداد المتوسطة، كان الأساس أقوى في المتوسط، على الرغم من أن تحسينات بعض اللغات يمكن ملاحظتها.
توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من ميمي يستخدم غالبا في حملة تضليل للتأثير على المستخدمين.توفر الورقة مقارنة واسعة النطاق بين مختلف أنظمة تعليم الآلات كحل للمهمة.نقوم بتوصيل المعالجة المسبقة للبيانات النصية لصالح المهمة وعدة طرق للتغلب على خلل الفصل.تظهر النتائج أن ضبط نموذج روبرتا يعطى أفضل النتائج مع نقاط F1-Micro من 0.51 على مجموعة التطوير.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا