ترغب بنشر مسار تعليمي؟ اضغط هنا

Ochadai-Kyoto في مهمة Semeval-2021 1: تعزيز التعميم النموذجي والمتانة لتنبؤ التعقيد المعجمي

OCHADAI-KYOTO at SemEval-2021 Task 1: Enhancing Model Generalization and Robustness for Lexical Complexity Prediction

268   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح نموذج فرقة للتنبؤ بالتعقيد المعجمي للكلمات وتعبيرات متعددة الكلمات (MWES).يتلقى النموذج كإدخال جملة بكلمة مستهدفة أو MWE وتخرج درجة التعقيد.بالنظر إلى أن التحدي الرئيسي مع هذه المهمة هو الحجم المحدود للبيانات المشروح، يعتمد نموذجنا على تمثيلات السياقية المحددة مسبقا من نماذج اللغة القائمة على المحولات المختلفة (IE، Bert and Roberta)، وعلى مجموعة متنوعة منطرق التدريب لمزيد من تعزيز التعميم النموذجي والترويج: التعلم متعدد الخطوات من الترابط والتعلم متعدد المهام، والتدريب الخصم.بالإضافة إلى ذلك، نقترح إثراء التمثيلات السياقية بإضافة ميزات مصنوعة يدوية أثناء التدريب.حقق نموذجنا نتائج تنافسية ومرتبة بين أنظمة أفضل 10 في كلتا المهام الفرعية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده ا باستخدام مقياس ليكرت خمس نقاط.يستخدم نظامنا الانحدار اللوجستي والمجموعة واسعة من الميزات اللغوية (على سبيل المثالنقوم بتحليل تأثير الميزات اللغوية المختلفة على أداء التصنيف ونقوم بتقييم النتائج من حيث الخطأ المطلق، ويعني الخطأ التربيعي، وارتباط بيرسون، وارتباط سبيرمان.
تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم ة (MWES) فيما يتعلق بعقودها باستخدام مقياس Likert خمس نقاط.Semeval-2021 المهمة 1 الممتازة بمهام فرعية: المهمة الفرعية 1 التي تركز على الكلمات الفرعية والمهمة الفرعية 2 التي تركز على mwes.اجتذبت المنافسة 198 فريقا في المجموع، منها 54 فريقا قدم رسميا يدير في بيانات الاختبار إلى المهمة الفرعية 1 و 37 إلى المهمة الفرعية 2.
تنقل تنبؤ التعقيد المعجمي (LCP) باحسن مستوى تعقيد رمز رمزي أو مجموعة من الرموز في جملة.يلعب دورا حيويا في تحسين مهام NLP المختلفة بما في ذلك التبسيط المعجمي والترجمات وتوليد النص.ومع ذلك، فإن المعنى المتعدد لكلمة في ظروف متعددة، وهيكل مجمع نحوي، والا عتماد المتبادل للكلمات في جملة تجعل من الصعب تقدير التعقيد المعجمي.لمعالجة هذه التحديات، قدمت مهمة Semeval-2021 1 مهمة مشتركة تركز على LCP وتعرض هذه الورقة مشاركتنا في هذه المهمة.اقترحنا نهجا قائم على المحولات مع انحدار زوج الجملة.نحن عملنا نماذج محول صعبة ضبطها.بما في ذلك بيرت وروبرتا لتدريب نموذجنا وصماماتها المتوقعة لتقدير التعقيد.توضح النتائج التجريبية أن طريقةنا المقترحة تحققت أداء تنافسي مقارنة بنظم المشاركين.
في هذه الورقة، نقترح نموذجا مقرا له عناية سياقية مع تدريبات دقيقة على مرحلتين باستخدام روبرتا.أولا، نقوم بإجراء النغمة الجميلة في المرحلة الأولى على Corpus مع روبرتا، بحيث يمكن للنموذج أن يتعلم بعض المعرفة المسبقة المجال.ثم نحصل على التضمين السياقي ب كلمات السياق بناء على التضمين على مستوى الرمز المميز مع النموذج الدقيق.ونحن نستخدم KFOFT التحقق من الصحة للحصول على نماذج K وفرقة لهم للحصول على النتيجة النهائية.أخيرا، نحن نحصل على المركز الثاني في مرحلة التقييم النهائي من المهمة الفرعية 2 مع ارتباط بيرسون ب 0.8575.
في هذه المساهمة، وصفنا النظام الذي قدمه فريق Polyu CBS-Comp في المهمة 1 من Semeval 2021، حيث كان الهدف هو تقدير تعقيد الكلمات في سياق عقوبة معينة.نظامنا العلوي، بناء على مزيج من ميزات المعجميات والجنسية، والكلمات الميزات والمشتقات المحولات وعلى زيادة التراجع، يحقق درجة الارتباط أعلى من 0.754 على التراكب الفرعي 1 للكلمات الفردية و 0.659 على المراكب الفرعي 2 لتعبيرات متعددة الكلماتوبعد

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا