ترغب بنشر مسار تعليمي؟ اضغط هنا

CSECU-DSG في مهمة Semeval-2021 1: الانصهار من نماذج المحولات لتنبؤ التعقيد المعجمي

CSECU-DSG at SemEval-2021 Task 1: Fusion of Transformer Models for Lexical Complexity Prediction

318   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تنقل تنبؤ التعقيد المعجمي (LCP) باحسن مستوى تعقيد رمز رمزي أو مجموعة من الرموز في جملة.يلعب دورا حيويا في تحسين مهام NLP المختلفة بما في ذلك التبسيط المعجمي والترجمات وتوليد النص.ومع ذلك، فإن المعنى المتعدد لكلمة في ظروف متعددة، وهيكل مجمع نحوي، والاعتماد المتبادل للكلمات في جملة تجعل من الصعب تقدير التعقيد المعجمي.لمعالجة هذه التحديات، قدمت مهمة Semeval-2021 1 مهمة مشتركة تركز على LCP وتعرض هذه الورقة مشاركتنا في هذه المهمة.اقترحنا نهجا قائم على المحولات مع انحدار زوج الجملة.نحن عملنا نماذج محول صعبة ضبطها.بما في ذلك بيرت وروبرتا لتدريب نموذجنا وصماماتها المتوقعة لتقدير التعقيد.توضح النتائج التجريبية أن طريقةنا المقترحة تحققت أداء تنافسي مقارنة بنظم المشاركين.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقترح نموذجا مقرا له عناية سياقية مع تدريبات دقيقة على مرحلتين باستخدام روبرتا.أولا، نقوم بإجراء النغمة الجميلة في المرحلة الأولى على Corpus مع روبرتا، بحيث يمكن للنموذج أن يتعلم بعض المعرفة المسبقة المجال.ثم نحصل على التضمين السياقي ب كلمات السياق بناء على التضمين على مستوى الرمز المميز مع النموذج الدقيق.ونحن نستخدم KFOFT التحقق من الصحة للحصول على نماذج K وفرقة لهم للحصول على النتيجة النهائية.أخيرا، نحن نحصل على المركز الثاني في مرحلة التقييم النهائي من المهمة الفرعية 2 مع ارتباط بيرسون ب 0.8575.
تصف هذه الورقة نظام مقدم من فريق Biggreen إلى LCP 2021 للتنبؤ بالتعقيد المعجمي للكلمات الإنجليزية في سياق معين.نحن نكرب نموذجا يعتمد على الهندسة مع نموذج شبكة عصبي عميق تأسست على بيرتف.بينما ينفذ بيرت نفسها بشكل تنافسي، فإن نموذجنا القائم على الهندسة يساعد في الحالات القصوى، على سبيل المثال.فصل حالات الصعوبة السهلة والمحايدة.تضم ميزاتنا المصنوعة يدويا اتساعا من التدابير الصوفية المعجمية والدلية والمعنية والرواية.تقدم تصورات خرائط بيرت اهتماما نظرة ثاقبة للميزات المحتملة التي قد تتعلمها نماذج المحولات عند ضبطها من أجل تنبؤ التعقيد المعجمي.تنقيح تنبؤاتنا المعقولة بشكل معقول بالنسبة للكلمة الفرعية الواحدة، ونظهر كيف يمكن تسخيرها لأداء الاستاحا الفرعي للتعبير المتعدد الآن.
توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده ا باستخدام مقياس ليكرت خمس نقاط.يستخدم نظامنا الانحدار اللوجستي والمجموعة واسعة من الميزات اللغوية (على سبيل المثالنقوم بتحليل تأثير الميزات اللغوية المختلفة على أداء التصنيف ونقوم بتقييم النتائج من حيث الخطأ المطلق، ويعني الخطأ التربيعي، وارتباط بيرسون، وارتباط سبيرمان.
في هذه الورقة، نقترح طريقة لاستدادتها معلومات جملة المعلومات ومعلومات تردد الكلمات الخاصة بمهمة التعقيد ذات التعقيد 1-LCP (LCP). في نظامنا، تأتي معلومات الجملة من نموذج روبرتا، وتأتي معلومات تردد الكلمات من خوارزمية TF-IDF. استخدم Black Block كطبقة م شتركة لتعلم العقوبة ومعلومات تردد الكلمات وصفنا تنفيذ أفضل نظامنا وناقش أساليبنا وتجاربنا في المهمة. تنقسم المهمة المشتركة إلى مهمتين فرعيتين. الهدف من المهام الفرعية هو التنبؤ بعقد كلمة محددة سلفا. تنقسم المهمة المشتركة إلى قسمين فرعيين. الهدف من اثنين من المهن الفرعية هو التنبؤ بعقد كلمة محددة سلفا. مؤشر تقييم المهمة هو معامل الارتباط بيرسون. يحتوي أفضل نظام الأداء لدينا على معاملات ارتباط بيرسون من 0.7434 و 0.8000 في مجموعة اختبار المراكز الفرعية ذات الرمز الفرعي واحد ومجموعة اختبار الترجمة الفرعية متعددة رميات، على التوالي.
نحن تصف أنظمة Utfpr المقدمة إلى تنبؤ التعقيد المعجمي المهمة المشتركة في Semeval 2021. إنهم يقومون بتنبؤ التعقيد من خلال الجمع بين الميزات الكلاسيكية، مثل تردد الكلمة، تردد N-Gram، طول الكلمة، وعدد الحواس، مع ناقلات Bert.نحن نختبر العديد من مجموعات ال ميزات ونماذج تعلم الآلات في تجاربنا وتجد أن ناقلات بيرت، حتى لو لم تكن محسنة للمهمة في متناول اليد، هي مكملة كبيرة للميزات الكلاسيكية.نجد أيضا أن استخدام مبدأ التكوين يمكن أن يساعد في تنبؤ تعقيد العبارة.أنظمتنا تضع 45 من أصل 55 من الكلمات الواحدة والثمانين من أصل 38 للعبارات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا