تتميز هذه المراجعات الورقية بهذه الأساليب الهندسية للتنبؤ بمستوى تعقيد الكلمات الإنجليزية في سياق معين باستخدام تقنيات الانحدار.احتلت أفضل طلب لدينا في مهمة التعقيد المعجمية (LCP) المرتبة الثالثة من 48 شركة للمهمة الفرعية 1 وحققت معاملات ارتباط بيرسون من 0.779 و 0.809 لكلمات واحدة وتعبيرات متعددة الكلمات على التوالي.الاستنتاج هو أن مزيج من الميزات المعجمية والسياقية والدلية لا يزال بإمكانه إنتاج خطوط خطوط خطوط خطوط قوية عند مقارنتها ضد الحكم الإنساني.
This paper revisits feature engineering approaches for predicting the complexity level of English words in a particular context using regression techniques. Our best submission to the Lexical Complexity Prediction (LCP) shared task was ranked 3rd out of 48 systems for sub-task 1 and achieved Pearson correlation coefficients of 0.779 and 0.809 for single words and multi-word expressions respectively. The conclusion is that a combination of lexical, contextual and semantic features can still produce strong baselines when compared against human judgement.
المراجع المستخدمة
https://aclanthology.org/
توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده
في هذه الورقة، نقترح طريقة لاستدادتها معلومات جملة المعلومات ومعلومات تردد الكلمات الخاصة بمهمة التعقيد ذات التعقيد 1-LCP (LCP). في نظامنا، تأتي معلومات الجملة من نموذج روبرتا، وتأتي معلومات تردد الكلمات من خوارزمية TF-IDF. استخدم Black Block كطبقة م
تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم
في هذه المساهمة، وصفنا النظام الذي قدمه فريق Polyu CBS-Comp في المهمة 1 من Semeval 2021، حيث كان الهدف هو تقدير تعقيد الكلمات في سياق عقوبة معينة.نظامنا العلوي، بناء على مزيج من ميزات المعجميات والجنسية، والكلمات الميزات والمشتقات المحولات وعلى زيادة
تصف هذه الورقة نظام مقدم من فريق Biggreen إلى LCP 2021 للتنبؤ بالتعقيد المعجمي للكلمات الإنجليزية في سياق معين.نحن نكرب نموذجا يعتمد على الهندسة مع نموذج شبكة عصبي عميق تأسست على بيرتف.بينما ينفذ بيرت نفسها بشكل تنافسي، فإن نموذجنا القائم على الهندسة