توضح هذه المقالة نظاما للتنبؤ بمهمة تقوية التعقيد المعجمية (LCP) التي تم استضافتها في Semeval 2021 (المهمة 1) مع مجموعة بيانات جديدة مشروحة مع مقياس Likert.يقع المهمة في مسار الدلالات المعجمية، وتألفت المهمة من التنبؤ بقيمة تعقيد الكلمات في السياق.تم تنفيذ نهج لتعلم الآلات بناء على تواتر الكلمات والعديد من الخصائص المضافة على مستوى Word.على هذه الميزات، تم تدريب خوارزمية الانحدار الغابات العشوائية الخاضعة للإشراف.تم إجراء عدة أشواط بقيم مختلفة لمراقبة أداء الخوارزمية.للتقييم، أبلغت أفضل النتائج الخاصة بنا عن درجة M.A.E 0.07347، M.S.E.من 0.00938، و R.M.S.E.من 0.096871.أظهرت تجاربنا أنه مع عدد أكبر من الخصائص، فإن دقة التصنيف تزداد.
This article describes a system to predict the complexity of words for the Lexical Complexity Prediction (LCP) shared task hosted at SemEval 2021 (Task 1) with a new annotated English dataset with a Likert scale. Located in the Lexical Semantics track, the task consisted of predicting the complexity value of the words in context. A machine learning approach was carried out based on the frequency of the words and several characteristics added at word level. Over these features, a supervised random forest regression algorithm was trained. Several runs were performed with different values to observe the performance of the algorithm. For the evaluation, our best results reported a M.A.E score of 0.07347, M.S.E. of 0.00938, and R.M.S.E. of 0.096871. Our experiments showed that, with a greater number of characteristics, the precision of the classification increases.
المراجع المستخدمة
https://aclanthology.org/
نقدم شبكتين نفعي نفعي للتنبؤ بتعقيد الكلمات والعبارات في السياق على نطاق مستمر.كلا النموذجين يستخدم كلا الكلمة والشخصيات إلى جانب ميزات معجمية كمدخلات.يعرض نظامنا نتائج معقولة مع ارتباط بيرسون من 0.7754 في المهمة ككل.نحن نسلط الضوء على قيود هذه الطري
تقدم هذه الورقة نظامنا لمهام تنبؤ التعقيد المعجمية الواحدة والمتعددية لمهمة Semeval 1: تنبؤ التعقيد المعجمي.يعتمد فهم النص على قدرة القارئ على فهم الكلمات الموجودة فيها؛يمكن لتقييم التعقيد المعجمي لهذه النصوص يمكن أن تمكن القراء من العثور على نص وأنظ
تصف هذه الورقة النظام الذي طورته STATISTICK DES TESSSES (أخيرا) ل TETISTIVER DES TESSES (LAST) من أجل تعقيد التعقيد المعجمي المهمة المشتركة في Semeval-2021.يتكون النظام المقترح من نموذج LightgBM يتغذى مع ميزات تم الحصول عليها من العديد من قوائم تردد
تصف هذه الورقة أنظمة المقدمة إلى المهمة SE-MEVAL 2021 1: تنبؤ التعقيد المعجمي (LCP).نقارن نماذج الانحدار الخطية وغير الخطية المدربة للعمل في كلا المسارين للمهمة.نظرا لأن كلا النظامين قادرين على التعميم بشكل أفضل عند توفير معلومات حول تعقيدات كلمة واح
تتميز هذه المراجعات الورقية بهذه الأساليب الهندسية للتنبؤ بمستوى تعقيد الكلمات الإنجليزية في سياق معين باستخدام تقنيات الانحدار.احتلت أفضل طلب لدينا في مهمة التعقيد المعجمية (LCP) المرتبة الثالثة من 48 شركة للمهمة الفرعية 1 وحققت معاملات ارتباط بيرسو