في هذه الورقة، نقدم أنظمتنا المقدمة إلى مهمة Semeval-2021 1 بشأن تنبؤ التعقيد المعجمي. وكان الهدف من هذه المهمة المشتركة هو إنشاء أنظمة قادرة على التنبؤ بالتعقيد المعجمي لرموز الرموز Word وبرامج Bigram متعددة الكلمات داخل سياق جملة معطى، أالقيمة المستمرة تشير إلى الصعوبة في فهم الكلام المعني.تعتمد نهجنا على مجموعة من مجموعات الانحدار المتدرج المجهزة باستخدام ميزة غير متجانسة تم تعيينها بين الميزات اللغوية، ومظلات الكلمة الثابتة والسياقية، وتعاونية نفسية المعيار، وتردد Wordnet، و Word- وشخصية Bigram وإدراجه وإدراجه في نصوص الكلمات لإنشاء نموذج قادر على تعيين كلمة قادرة على تعيين كلمة قادرة على تعيين كلمة واحدةأو تعبير متعدد الكلمات تعبير تعقيد تعتمد على السياق.يمكننا أن نظهر أنه يمكن أن تساعد تضمين السلسلة السياقية بشكل خاص في التنبؤ بالتعقيد المعجمي.
In this paper, we present our systems submitted to SemEval-2021 Task 1 on lexical complexity prediction.The aim of this shared task was to create systems able to predict the lexical complexity of word tokens and bigram multiword expressions within a given sentence context, a continuous value indicating the difficulty in understanding a respective utterance. Our approach relies on gradient boosted regression tree ensembles fitted using a heterogeneous feature set combining linguistic features, static and contextualized word embeddings, psycholinguistic norm lexica, WordNet, word- and character bigram frequencies and inclusion in wordlists to create a model able to assign a word or multiword expression a context-dependent complexity score. We can show that especially contextualised string embeddings can help with predicting lexical complexity.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من
نقدم نهجنا في التنبؤ بالتعقيد المعجمي للكلمات في سياقات محددة، على النحو الذي أدخلته المهمة المشتركة LCP 1 في Semeval 2021. يتكون النهج من الجمل الفاصلة إلى قطع أصغر، وتضمينها مع SENT2VEC، وتقليل المدينات إلى متجه أبسط يستخدم كمدخلإلى شبكة عصبية، هذا
في هذه الورقة، نقدم ثلاثة أنظمة مختلفة للإشراف على تنبؤ التعقيد المعجمي باللغة الإنجليزية للتعبيرات الفردية والمتعددة المهام ل Semeval-2021.الرمز المستهدف في السياق.تجمع أفضل نظامنا بين المعلومات من هذه المصادر الثلاث.تشير النتائج إلى أن المعلومات ال
يهدف العمل الحالي إلى تعيين درجة التعقيد بين 0 و 1 كلمة أو عبارة مستهدفة في جملة معينة.بالنسبة لكل هدف لكلمة واحدة، يتم تدريب Rame Forest Regressor على مجموعة ميزة تتكون من معلومات معجمية ودلالة وندرة حول الهدف.بالنسبة لكل هدف متعدد الكلمات، يتم أخذ
تصف هذه الورقة تقديمنا إلى المهمة المشتركة Semeval-2021 بشأن تنبؤ التعقيد المعجمي.اتصلنا بمثابة مشكلة في الانحدار وتقديم مجموعة فرقة تجمع بين أربعة أنظمة، واحدة مقرها ومميزة مقرها وثلاثة عصبي مع التعلم الدقيق والتردد المسبق والتعلم متعدد المهام، وتحق