تصف هذه الورقة تقديمنا إلى مهمة Semeval-2021 1: التنبؤ بدرجة التعقيد لكلمات واحدة.النموذج لدينا يهدف إلى ارتفاع الميزات المورفوسنكتاكيتش والمترددات المستندة إلى التردد التي أثبتت أنها مفيدة لتحديد الكلمات المعقدة (مهمة ذات صلة)، وتجمع بينها مع تنبؤات مصنوعة من النماذج المدربة المستندة إلى المحولات التي تم ضبطها بشكل جيد على بيانات المهام المشتركة.تداولات نظام التقديم لدينا جميع النماذج السابقة مع LightgBM في الأعلى.يتمثل أحد الجدة في نهجنا في استخدام التعلم متعدد المهام لضبط النموذج المدرب مسبقا لكلا التنبؤ في التعقيد المعجمي و disambiguation معنى الكلمة.يوضح تحليلنا أن جميع النماذج المستقلة تحقق أداء جيدا في المهمة، ولكن أن تكديسها يحصل على علاقة بيرسون ب 0.7704، فقط 0.018 نقطة خلف التقديم الفائز.
This paper describes our submission to SemEval-2021 Task 1: predicting the complexity score for single words. Our model leverages standard morphosyntactic and frequency-based features that proved helpful for Complex Word Identification (a related task), and combines them with predictions made by Transformer-based pre-trained models that were fine-tuned on the Shared Task data. Our submission system stacks all previous models with a LightGBM at the top. One novelty of our approach is the use of multi-task learning for fine-tuning a pre-trained model for both Lexical Complexity Prediction and Word Sense Disambiguation. Our analysis shows that all independent models achieve a good performance in the task, but that stacking them obtains a Pearson correlation of 0.7704, merely 0.018 points behind the winning submission.
المراجع المستخدمة
https://aclanthology.org/
تنقل تنبؤ التعقيد المعجمي (LCP) باحسن مستوى تعقيد رمز رمزي أو مجموعة من الرموز في جملة.يلعب دورا حيويا في تحسين مهام NLP المختلفة بما في ذلك التبسيط المعجمي والترجمات وتوليد النص.ومع ذلك، فإن المعنى المتعدد لكلمة في ظروف متعددة، وهيكل مجمع نحوي، والا
توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده
تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم
في هذه الورقة، نصف نظامنا المستخدم في مهمة Semeval 2021 7: hahackathon: الكشف عن الفكاهة والجريمة.استخدمنا نهجا بسيطا للضبط باستخدام نماذج لغة مدربة مسبقا مختلفة (PLMS) لتقييم أدائها للكشف عن الفكاهة والجريمة.بالنسبة لمهام الانحدار، بلغنا متوسط عدد ا
نقترح نموذج فرقة للتنبؤ بالتعقيد المعجمي للكلمات وتعبيرات متعددة الكلمات (MWES).يتلقى النموذج كإدخال جملة بكلمة مستهدفة أو MWE وتخرج درجة التعقيد.بالنظر إلى أن التحدي الرئيسي مع هذه المهمة هو الحجم المحدود للبيانات المشروح، يعتمد نموذجنا على تمثيلات