أخيرا في مهمة Semeval-2021 1: تحسين تنبؤ التعقيد متعدد الكلمات باستخدام تدابير جمعية Bigram


الملخص بالعربية

تصف هذه الورقة النظام الذي طورته STATISTICK DES TESSSES (أخيرا) ل TETISTIVER DES TESSES (LAST) من أجل تعقيد التعقيد المعجمي المهمة المشتركة في Semeval-2021.يتكون النظام المقترح من نموذج LightgBM يتغذى مع ميزات تم الحصول عليها من العديد من قوائم تردد Word، والمعايير المعجمية المنشورة والبيانات السيكلية.لمعالجة خصوصية المهمة المتعددة الكلمة، فإنه يستخدم تدابير جمعية Bigram.على الرغم من أن الميزة السياقية الوحيدة المستخدمة كانت طول الجملة، حقق النظام أداء مشرف في المهمة المتعددة الكلمة، ولكن أكثر فقرا في مهمة كلمة واحدة.تم العثور على تدابير جمعية بيجرام مفيدة، ولكن إلى حد محدود.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث