ترغب بنشر مسار تعليمي؟ اضغط هنا

التعرف على الكلمات المعقدة باستخدام ميزات مستوى Word-Level لمهمة Semeval-2020 1

Complex words identification using word-level features for SemEval-2020 Task 1

292   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توضح هذه المقالة نظاما للتنبؤ بمهمة تقوية التعقيد المعجمية (LCP) التي تم استضافتها في Semeval 2021 (المهمة 1) مع مجموعة بيانات جديدة مشروحة مع مقياس Likert.يقع المهمة في مسار الدلالات المعجمية، وتألفت المهمة من التنبؤ بقيمة تعقيد الكلمات في السياق.تم تنفيذ نهج لتعلم الآلات بناء على تواتر الكلمات والعديد من الخصائص المضافة على مستوى Word.على هذه الميزات، تم تدريب خوارزمية الانحدار الغابات العشوائية الخاضعة للإشراف.تم إجراء عدة أشواط بقيم مختلفة لمراقبة أداء الخوارزمية.للتقييم، أبلغت أفضل النتائج الخاصة بنا عن درجة M.A.E 0.07347، M.S.E.من 0.00938، و R.M.S.E.من 0.096871.أظهرت تجاربنا أنه مع عدد أكبر من الخصائص، فإن دقة التصنيف تزداد.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم شبكتين نفعي نفعي للتنبؤ بتعقيد الكلمات والعبارات في السياق على نطاق مستمر.كلا النموذجين يستخدم كلا الكلمة والشخصيات إلى جانب ميزات معجمية كمدخلات.يعرض نظامنا نتائج معقولة مع ارتباط بيرسون من 0.7754 في المهمة ككل.نحن نسلط الضوء على قيود هذه الطري قة في تقييم سياق النص المستهدف بشكل صحيح، واستكشاف فعالية كل من النظم عبر مجموعة من الأنواع.تم تقديم كلا النموذجين كجزء من LCP 2021، والذي يركز على تحديد الكلمات والعبارات المعقدة باعتبارها مهمة تعتمد على السياق، وهي مهمة قائمة على الانحدار.
تقدم هذه الورقة نظامنا لمهام تنبؤ التعقيد المعجمية الواحدة والمتعددية لمهمة Semeval 1: تنبؤ التعقيد المعجمي.يعتمد فهم النص على قدرة القارئ على فهم الكلمات الموجودة فيها؛يمكن لتقييم التعقيد المعجمي لهذه النصوص يمكن أن تمكن القراء من العثور على نص وأنظ مة مناسبة لتكييف نص لاحتياجات الجمهور.نقدم خط أنابيبنا النموذجي، وهو ما ينطبق على مجموعة من الميزات القائمة على التضمين والتنبؤ بالتعقيد المعجمي على مجموعة بيانات اللغة الإنجليزية المعقدة باستخدام العديد من النماذج القائمة على الأشجار والخطية.تم تصنيف طريقتنا 27/54 على التنبؤ بكلمة واحدة و 14/37 على التنبؤ متعدد الكلمات.
تصف هذه الورقة النظام الذي طورته STATISTICK DES TESSSES (أخيرا) ل TETISTIVER DES TESSES (LAST) من أجل تعقيد التعقيد المعجمي المهمة المشتركة في Semeval-2021.يتكون النظام المقترح من نموذج LightgBM يتغذى مع ميزات تم الحصول عليها من العديد من قوائم تردد Word، والمعايير المعجمية المنشورة والبيانات السيكلية.لمعالجة خصوصية المهمة المتعددة الكلمة، فإنه يستخدم تدابير جمعية Bigram.على الرغم من أن الميزة السياقية الوحيدة المستخدمة كانت طول الجملة، حقق النظام أداء مشرف في المهمة المتعددة الكلمة، ولكن أكثر فقرا في مهمة كلمة واحدة.تم العثور على تدابير جمعية بيجرام مفيدة، ولكن إلى حد محدود.
تصف هذه الورقة أنظمة المقدمة إلى المهمة SE-MEVAL 2021 1: تنبؤ التعقيد المعجمي (LCP).نقارن نماذج الانحدار الخطية وغير الخطية المدربة للعمل في كلا المسارين للمهمة.نظرا لأن كلا النظامين قادرين على التعميم بشكل أفضل عند توفير معلومات حول تعقيدات كلمة واح دة ويعتبر التعبير المتعدد الكلمة (MWE) في وقت واحد.أثبت هذا النهج أنه الأكثر فائدة لأهداف التعبير المتعددة الكلمة.نوضح أيضا أن بعض الميزات المصنوعة يدويا تختلف في أهميتها للأنواع المستهدفة.
تتميز هذه المراجعات الورقية بهذه الأساليب الهندسية للتنبؤ بمستوى تعقيد الكلمات الإنجليزية في سياق معين باستخدام تقنيات الانحدار.احتلت أفضل طلب لدينا في مهمة التعقيد المعجمية (LCP) المرتبة الثالثة من 48 شركة للمهمة الفرعية 1 وحققت معاملات ارتباط بيرسو ن من 0.779 و 0.809 لكلمات واحدة وتعبيرات متعددة الكلمات على التوالي.الاستنتاج هو أن مزيج من الميزات المعجمية والسياقية والدلية لا يزال بإمكانه إنتاج خطوط خطوط خطوط خطوط قوية عند مقارنتها ضد الحكم الإنساني.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا