ترغب بنشر مسار تعليمي؟ اضغط هنا

Stanford Mlab في مهمة Semeval-2021 1: النمذجة القائمة على الأشجار من التعقيد المعجمي باستخدام Word Embeddings

Stanford MLab at SemEval-2021 Task 1: Tree-Based Modelling of Lexical Complexity using Word Embeddings

304   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة نظامنا لمهام تنبؤ التعقيد المعجمية الواحدة والمتعددية لمهمة Semeval 1: تنبؤ التعقيد المعجمي.يعتمد فهم النص على قدرة القارئ على فهم الكلمات الموجودة فيها؛يمكن لتقييم التعقيد المعجمي لهذه النصوص يمكن أن تمكن القراء من العثور على نص وأنظمة مناسبة لتكييف نص لاحتياجات الجمهور.نقدم خط أنابيبنا النموذجي، وهو ما ينطبق على مجموعة من الميزات القائمة على التضمين والتنبؤ بالتعقيد المعجمي على مجموعة بيانات اللغة الإنجليزية المعقدة باستخدام العديد من النماذج القائمة على الأشجار والخطية.تم تصنيف طريقتنا 27/54 على التنبؤ بكلمة واحدة و 14/37 على التنبؤ متعدد الكلمات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم نهجنا في التنبؤ بالتعقيد المعجمي للكلمات في سياقات محددة، على النحو الذي أدخلته المهمة المشتركة LCP 1 في Semeval 2021. يتكون النهج من الجمل الفاصلة إلى قطع أصغر، وتضمينها مع SENT2VEC، وتقليل المدينات إلى متجه أبسط يستخدم كمدخلإلى شبكة عصبية، هذا الأخير للتنبؤ بعقد الكلمات والتعبيرات.تشير النتائج إلى أن تضيير الجملة المدربة مسبقا غير قادرة على التقاط التعقيد المعجمي من اللغة عند تطبيقها في تطبيقات عبر المجال.
إن تقييم تعقيد كلمة مستهدفة في سياق حكومي هو الهدف من مهمة تنبؤ التعقيد المعجمية في Semeval-2021.تقدم هذه الورقة النظام الذي تم إنشاؤه لتقييم تعقيد كلمات واحدة معجمية، والجمع بين المتغيرات اللغوية والنفسية في مجموعة من التجارب التي تنطوي على غابة عشو ائية و XGBOOST Regrations.ما وراء ترميز معلومات خارج السياق حول LEMMA، نفذنا ميزات بناء على نماذج اللغة المدربة مسبقا لنموذج تعقيد الكلمة المستهدف في السياق.
تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم ة (MWES) فيما يتعلق بعقودها باستخدام مقياس Likert خمس نقاط.Semeval-2021 المهمة 1 الممتازة بمهام فرعية: المهمة الفرعية 1 التي تركز على الكلمات الفرعية والمهمة الفرعية 2 التي تركز على mwes.اجتذبت المنافسة 198 فريقا في المجموع، منها 54 فريقا قدم رسميا يدير في بيانات الاختبار إلى المهمة الفرعية 1 و 37 إلى المهمة الفرعية 2.
تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من نماذج التصنيف والانحدار.حقق هذا النهج المضاد بشدة إلى حد ما درجة مياه 0.0654 للمهمة الفرعية 1 و MAE من 0.0811 بشأن المهمة الفرعية 2. بالإضافة إلى ذلك، استخدمنا مفهوم إشارات الإشراف الضعيفة من برت لمعان في عملنا، وتحسن بشكل كبيردرجة ماي في المهمة الفرعية 1.
يهدف العمل الحالي إلى تعيين درجة التعقيد بين 0 و 1 كلمة أو عبارة مستهدفة في جملة معينة.بالنسبة لكل هدف لكلمة واحدة، يتم تدريب Rame Forest Regressor على مجموعة ميزة تتكون من معلومات معجمية ودلالة وندرة حول الهدف.بالنسبة لكل هدف متعدد الكلمات، يتم أخذ مجموعة من ميزات الكلمات الفردية مع تعقيدات كلمة واحدة في مساحة الميزة.أسفر النظام عن ارتباط بيرسون ب 0.7402 و 0.8244 في مجموعة الاختبار للأهداف الفردية ومتعددة الكلمات، على التوالي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا