ترغب بنشر مسار تعليمي؟ اضغط هنا

Tuda-CCL في مهمة Semeval-2021: استخدام مجموعات شجرة الانحدار المزدوجة للتدرج المدربين على ميزة غير متجانسة مجموعة للتنبؤ بالتعقيد المعجمي

TUDA-CCL at SemEval-2021 Task 1: Using Gradient-boosted Regression Tree Ensembles Trained on a Heterogeneous Feature Set for Predicting Lexical Complexity

79   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم أنظمتنا المقدمة إلى مهمة Semeval-2021 1 بشأن تنبؤ التعقيد المعجمي. وكان الهدف من هذه المهمة المشتركة هو إنشاء أنظمة قادرة على التنبؤ بالتعقيد المعجمي لرموز الرموز Word وبرامج Bigram متعددة الكلمات داخل سياق جملة معطى، أالقيمة المستمرة تشير إلى الصعوبة في فهم الكلام المعني.تعتمد نهجنا على مجموعة من مجموعات الانحدار المتدرج المجهزة باستخدام ميزة غير متجانسة تم تعيينها بين الميزات اللغوية، ومظلات الكلمة الثابتة والسياقية، وتعاونية نفسية المعيار، وتردد Wordnet، و Word- وشخصية Bigram وإدراجه وإدراجه في نصوص الكلمات لإنشاء نموذج قادر على تعيين كلمة قادرة على تعيين كلمة قادرة على تعيين كلمة واحدةأو تعبير متعدد الكلمات تعبير تعقيد تعتمد على السياق.يمكننا أن نظهر أنه يمكن أن تساعد تضمين السلسلة السياقية بشكل خاص في التنبؤ بالتعقيد المعجمي.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من نماذج التصنيف والانحدار.حقق هذا النهج المضاد بشدة إلى حد ما درجة مياه 0.0654 للمهمة الفرعية 1 و MAE من 0.0811 بشأن المهمة الفرعية 2. بالإضافة إلى ذلك، استخدمنا مفهوم إشارات الإشراف الضعيفة من برت لمعان في عملنا، وتحسن بشكل كبيردرجة ماي في المهمة الفرعية 1.
نقدم نهجنا في التنبؤ بالتعقيد المعجمي للكلمات في سياقات محددة، على النحو الذي أدخلته المهمة المشتركة LCP 1 في Semeval 2021. يتكون النهج من الجمل الفاصلة إلى قطع أصغر، وتضمينها مع SENT2VEC، وتقليل المدينات إلى متجه أبسط يستخدم كمدخلإلى شبكة عصبية، هذا الأخير للتنبؤ بعقد الكلمات والتعبيرات.تشير النتائج إلى أن تضيير الجملة المدربة مسبقا غير قادرة على التقاط التعقيد المعجمي من اللغة عند تطبيقها في تطبيقات عبر المجال.
في هذه الورقة، نقدم ثلاثة أنظمة مختلفة للإشراف على تنبؤ التعقيد المعجمي باللغة الإنجليزية للتعبيرات الفردية والمتعددة المهام ل Semeval-2021.الرمز المستهدف في السياق.تجمع أفضل نظامنا بين المعلومات من هذه المصادر الثلاث.تشير النتائج إلى أن المعلومات ال واردة من نماذج اللغة الملثمين ويمكن دمج ترميز مستوى الطابع لتحسين تنبؤ التعقيد المعجمي.
يهدف العمل الحالي إلى تعيين درجة التعقيد بين 0 و 1 كلمة أو عبارة مستهدفة في جملة معينة.بالنسبة لكل هدف لكلمة واحدة، يتم تدريب Rame Forest Regressor على مجموعة ميزة تتكون من معلومات معجمية ودلالة وندرة حول الهدف.بالنسبة لكل هدف متعدد الكلمات، يتم أخذ مجموعة من ميزات الكلمات الفردية مع تعقيدات كلمة واحدة في مساحة الميزة.أسفر النظام عن ارتباط بيرسون ب 0.7402 و 0.8244 في مجموعة الاختبار للأهداف الفردية ومتعددة الكلمات، على التوالي.
تصف هذه الورقة تقديمنا إلى المهمة المشتركة Semeval-2021 بشأن تنبؤ التعقيد المعجمي.اتصلنا بمثابة مشكلة في الانحدار وتقديم مجموعة فرقة تجمع بين أربعة أنظمة، واحدة مقرها ومميزة مقرها وثلاثة عصبي مع التعلم الدقيق والتردد المسبق والتعلم متعدد المهام، وتحق يق درجات بيرسون من 0.8264 و 0.7556 في مجموعات المحاكمة والاختبارعلى التوالي (المهمة الفرعية 1).ونحن نقدم أيضا تحليلنا للنتائج ومناقشة نتائجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا