ترغب بنشر مسار تعليمي؟ اضغط هنا

CS60075 \ _team2 في مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي باستخدام نماذج اللغة المستندة إلى المحولات المدربين مسبقا على مختلف النص

cs60075\_team2 at SemEval-2021 Task 1 : Lexical Complexity Prediction using Transformer-based Language Models pre-trained on various text corpora

257   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المساهمة الرئيسية لهذه الورقة هي نماذج اللغات القائمة على Tune-Tune - مدربة مسبقا على العديد من النصوص، وبعضها عام (على سبيل المثال، ويكيبيديا، bookscorpus)، وبعضها يجري شركة DataSet المعقدة، والبعض الآخر يجريمن مجالات محددة أخرى مثل التمويل والقانون، إلخ. نقوم بإجراء دراسات الاجتثاث حول اختيار طرازات المحولات وكيف يتم تجميع درجات تعقيدها الفردية للحصول على درجات التعقيد الناتجة.لدينا طريقة تحقق أفضل ارتباط بيرنسي ب 0.784 في المهمة الفرعية 1 (كلمة واحدة) و 0.836 في المهمة الفرعية 2 (تعبيرات كلمات متعددة).



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة نظام مقدم من فريق Biggreen إلى LCP 2021 للتنبؤ بالتعقيد المعجمي للكلمات الإنجليزية في سياق معين.نحن نكرب نموذجا يعتمد على الهندسة مع نموذج شبكة عصبي عميق تأسست على بيرتف.بينما ينفذ بيرت نفسها بشكل تنافسي، فإن نموذجنا القائم على الهندسة يساعد في الحالات القصوى، على سبيل المثال.فصل حالات الصعوبة السهلة والمحايدة.تضم ميزاتنا المصنوعة يدويا اتساعا من التدابير الصوفية المعجمية والدلية والمعنية والرواية.تقدم تصورات خرائط بيرت اهتماما نظرة ثاقبة للميزات المحتملة التي قد تتعلمها نماذج المحولات عند ضبطها من أجل تنبؤ التعقيد المعجمي.تنقيح تنبؤاتنا المعقولة بشكل معقول بالنسبة للكلمة الفرعية الواحدة، ونظهر كيف يمكن تسخيرها لأداء الاستاحا الفرعي للتعبير المتعدد الآن.
تنقل تنبؤ التعقيد المعجمي (LCP) باحسن مستوى تعقيد رمز رمزي أو مجموعة من الرموز في جملة.يلعب دورا حيويا في تحسين مهام NLP المختلفة بما في ذلك التبسيط المعجمي والترجمات وتوليد النص.ومع ذلك، فإن المعنى المتعدد لكلمة في ظروف متعددة، وهيكل مجمع نحوي، والا عتماد المتبادل للكلمات في جملة تجعل من الصعب تقدير التعقيد المعجمي.لمعالجة هذه التحديات، قدمت مهمة Semeval-2021 1 مهمة مشتركة تركز على LCP وتعرض هذه الورقة مشاركتنا في هذه المهمة.اقترحنا نهجا قائم على المحولات مع انحدار زوج الجملة.نحن عملنا نماذج محول صعبة ضبطها.بما في ذلك بيرت وروبرتا لتدريب نموذجنا وصماماتها المتوقعة لتقدير التعقيد.توضح النتائج التجريبية أن طريقةنا المقترحة تحققت أداء تنافسي مقارنة بنظم المشاركين.
تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم ة (MWES) فيما يتعلق بعقودها باستخدام مقياس Likert خمس نقاط.Semeval-2021 المهمة 1 الممتازة بمهام فرعية: المهمة الفرعية 1 التي تركز على الكلمات الفرعية والمهمة الفرعية 2 التي تركز على mwes.اجتذبت المنافسة 198 فريقا في المجموع، منها 54 فريقا قدم رسميا يدير في بيانات الاختبار إلى المهمة الفرعية 1 و 37 إلى المهمة الفرعية 2.
في هذه المساهمة، وصفنا النظام الذي قدمه فريق Polyu CBS-Comp في المهمة 1 من Semeval 2021، حيث كان الهدف هو تقدير تعقيد الكلمات في سياق عقوبة معينة.نظامنا العلوي، بناء على مزيج من ميزات المعجميات والجنسية، والكلمات الميزات والمشتقات المحولات وعلى زيادة التراجع، يحقق درجة الارتباط أعلى من 0.754 على التراكب الفرعي 1 للكلمات الفردية و 0.659 على المراكب الفرعي 2 لتعبيرات متعددة الكلماتوبعد
تصف هذه الورقة تقديمنا إلى المهمة المشتركة Semeval-2021 بشأن تنبؤ التعقيد المعجمي.اتصلنا بمثابة مشكلة في الانحدار وتقديم مجموعة فرقة تجمع بين أربعة أنظمة، واحدة مقرها ومميزة مقرها وثلاثة عصبي مع التعلم الدقيق والتردد المسبق والتعلم متعدد المهام، وتحق يق درجات بيرسون من 0.8264 و 0.7556 في مجموعات المحاكمة والاختبارعلى التوالي (المهمة الفرعية 1).ونحن نقدم أيضا تحليلنا للنتائج ومناقشة نتائجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا