ترغب بنشر مسار تعليمي؟ اضغط هنا

تمييز الكلمات لتنبؤ المخزون المفردات

Word Discriminations for Vocabulary Inventory Prediction

256   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الهدف من التنبؤ بمفردات المخزون هو التنبؤ بمفردات متعلم كله بناء على عينة محدودة من كلمات الاستعلام.تقترب هذه الورقة عن المشكلة بدءا من نموذج نظرية استجابة البند 2-المعلمة (IRT)، مما يمنح كل كلمة في المفردات معلمة صعوبة والتمييز.يتم تقييم المعلمة التمييز على مشكلة اختيار البند المسئولية الفرعية، مألوفة من مجالات الاختبار التكيفي المحوسب (القط) والتعلم النشط.بعد ذلك، يتم فحص تأثير المعلمة التمييز على أداء التنبؤ، سواء في إعداد تصنيف ثنائي، وفي بيئة استرجاع المعلومات.يتم مقارنة الأداء مع خط الأساس بناء على تردد Word.يتم فحص عدد من سيناريوهات التعميم المختلفة، بما في ذلك صعوبة الكلمة المعممة والتمييز باستخدام Adgeddings Word مع شبكة مؤشر واختبار بيانات خارج مجموعة البيانات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

خلال مرحلة التوصيل الدقيقة للتعلم، لا يزال المفردات المسبدة مسبقا دون تغيير، في حين يتم تحديث المعلمات النموذجية.المفردات الناتجة بناء على البيانات المحددة مسبقا هي فرعية نفسية للبيانات المصب عند وجود تناقض المجال.نقترح النظر في المفردات كمعلمة قابلة للتحسين، مما يسمح لنا بتحديث المفردات من خلال توسيعها مع المفردات المحددة للمجال بناء على إحصاء التكتيف.علاوة على ذلك، نحافظ على تضيير الكلمات المضافة من التجاوز إلى البيانات المصب عن طريق الاستفادة من المعرفة المستفادة من نموذج لغة مسبق مع مصطلح التنظيم.حققت طريقتنا تحسينات أداء ثابتة حول مجالات متنوعة (أي، العلوم الطبية الحيوية، علوم الكمبيوتر، الأخبار، والمراجعات).
نقترح مخطط تكييف المفردات المباشر لتوسيع نطاق القدرة اللغوية لنماذج الترجمة متعددة اللغات، مما يمهد الطريق نحو التعلم المستمر الفعال للترجمة الآلية متعددة اللغات.نهجنا مناسب لمجموعات البيانات واسعة النطاق، ينطبق على اللغات البعيدة مع البرامج النصية غ ير المرئية، وتحتل التدهور البسيط فقط على أداء الترجمة لأزواج اللغة الأصلية ويوفر أداء تنافسي حتى في الحالة التي نمتلك فيها بيانات أحادية الألوان فقط للغات الجديدة.
تصف هذه الورقة نظامنا للمهمة 4 من Semeval-2021: قراءة الفهم من معنى مجردة (Recam).شاركنا في جميع المهام الفرعية حيث كان الهدف الرئيسي هو التنبؤ بكلمة مجردة مفقودة من بيان.نحن نضرب نماذج اللغة الملثمين المدربة مسبقا وهي بيرت وألبرت واستخدمت فرقة لهؤلا ء كأنها نظامنا المقدمة على المراكز الفرعية 1 (إعادة التقييم - عقيدة) و Subtask 2 (إعادة التقييد - غير المعقدة).بالنسبة إلى Subtask 3 (تقاطع إعادة التقييد)، أرسلنا نموذج ألبرت لأنه يعطي أفضل النتائج.حاولنا نهج متعددة وجدنا أن النهج القائم على نمذجة اللغة الملثم (MLM) يعمل الأفضل.
أصبحت النماذج القائمة على المحولات القياسية الفعلية في مجال معالجة اللغة الطبيعية (NLP).من خلال الاستفادة من نصائح النص غير المستمر الكبيرة، فإنها تمكن من التعلم الفعال للتحويل المؤدي إلى نتائج أحدث النتائج في العديد من مهام NLP.ومع ذلك، بالنسبة إلى لغات الموارد المنخفضة والمهام المتخصصة للغاية، تميل نماذج المحولات إلى التخلف عن الأساليب الكلاسيكية أكثر (على سبيل المثال SVM، LSTM) بسبب الافتقار إلى كورسا المذكور أعلاه.في هذه الورقة نركز على المجال القانوني ونحن نقدم نموذج برت روماني مدربا مسبقا على كوربوس متخصص كبير.تتفوق نموذجنا على العديد من خطوط خطوط خطوط خطوط خطوط خطية قوية للتنبؤ بالحكم القانوني على شركتين مختلفين تتكون من حالات من المحاكمات التي تنطوي على البنوك في رومانيا.
هناك مصلحة ناشئة في تطبيق نماذج معالجة اللغة الطبيعية لمهام معالجة التعليمات البرمجية المصدر.أحد المشاكل الرئيسية في تطبيق التعلم العميق لهندسة البرمجيات هو أن الكود المصدري غالبا ما يحتوي على الكثير من المعرفات النادرة، مما يؤدي إلى مفردات ضخمة.نقتر ح طريقة بسيطة، ولكنها فعالة، بناء على معرفة الهوية المعرفية، للتعامل مع المعرفات خارج المفردات (OOV).يمكن التعامل مع طريقتنا كخطوة مسبقة مسبقا، وبالتالي، تسمح بتنفيذ سهولة.نظرا لأن طريقة إخفاء مصطلحات OOV المقترحة تحسن بشكل كبير من أداء المحول في مهام معالجة التعليمات البرمجية: إكمال التعليمات البرمجية وإصلاح الأخطاء.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا