الهدف من التنبؤ بمفردات المخزون هو التنبؤ بمفردات متعلم كله بناء على عينة محدودة من كلمات الاستعلام.تقترب هذه الورقة عن المشكلة بدءا من نموذج نظرية استجابة البند 2-المعلمة (IRT)، مما يمنح كل كلمة في المفردات معلمة صعوبة والتمييز.يتم تقييم المعلمة التمييز على مشكلة اختيار البند المسئولية الفرعية، مألوفة من مجالات الاختبار التكيفي المحوسب (القط) والتعلم النشط.بعد ذلك، يتم فحص تأثير المعلمة التمييز على أداء التنبؤ، سواء في إعداد تصنيف ثنائي، وفي بيئة استرجاع المعلومات.يتم مقارنة الأداء مع خط الأساس بناء على تردد Word.يتم فحص عدد من سيناريوهات التعميم المختلفة، بما في ذلك صعوبة الكلمة المعممة والتمييز باستخدام Adgeddings Word مع شبكة مؤشر واختبار بيانات خارج مجموعة البيانات.
The aim of vocabulary inventory prediction is to predict a learner's whole vocabulary based on a limited sample of query words. This paper approaches the problem starting from the 2-parameter Item Response Theory (IRT) model, giving each word in the vocabulary a difficulty and discrimination parameter. The discrimination parameter is evaluated on the sub-problem of question item selection, familiar from the fields of Computerised Adaptive Testing (CAT) and active learning. Next, the effect of the discrimination parameter on prediction performance is examined, both in a binary classification setting, and in an information retrieval setting. Performance is compared with baselines based on word frequency. A number of different generalisation scenarios are examined, including generalising word difficulty and discrimination using word embeddings with a predictor network and testing on out-of-dataset data.
المراجع المستخدمة
https://aclanthology.org/
خلال مرحلة التوصيل الدقيقة للتعلم، لا يزال المفردات المسبدة مسبقا دون تغيير، في حين يتم تحديث المعلمات النموذجية.المفردات الناتجة بناء على البيانات المحددة مسبقا هي فرعية نفسية للبيانات المصب عند وجود تناقض المجال.نقترح النظر في المفردات كمعلمة قابلة
نقترح مخطط تكييف المفردات المباشر لتوسيع نطاق القدرة اللغوية لنماذج الترجمة متعددة اللغات، مما يمهد الطريق نحو التعلم المستمر الفعال للترجمة الآلية متعددة اللغات.نهجنا مناسب لمجموعات البيانات واسعة النطاق، ينطبق على اللغات البعيدة مع البرامج النصية غ
تصف هذه الورقة نظامنا للمهمة 4 من Semeval-2021: قراءة الفهم من معنى مجردة (Recam).شاركنا في جميع المهام الفرعية حيث كان الهدف الرئيسي هو التنبؤ بكلمة مجردة مفقودة من بيان.نحن نضرب نماذج اللغة الملثمين المدربة مسبقا وهي بيرت وألبرت واستخدمت فرقة لهؤلا
أصبحت النماذج القائمة على المحولات القياسية الفعلية في مجال معالجة اللغة الطبيعية (NLP).من خلال الاستفادة من نصائح النص غير المستمر الكبيرة، فإنها تمكن من التعلم الفعال للتحويل المؤدي إلى نتائج أحدث النتائج في العديد من مهام NLP.ومع ذلك، بالنسبة إلى
هناك مصلحة ناشئة في تطبيق نماذج معالجة اللغة الطبيعية لمهام معالجة التعليمات البرمجية المصدر.أحد المشاكل الرئيسية في تطبيق التعلم العميق لهندسة البرمجيات هو أن الكود المصدري غالبا ما يحتوي على الكثير من المعرفات النادرة، مما يؤدي إلى مفردات ضخمة.نقتر