ترغب بنشر مسار تعليمي؟ اضغط هنا

استرجاع النص لمتعلمي اللغة: مفردات متدرجة مقابل نموذج المتعلم المفتوح

Text Retrieval for Language Learners: Graded Vocabulary vs. Open Learner Model

229   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعيد نظام استرجاع النص للتعلم اللغوي مواد القراءة في مستوى الصعوبة المناسب للمستخدم.يحافظ النظام عادة على نموذج متعلم على معرفة المفردات للمستخدم، وتحدد النصوص التي تناسب النموذج.مع زيادة الكفاءة في اللغة للمستخدم، تكون التحديثات النموذجية ضرورية لاسترداد النصوص مع التعقيد المعجمي المقابل.نحن نتحقق في نموذج متعلم مفتوح يتيح تعديل المستخدم لمحتواه، وتقييم فعاليته فيما يتعلق بمبلغ جهد تحديث المستخدم.قارنا هذا النموذج مع النهج المتدرج، حيث يقوم النظام بإرجاع النصوص في الصف الأمثل.عندما يقوم المستخدم بإجراء ما لا يقل عن نصف التحديثات المتوقعة لنموذج المتعلم المفتوح، تظهر نتائج المحاكاة أنه يتفوق على النهج المتدرج في استرجاع النصوص التي تناسب تفضيلات المستخدم كثافة كلمة جديدة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

بالمقارنة مع نماذج أحادية الأجل، تتطلب النماذج عبر اللغات عادة مفردات أكثر تعبيرية لتمثيل جميع اللغات بشكل كاف.نجد أن العديد من اللغات ممثلة تمثيلا ناقصا في نماذج اللغات الصليب الأخيرة بسبب قدرة المفردات المحدودة.تحقيقا لهذه الغاية، نقترح خوارزمية VO CAP لتحديد سعة المفردات المطلوبة لكل لغة.ومع ذلك، فإن زيادة حجم المفردات يبطئ بشكل كبير بسرعة ما قبل التدريب.من أجل معالجة المشكلات، نقترح أخذ العينات المستهدفة المستهدفة K-NN لتسريع SoftMax باهظة الثمن.تبين تجاربنا أن المفردات المتعددة اللغات المستفادة مع فوائد VOCAP نموذج اللغة المتبادلة قبل التدريب مسبقا.علاوة على ذلك، فإن أخذ العينات المستهدفة المستندة إلى K-NN تخفف الآثار الجانبية لزيادة حجم المفردات مع تحقيق أداء مماثل وسرعة ما قبل التدريب الأسرع.الرمز والمفردات متعددة اللغات المحددة متوفرة في https://github.com/bozheng-hit/vocapxlm.
حققت استرجاع النص العصبي الكثيف نتائج واعدة حول السؤال المفتوح للنطاق الرد (QA)، حيث يتم استغلال تمثيلات كامنة للأسئلة والمراجيات للحصول على أقصى قدر من البحث الداخلي في عملية الاسترجاع. ومع ذلك، فإن المستردات الكثيفة الحالية تتطلب تقسيم المستندات إل ى مقاطع قصيرة تحتوي عادة على سياق محلي جزئي ومحازي في بعض الأحيان، وتعتمد بشدة على عملية تقسيم. ونتيجة لذلك، قد تسفر عن تعويضات مخفية غير دقيقة ومضللة، مما تدهور نتيجة الاسترجاع النهائي. في هذا العمل، نقترح استرجاع هرمي هرمي كثيف (DHR)، وهو إطار هرمي يمكنه إنشاء تمثيلات كثيفة دقيقة من الممرات من خلال الاستفادة من كل من الدلالات الكبيرة في الوثيقة والدليل المجهري المحدد لكل مقطع. على وجه التحديد، يحدد المسترد على مستوى المستند أولا المستندات ذات الصلة، من بينها يتم استرداد المقاطع ذات الصلة من خلال المسترد لمستوى المقاطع. سيتم معايرة ترتيب الممرات المستردة من خلال دراسة أهمية مستوى الوثيقة. بالإضافة إلى ذلك، يتم التحقيق في هيكل العنوان الهرمي واستراتيجيات أخذ العينات السلبية (I.E.، في السلبيات في السلبيات) في السلبيات). نطبق DHR إلى مجموعات بيانات QA مفتوحة على نطاق واسع. تتفوق DHR بشكل كبير على استرداد المقطع الكثيف الأصلي، ويساعد نظام ضمان الجودة في نهاية إلى نهاية يتفوق على الأساس القوي على معايير QA متعددة النطاق.
في هذه الورقة، نقترح تحدي جيل يسمى جيل تعليق التعليقات لمتعلمي اللغة.إنها مهمة حيث تعطى نصا ومقدسا، ينشئ النظام، للمشاركة، ملاحظة توضيحية تساعد الكاتب (المتعلم اللغوي) على تحسين مهارات الكتابة الخاصة بهم.الدوافع الخاصة بهذا التحدي هي: (ط) عمليا، سيكو ن مفيدا لكل من المتعلمين والمعلمين اللغويين إذا كان يمكن لنظام تعلم اللغة بمساعدة الكمبيوتر تقديم تعليقات التعليقات تماما كما يفعله المعلمون البشر؛(2) من الناحية النظرية، فإن جيل التعليق للتراجع عن المتعلمين اللغوي له جانب مختلط من مهام الجيل الأخرى مع ميزاتها الفريدة، وسوف تكون مثيرة للاهتمام لاستكشاف نوع تقنية الجيل فعالة ضد أي نوع من قاعدة الكتابة.تحقيقا لهذه الغاية، أنشأنا مجموعة بيانات وتطوير أنظمة أساسية لتقدير الأداء الأساسي.مع هذه الاستعدادات، نقترح تحدي جيل من جيل تعليق التعليقات.
يمكن أن تساعد ردود الفعل التصحيحية التلقائية التلقائي على تعلم اللغة من خلفيات مختلفة اكتساب لغة جديدة بشكل أفضل.تقدم هذه الورقة مجموعة بيانات متعلمة باللغة الإنجليزية التي يرافقها أخطاء المتعلمين معلومات حول مصادر الأخطاء المحتملة.تحتوي مجموعة البيا نات هذه على خطأ مشروح يدويا أسباب أخطاء كتابة المتعلم.هذه تسبب ربط أخطاء المتعلم بالهياكل من لغاتهم الأولى، عندما تتباعد القواعد باللغة الإنجليزية وفي اللغة الأولى.ستمكن هذه البيانات البيانات الجديدة من استحواذ الباحثين الاستحواذين باللغة الثانية على تحليل كمية كبيرة من أخطاء المتعلمين المرتبطة بنقل اللغة من اللغة الأولى من المتعلمين.يمكن أيضا تطبيق DataSet أيضا في تخصيص أنظمة تصحيح الأخطاء النحوية وفقا للغة الأولى للمتعلمين وفي تقديم ملاحظات مستنيرة عن طريق الخطأ.
تقوم المشفر المزدح المجرقة بإجراء استرجاع من خلال ترميز المستندات والاستعلامات في متجهات كثيفة منخفضة الأبعاد، حيث سجل كل وثيقة عن طريق المنتج الداخلي مع الاستعلام.نحن نبحث في قدرة هذه الهندسة المعمارية بالنسبة إلى نماذج كيس من الكلمات المتفرقة والشب كات العصبية الاهتمام.باستخدام كل من التحليلات النظرية والتجريبية، نقوم بإنشاء اتصالات بين بعد ترميز، الهامش بين الذهب والوثائق ذات المرتبة الأدنى، وطول الوثيقة، مما يشير إلى حد قيود في سعة الترميزات ذات الطول الثابت لدعم استرجاع الدقة الدقيقة للوثائق الطويلة.بناء على هذه الأفكار، نقترح نموذجا عصبا بسيطا يجمع بين كفاءة الترميز المزدوج مع بعض التعبير عن هياكل التعبير الأكثر تكلفة، واستكشاف الهجينة الكثيفة المتنارية للاستفادة من دقة الاسترجاع المتناقضة.تتفوق هذه النماذج بدائل قوية في استرجاع واسع النطاق.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا