ترغب بنشر مسار تعليمي؟ اضغط هنا

خطأ في التسمية: نهج التعلم الآلي للكشف عن الأخطاء وتوليد ردود الفعل المفيدة

Mistake Captioning: A Machine Learning Approach for Detecting Mistakes and Generating Instructive Feedback

328   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن تقديم ملاحظات للطلاب ليس فقط في وضع علامة على إجاباتهم على النحو الصحيح أو غير صحيح، ولكن أيضا العثور على أخطاء في عملية التفكير التي دفعتهم إلى الإجابة غير الصحيحة.في هذه الورقة، نقدم تقنية لتعلم الآلات بسبب التسمية التوضيحية، وهي مهمة تحاول تحديد الأخطاء وتوفير التعليقات مخصصة لمساعدة المتعلمين على تصحيح هذه الأخطاء.نقوم بذلك عن طريق تدريب شبكة تسلسل إلى تسلسل لتوليد هذه التعليقات بناء على خبراء المجال.لتقييم هذا النظام، نستكشف كيف يمكن استخدامه في مهمة اللغويات التي تدرس قانون جريم.نظهر أن نهجنا يولد ردود الفعل التي تتفوق على خط أساس على مجموعة من مقاييس NLP الآلية.بالإضافة إلى ذلك، نقوم بإجراء سلسلة من دراسات الحالة التي ندرس فيها مخرجات النظام الناجحة وغير الناجحة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

معالجة البريد هي النهج الأكثر تقليدية لتصحيح الأخطاء التي تسببها أنظمة التعرف على الأحرف البصرية (OCR).يتم اتخاذ خطوتين عادة لتصحيح أخطاء تعض عبر الإنترنت: الكشف والتصحيحات.بالنسبة للمهمة الأولى، أظهرت طرق تعلم الآلات الخاضعة للإشراف عروضا حديثة.تركز ت النهج المقترحة في السابق بشكل بارز على الجمع بين الميزات المعجمية والسياقية والإحصائية للكشف عن الأخطاء.في هذه الدراسة، نبلغ عن نظام رواية للكشف عن الأخطاء وهو ما يعتمد فقط على التهم N-Gram من رمز المرشح.بالإضافة إلى كونها بسيطة وأقل تكلفة حسابية، فإن نظامنا المقترح يدق النظم السابقة المبلغ عنها في مسابقة ICDAR2019 على اكتشاف خطأ OCR مع هوامش ملحوظة.حققنا درجات F1 الحديثة لمدة ثمانية من أصل عشر لغات أوروبية.الحد الأقصى للتحسين هو الإسبانية التي تحسنت من 0.69 إلى 0.90، والحد الأدنى للبولندية من 0.82 إلى 0.84.
نحن نبحث عن مسألة كيف تؤثر ردود الفعل التكيفية من عامل الظاهري على المدخلات اللغوية للمستخدم في بيئة ألعاب عالمية مشتركة. للقيام بذلك، نقوم بإجراء دراسة تجريبية استكشافية لمراقبة كيفية تأثير ردود الفعل اللغوية الفردية على إدخال خطاب المستخدم. نقدم لع بة تسيطر على الكلام، وإخلاء Apple الأساسية، حيث يتعلم الوكيل المهام المعقدة باستخدام معرفة قاعدة بأعمال بسيطة. تم تجهيز الوكيل بآلية تعليمية لرسم الأوامر الجديدة بتسلسل الإجراءات البسيطة، وكذلك القدرة على دمج إدخال المستخدم في ردود مكتوبة. يشارك الوكيل مرارا وتكرارا حالته المعرفة الداخلية من خلال الاستجابة لما يعرفه ولا يعرفه عن معنى اللغة والبيئة المشتركة. تركز ورقتنا على حلقة الملاحظات اللغوية من أجل تحليل طبيعة إدخال المستخدم. يتم توفير ردود الفعل من الوكيل في شكل حركة مرئية وردود لغوية مكتوبة. يتم إيلاء اهتمام خاص لإدماج مدخلات المستخدم في استجابات الوكيل وتحديث تعيينات الكلام إلى العمل بناء على الأوامر التي يقدمها المستخدم. من خلال دراستنا التجريبية، نقوم بتحليل نجاح المهمة ومقارنة الميزات المعجمية لإدخال المستخدم. تظهر النتائج الاختلاف في طول المدخلات والتنوع المعجمي عبر المستخدمين، مما يشير إلى ارتباط بين الاثنين يمكن دراستهما كذلك.
يعد العمل المبلغ عنه وصف لمشاركتنا في تصنيف تغريدات CovID19 التي تحتوي على أعراض "مهمة مشتركة، نظمتها تعدين وسائل التواصل الاجتماعي للتطبيقات الصحية (SMM4H)" ورشة العمل.يصف الأدبيات نهجا لتعلم جهازين تم استخدامها لبناء نظام تصنيف من الدرجة الثلاثة، و هذا يصنف التغريدات المتعلقة CovID19، إلى ثلاث فصول، بزيادة، التقارير الذاتية، والتقارير غير الشخصية، وأدب / إخباري.يتم وصف خطوات تغريدات المعالجة المسبقة، واستخراج ميزة، وتطوير نماذج تعلم الجهاز، على نطاق واسع في الوثائق.حصل كل من نماذج التعلم المتقدمة، عند تقييمه من قبل المنظمين، عشرات F1 من 0.93 و 0.92 على التوالي.
في هذه الورقة، نصف النظم المستخدمة من قبل فريق الروما في المهمة المشتركة بشأن الكشف عن الفكاهة والفكاهة والجريمة (HAHAHACHATHON) في Semeval 2021. تعتمد أنظمتنا على تمثيلات البيانات المستفادة من خلال نماذج اللغة العصبية التي تم ضبطها بشكل جيد. على وجه الخصوص، نستكشف اثنين من البدينات المميزة. يعتمد أول واحد على شبكة عصبية سيام (SNN) مجتمعة مع طريقة التجميع المستندة إلى الرسم البياني. يستخدم نموذج SNN لتعلم مساحة كامنة حيث يمكن تمييز مثيلات الفكاهة وغير الفكاهة. يتم تطبيق طريقة التجميع لبناء النماذج الأولية لكلتا الفئتين المستخدمة في تدريب وتصنيف الرسائل الجديدة. يجمع المرء الثاني بين تمثيلات نموذج اللغة العصبية مع نموذج الانحدار الخطي الذي يجعل التصنيفات النهائية. حققت أنظمتنا أفضل نتائج لتصنيف فكاهة باستخدام نموذج واحد، في حين أن التصنيف الهجومي والفكاهة، حصل النموذج الثاني على أداء أفضل. في حالة التنبؤ الفكاهة المثيرة للجدل، تم تحقيق أهم تحسن من خلال ضبط طراز اللغة العصبية. بشكل عام، فإن النتائج المحققة مشجعة وتعطينا نقطة انطلاق لمزيد من التحسينات.
مع التعلم Landit العديد المصنعة، يمكن تدريب النماذج بناء على ردود فعل إيجابية وسالبة وردت للتنبؤات التاريخية، دون الحاجة إلى البيانات المسمى.ومع ذلك، غالبا ما تكون هذه الملاحظات متوفرة في أنظمة الحوار في العالم الحقيقي، ومع ذلك، فإن الهندسة المعمارية المعيارية المستخدمة عادة في أنظمة واسعة النطاق يمنع التطبيق المباشر لهذه الخوارزميات.في هذه الورقة، ندرس مشكلة إريقات التغذية المرتدة التي تنشأ عند استخدام التعلم Landit Adderfactual لفهم اللغة المنطوقة متعددة المجالات.نقدم إعداد تجريبي لمحاكاة المشكلة في مجموعات البيانات العامة على نطاق صغير، اقترح طرق الإسناد المستوحاة من التعزيز التعزيز متعدد الوكلات وتقييمها ضد خطوط خطوط خطوط خطوط خطوط خطوط طويلة.نجد أنه أثناء استخدام الملاحظات الشاملة مباشرة يؤدي إلى أداء كارثي، يمكن أن تسمح طرقنا الإسناد المقترحة لدينا نماذج تنافسية للتدريب من ملاحظات المستخدم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا