ترغب بنشر مسار تعليمي؟ اضغط هنا

هي نماذج NLP قادرة حقا على حل مشاكل كلمة الرياضيات البسيطة؟

Are NLP Models really able to Solve Simple Math Word Problems?

290   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

شهدت مشكلة تصميم حلول NLP لمشاكل كلمة الرياضيات (MWP) نشاط بحثي مستمر ومكاسب ثابتة في دقة الاختبار. نظرا لأن الحلفل الموجودين يحققون أداء عاليا على مجموعات البيانات القياسية للمستوى الابتدائي الذي يحتوي على مشاكل في الكلمات الحسابية المجهولة الأولى، إلا أن هذه المشكلات غالبا ما يتم حلها في كثير من الأحيان "مع الجزء الأكبر من الاهتمام بالبحث إلى MWPS أكثر تعقيدا. في هذه الورقة، قصرنا انتباهنا إلى اللغة الإنجليزية MWPs تدرس في الصفوف الأربعة والأقل. نحن نقدم دليلا قويا على أن وحدات MWP الحالية تعتمد على الاستدلال الضحلة لتحقيق أداء عال في مجموعات البيانات القياسية. تحقيقا لهذه الغاية، نظهر أن حفلات MWP التي لا تملك الوصول إلى السؤال المطلوب في MWP، لا يزال بإمكانك حل جزء كبير من MWPS. وبالمثل، فإن النماذج التي تعالج mwps كحقيبة من الكلمات يمكن أن تحقق أيضا دقة عالية بشكل مدهش. علاوة على ذلك، نقدم مجموعة بيانات تحدي، Svamp، تم إنشاؤها من خلال تطبيق الاختلافات المختارة بعناية على الأمثلة التي تم أخذ عينات منها من مجموعات البيانات الحالية. إن أفضل الدقة التي تحققت بها النماذج الحديثة أقل بكثير على Svamp، وبالتالي إظهار الكثير لا يزال يتعين القيام به حتى لأبسط MWPS.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعرف حلال الرياضيات العصبي الحالي دمج المعرفة المنطقية أو المجال عن طريق الاستفادة من الثوابت أو الصيغ المحددة مسبقا.ومع ذلك، نظرا لأن هذه الثوابت والصيغ هي أساسا، فإن تعميمات الحلول محدودة.في هذه الورقة، نقترح استعادة المعرفة المطلوبة صراحة من مشكلة الرياضيات.وبهذه الطريقة، يمكننا مصممة معرفة المعرفة المطلوبة Andimprove شرح الحلول.خوارمنا لدينا تأخذ مشكلة النص ومعادلات الحل كمدخل.ثم، يحاولون استنتاج المعرفة المنطقية والمجال المطلوبة عن طريق دمج المعلومات من كلا الجزأين.نبني اثنين من مجموعات بيانات الرياضيات وتظهر فعالية خوارزمياتنا التي يمكنهم استرداد المعرفة المطلوبة لحل المشكلات.
في هذه المقالة، نتعامل مع مشكلة كلمة الرياضيات، وهي الإجابة تلقائيا على مشكلة رياضية وفقا لوصفها النصي. على الرغم من أن الطرق الحديثة أظهرت نتائجها الواعدة، فإن معظم هذه الطرق تستند إلى مخطط الجيل القائم على القوالب تؤدي إلى إمكانية تعميم محدودية. تح قيقا لهذه الغاية، نقترح طريقة التعلم التناظرية تشبه الإنسان الرواية في استدعاء وتعلم بطريقة. يتكون إطار عملنا المقترح من وحدات من وحدات الذاكرة والتمثيل والبيان والتفكير، والتي تم تصميمها لإجراء عملية جديدة من خلال الإشارة إلى التدريبات المستفادة في الماضي. على وجه التحديد، بالنظر إلى مشكلة كلمة الرياضيات، يسترجع النموذج لأول مرة أسئلة مماثلة عن طريق وحدة الذاكرة ثم ترميز المشكلة غير المحددة، وكل سؤال استرجاع باستخدام وحدة تمثيل. علاوة على ذلك، فإن حل المشكلة في طريقة التشبيه، وتقترح وحدة تشبيه ووحدة التفكير مع آلية نسخ نموذج العلاقة المتبادلة بين المشكلة وكل سؤال استرجاع. تظهر تجارب واسعة على مجموعة من مجموعات عمليتين معروفتين تفوق خوارزمية لدينا مقارنة بالمقارنة مع المنافسين غير الفنون الآخرين من كل من مقارنة الأداء الإجمالي ودراسات النطاق الصغير.
في حين أن حل مشاكل كلمة الرياضيات تلقائيا تلقى اهتماما كبيرا في مجتمع NLP، فقد عالجت القليل من الأعمال مشاكل كلمة الاحتمالية على وجه التحديد.في هذه الورقة، نحن نوظف وتحليل النماذج العصبية المختلفة للإجابة على مشاكل هذه الكلمة.في نهج من خطوتين، يتم تع يين نص المشكلة أولا إلى تمثيل رسمي في لغة إعلانية باستخدام نموذج تسلسل إلى تسلسل، ثم يتم تنفيذ التمثيل الناتج باستخدام نظام برمجة احتمالية لتوفير الإجابة.يشتمل طرازنا الأفضل الأداء على تمثيلات الكلمات العامة في مجال العمل العام الذي تم تصويره باستخدام التعلم عبر مجموعة بيانات داخل المجال الأخرى.ونحن نطبق أيضا النماذج الطرفية إلى هذه المهمة، والتي تبرز أهمية النهج من خطوتين في الحصول على حلول صحيحة لمشاكل الاحتمال.
كشفت الدراسات الحديثة عن تهديد أمني لنماذج معالجة اللغة الطبيعية (NLP)، تسمى هجوم الوكيل. يمكن أن تحافظ نماذج الضحايا الحفاظ على أداء تنافسي على عينات نظيفة أثناء التصرف بشكل غير واضح على العينات ذات كلمة مشغلة محددة إدراجها. عادة ما تتحمل أساليب الم هاجمة السابقة أن المهاجمين لديهم درجة معينة من المعرفة بالبيانات، إما مجموعة البيانات التي يستخدمها المستخدمون أو مجموعات البيانات الوكيل لمهمة مماثلة، لتنفيذ إجراء تسمم البيانات. ومع ذلك، في هذه الورقة، نجد أنه من الممكن اختراق النموذج بطريقة خالية من البيانات عن طريق تعديل ناقلات كلمة واحدة تضمينها، مع عدم التضحية بدقة تقريبا على عينات نظيفة. تظهر النتائج التجريبية على تحليل المعنويات ومهام تصنيف زوج الجملة أن طريقتنا أكثر كفاءة وسيلة كريهة. نأمل أن يرفع هذا العمل الوعي بمثل هذا المخاطر الأمنية الحرجة المخفية في طبقات تضمين نماذج NLP. يتوفر الكود الخاص بنا في https://github.com/lancopku/mbedding-poisioning.
ركزت البحث في NLP بشكل أساسي على الأسئلة العفوية، بهدف إيجاد طرق سريعة وموثوقة لمطابقة الاستعلام إلى إجابة.ومع ذلك، فإن الخطاب البشري ينطوي على أكثر من ذلك: أنه يحتوي على أسئلة غير قانونية منتشرة لتحقيق أهداف متتالية محددة.في هذه الورقة، نحقق في هذا الجانب السفلي من الجانب من NLP من خلال إدخال مهمة مستهدفة، وخلق كوربوس مناسب للمهمة وتوفير نماذج خط الأساس ذات الطبيعة المتنوعة.مع هذا، نحن قادرون أيضا على توليد رؤى مفيدة في المهمة وفتح الطريق للبحث في المستقبل في هذا الاتجاه.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا