ترغب بنشر مسار تعليمي؟ اضغط هنا

التعدين المنطقي ومعرفة المجال من مشاكل كلمة الرياضيات

Mining Commonsense and Domain Knowledge from Math Word Problems

329   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعرف حلال الرياضيات العصبي الحالي دمج المعرفة المنطقية أو المجال عن طريق الاستفادة من الثوابت أو الصيغ المحددة مسبقا.ومع ذلك، نظرا لأن هذه الثوابت والصيغ هي أساسا، فإن تعميمات الحلول محدودة.في هذه الورقة، نقترح استعادة المعرفة المطلوبة صراحة من مشكلة الرياضيات.وبهذه الطريقة، يمكننا مصممة معرفة المعرفة المطلوبة Andimprove شرح الحلول.خوارمنا لدينا تأخذ مشكلة النص ومعادلات الحل كمدخل.ثم، يحاولون استنتاج المعرفة المنطقية والمجال المطلوبة عن طريق دمج المعلومات من كلا الجزأين.نبني اثنين من مجموعات بيانات الرياضيات وتظهر فعالية خوارزمياتنا التي يمكنهم استرداد المعرفة المطلوبة لحل المشكلات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

شهدت مشكلة تصميم حلول NLP لمشاكل كلمة الرياضيات (MWP) نشاط بحثي مستمر ومكاسب ثابتة في دقة الاختبار. نظرا لأن الحلفل الموجودين يحققون أداء عاليا على مجموعات البيانات القياسية للمستوى الابتدائي الذي يحتوي على مشاكل في الكلمات الحسابية المجهولة الأولى، إلا أن هذه المشكلات غالبا ما يتم حلها في كثير من الأحيان "مع الجزء الأكبر من الاهتمام بالبحث إلى MWPS أكثر تعقيدا. في هذه الورقة، قصرنا انتباهنا إلى اللغة الإنجليزية MWPs تدرس في الصفوف الأربعة والأقل. نحن نقدم دليلا قويا على أن وحدات MWP الحالية تعتمد على الاستدلال الضحلة لتحقيق أداء عال في مجموعات البيانات القياسية. تحقيقا لهذه الغاية، نظهر أن حفلات MWP التي لا تملك الوصول إلى السؤال المطلوب في MWP، لا يزال بإمكانك حل جزء كبير من MWPS. وبالمثل، فإن النماذج التي تعالج mwps كحقيبة من الكلمات يمكن أن تحقق أيضا دقة عالية بشكل مدهش. علاوة على ذلك، نقدم مجموعة بيانات تحدي، Svamp، تم إنشاؤها من خلال تطبيق الاختلافات المختارة بعناية على الأمثلة التي تم أخذ عينات منها من مجموعات البيانات الحالية. إن أفضل الدقة التي تحققت بها النماذج الحديثة أقل بكثير على Svamp، وبالتالي إظهار الكثير لا يزال يتعين القيام به حتى لأبسط MWPS.
في هذه المقالة، نتعامل مع مشكلة كلمة الرياضيات، وهي الإجابة تلقائيا على مشكلة رياضية وفقا لوصفها النصي. على الرغم من أن الطرق الحديثة أظهرت نتائجها الواعدة، فإن معظم هذه الطرق تستند إلى مخطط الجيل القائم على القوالب تؤدي إلى إمكانية تعميم محدودية. تح قيقا لهذه الغاية، نقترح طريقة التعلم التناظرية تشبه الإنسان الرواية في استدعاء وتعلم بطريقة. يتكون إطار عملنا المقترح من وحدات من وحدات الذاكرة والتمثيل والبيان والتفكير، والتي تم تصميمها لإجراء عملية جديدة من خلال الإشارة إلى التدريبات المستفادة في الماضي. على وجه التحديد، بالنظر إلى مشكلة كلمة الرياضيات، يسترجع النموذج لأول مرة أسئلة مماثلة عن طريق وحدة الذاكرة ثم ترميز المشكلة غير المحددة، وكل سؤال استرجاع باستخدام وحدة تمثيل. علاوة على ذلك، فإن حل المشكلة في طريقة التشبيه، وتقترح وحدة تشبيه ووحدة التفكير مع آلية نسخ نموذج العلاقة المتبادلة بين المشكلة وكل سؤال استرجاع. تظهر تجارب واسعة على مجموعة من مجموعات عمليتين معروفتين تفوق خوارزمية لدينا مقارنة بالمقارنة مع المنافسين غير الفنون الآخرين من كل من مقارنة الأداء الإجمالي ودراسات النطاق الصغير.
في حين أن حل مشاكل كلمة الرياضيات تلقائيا تلقى اهتماما كبيرا في مجتمع NLP، فقد عالجت القليل من الأعمال مشاكل كلمة الاحتمالية على وجه التحديد.في هذه الورقة، نحن نوظف وتحليل النماذج العصبية المختلفة للإجابة على مشاكل هذه الكلمة.في نهج من خطوتين، يتم تع يين نص المشكلة أولا إلى تمثيل رسمي في لغة إعلانية باستخدام نموذج تسلسل إلى تسلسل، ثم يتم تنفيذ التمثيل الناتج باستخدام نظام برمجة احتمالية لتوفير الإجابة.يشتمل طرازنا الأفضل الأداء على تمثيلات الكلمات العامة في مجال العمل العام الذي تم تصويره باستخدام التعلم عبر مجموعة بيانات داخل المجال الأخرى.ونحن نطبق أيضا النماذج الطرفية إلى هذه المهمة، والتي تبرز أهمية النهج من خطوتين في الحصول على حلول صحيحة لمشاكل الاحتمال.
ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتج اهل السياق أو تتطلب مواصفات يدوية لقالب مشكلة، والتي تساوم، تنوع mwps التي تم إنشاؤها.في هذه الورقة، نحن نطور نهج جيل MWP الجديد الذي يرفع طرازات اللغة المدربة مسبقا ونموذج اختيار الكلمات الرئيسية السياق لتحسين جودة اللغة من MWPS المولدة والثاني) لقيود اتساق المعادلة لمعادلات الرياضيات لتحسين الصلاحية الرياضيةmwps التي تم إنشاؤها.تجارب كمية واسعة من الكمية والنوعية على ثلاثة مجموعات بيانات MWP العالمية الحقيقية توضح الأداء الفائق لنهجنا مقارنة مع خطوط الأساس المختلفة.
أدت نماذج اللغة المدربة مسبقا إلى مكاسب كبيرة على مجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP)، ولكنها تبين أن قيود لمهام توليد اللغة الطبيعية مع متطلبات عالية الجودة على الإخراج، مثل جيل العمولة والإعلان توليد الكلمات الرئيسية. في هذا العمل، نقد م تصفية المعرفة الرواية وشبكة تعليمية مرافقة (KFCNET) التي تشير إلى معرفة خارجية وتحقق أداء أفضل من الجيل. على وجه التحديد، نقترح نموذج مرشح يستند إلى BERT لإزالة المرشحين ذوي الجودة المنخفضة، وتطبيق التعلم المقاوم للتناقض بشكل منفصل لكل من التشفير والكشف، داخل بنية فك التشفير العامة - فك التشفير. تساعد الوحدة النمطية للتناقض في التشفير على التقاط دلالات استهداف عالمية أثناء الترميز، وتعزز وحدة فك ترميز وحدة فك الترميز فائدة النماذج الأولية المستردة أثناء تعلم الملامح العامة. تجارب واسعة النطاق في معيار Commongen تشير إلى أن نموذجنا يتفوق على الحالة السابقة للفنية من قبل هامش كبير: +6.6 نقطة (42.5 مقابل 35.9) ل BLU-4، +3.7 نقطة (33.3 مقابل 29.6) للتوابل، و + 1.3 نقطة (18.3 مقابل 17.0) من أجل عصير التفاح. نتحقق مزيدا من فعالية الوحدة النمطية المقنعة المقترحة على توليد الكلمات الرئيسية للإعلان، وإظهار أن نموذجنا له قيمة تجارية محتملة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا