ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتجاهل السياق أو تتطلب مواصفات يدوية لقالب مشكلة، والتي تساوم، تنوع mwps التي تم إنشاؤها.في هذه الورقة، نحن نطور نهج جيل MWP الجديد الذي يرفع طرازات اللغة المدربة مسبقا ونموذج اختيار الكلمات الرئيسية السياق لتحسين جودة اللغة من MWPS المولدة والثاني) لقيود اتساق المعادلة لمعادلات الرياضيات لتحسين الصلاحية الرياضيةmwps التي تم إنشاؤها.تجارب كمية واسعة من الكمية والنوعية على ثلاثة مجموعات بيانات MWP العالمية الحقيقية توضح الأداء الفائق لنهجنا مقارنة مع خطوط الأساس المختلفة.
We study the problem of generating arithmetic math word problems (MWPs) given a math equation that specifies the mathematical computation and a context that specifies the problem scenario. Existing approaches are prone to generating MWPs that are either mathematically invalid or have unsatisfactory language quality. They also either ignore the context or require manual specification of a problem template, which compromises the diversity of the generated MWPs. In this paper, we develop a novel MWP generation approach that leverages i) pre-trained language models and a context keyword selection model to improve the language quality of generated MWPs and ii) an equation consistency constraint for math equations to improve the mathematical validity of the generated MWPs. Extensive quantitative and qualitative experiments on three real-world MWP datasets demonstrate the superior performance of our approach compared to various baselines.
المراجع المستخدمة
https://aclanthology.org/
نقترح امتداد منظم لتوليد اللغة الشرطية ذات السياق ثنائي الاتجاه، أو تستقيم "مستوحاة من نظرية الدلالية الإطار.يتم توفير التوجيه من خلال إحدى مناهضين: (1) ضبط النموذج الدقيق، والتكييف مباشرة على الإطارات الرمزية الملاحظة، و (2) امتداد جديد لإزالة فك تش
تعرف حلال الرياضيات العصبي الحالي دمج المعرفة المنطقية أو المجال عن طريق الاستفادة من الثوابت أو الصيغ المحددة مسبقا.ومع ذلك، نظرا لأن هذه الثوابت والصيغ هي أساسا، فإن تعميمات الحلول محدودة.في هذه الورقة، نقترح استعادة المعرفة المطلوبة صراحة من مشكلة
في هذه المقالة، نتعامل مع مشكلة كلمة الرياضيات، وهي الإجابة تلقائيا على مشكلة رياضية وفقا لوصفها النصي. على الرغم من أن الطرق الحديثة أظهرت نتائجها الواعدة، فإن معظم هذه الطرق تستند إلى مخطط الجيل القائم على القوالب تؤدي إلى إمكانية تعميم محدودية. تح
في هذه الورقة، نحدد نوعا مثيرا للاهتمام من الخطأ في إخراج أنظمة الترجمة الآلية العصبية غير الخاضعة للكشف عنها مثل Undreamt1. نشير إلى نوع الخطأ هذا كمحالة ترجمة مدخبة. نلاحظ أن نماذج UNMT التي تستخدم ضوضاء خلط ورق اللعب الكلمة (كما هو الحال في حالة U
يتم تعريف الكلمات بناء على معانيها بطرق مختلفة في موارد مختلفة.يزيد محاذاة حواس الكلمات عبر الموارد المعجمية أحادية العمل، مما يزيد من تغطية المجال وتمكن تكامل البيانات وإدماجها.في هذه الورقة، نستكشف تطبيق أساليب التصنيف باستخدام الميزات المستخرجة يد