ترغب بنشر مسار تعليمي؟ اضغط هنا

فنقة: مجموعة بيانات من التفكير العددي على البيانات المالية

FinQA: A Dataset of Numerical Reasoning over Financial Data

301   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن حجم البيانات المالية الهائلة يجعل من الصعب الوصول إلى البشر ويحللون قطاع الأعمال. تواجه المنطق العددي القوي بالمثل تحديات فريدة من نوعها في هذا المجال. في هذا العمل، نركز على الإجابة على الأسئلة العميقة على البيانات المالية، تهدف إلى أتمتة تحليل لجنة كبيرة من الوثائق المالية. على عكس المهام الحالية على المجال العام، يتضمن مجال التمويل التفكير العددي المعقد وفهم تمثيلات غير متجانسة. لتسهيل التقدم التحليلي، نقترح مجموعة بيانات جديدة واسعة النطاق، فنقة، مع أزواج الإجابة على السؤال حول التقارير المالية، التي كتبها خبراء ماليون. كما نبحث أيضا عن برامج المنطق الذهبي لضمان التوضيح الكامل. ونحن نقدم أيضا خطوط الأساس وإجراء تجارب شاملة في مجموعة البيانات الخاصة بنا. توضح النتائج أن النماذج الشعبية الكبيرة والمدربة مسبقا تنخفض بعيدا عن البشر الخبراء في الحصول على المعرفة المالية وفي التفكير العددي متعدد الخطوات المعقدة في هذه المعرفة. لدينا DataSet - أول نوع - يجب أن تتيح بحث مجتمعي كبير جديد في مجالات التطبيق المعقدة. تتوفر DataSet and Code علنا ​​في HTTPS://github.com/czyssrs/finqa.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في حين أن مجموعات بيانات الإجابة على الأسئلة المتنوعة (QA) اقترحت وساهمت بشكل كبير في تطوير نماذج التعلم العميق لمهام ضمان الجودة، فإن البيانات الحالية تقصر في جوانبين. أولا، نفتقر إلى مجموعات بيانات ضمان الجودة التي تغطي الأسئلة المعقدة التي تنطوي ع لى إجابات بالإضافة إلى عمليات التفكير للحصول عليها. نتيجة لذلك، لا تزال أبحاث ضمنيا في ضمان الجودة العددية تركز على حسابات بسيطة ولا توفر التعبيرات الرياضية أو الأدلة التي تبرر الإجابات. ثانيا، ساهم مجتمع ضمان الجودة في الكثير من الجهد لتحسين إمكانية تفسير نماذج QA. ومع ذلك، فإنهم يفشلون في إظهار عملية التفكير صراحة، مثل أمر الأدلة من أجل التفكير والتفاعلات بين الأدلة المختلفة. لمعالجة العيب المذكور أعلاه، نقدم Noahqa ومجموعة بيانات QA محادثة وثنائية اللغة مع أسئلة تتطلب التفكير العددي مع التعبيرات الرياضية المركبة. مع Noahqa، نقوم بتطوير رسم بياني لتفكير قابل للتفسير بالإضافة إلى متري التقييم المناسب لقياس جودة الإجابة. نقوم بتقييم حديثة نماذج ضمان الجودة المدربة باستخدام مجموعات بيانات QA الحالية على Noahqa وإظهار أن الأفضل من بينها يمكن فقط تحقيق 55.5 عشر درجات مطابقة محددة، في حين أن الأداء البشري هو 89.7. نقدم أيضا نموذجا جديدا في ضمان الجودة لتوليد رسم بياني للمنطق حيث لا يزال متري الرسم البياني للمنطق فجوة كبيرة مقارنة بمركبات البشر، على سبيل المثال، 28 درجات.
الإجابة على الأسئلة الأساسية للمعرفة (KBQA) هي الإجابة على أسئلة اللغة الطبيعية المطروحة على قواعد المعرفة (KBS).هذه الأهداف الورقية في تمكين نماذج KBQA القائمة على IR مع قدرة المنطق العددي للإجابة على أسئلة مقيدة ترتيبية.التحدي الرئيسي هو عدم وجود ش روح واضحة حول الخصائص العددية.لمعالجة هذا التحدي، نقترح نموذجا للتفكير العددي الذي يتألف من Numgnn و Numtransformer، يسترشد بإشارات مراقبة ذاتية صريحة.يتم الاحترام من الوحداتتين لتشميز الحجم والخصائص الترتيبية للأرقام على التوالي ويمكن أن تكون بمثابة إضافات نموذجية للأذرع لأي نموذج KBQA المستندة إلى IR لتعزيز قدرة التفكير العددي.تجارب واسعة على معايير KBQA تحقق من فعالية طريقتنا لتعزيز قدرة التفكير العددي لنماذج KBQA القائمة على IR.
مهارات التفكير العددي ضرورية للإجابة على الأسئلة المعقدة (CQA) على النص.يتطلب opertaions بما في ذلك العد والمقارنة والإضافة والطرح.يتبع نهج ناجح في CQA على النص، وشبكات الوحدات النمطية العصبية (NMNS)، تتبع نموذج المبرمج ومترجم البرامج النمطية النمطية المتخصصة لأداء التفكير التركيبي.ومع ذلك، فإن إطار NMNS لا ينظر في العلاقة بين الأرقام والكيانات في كل من الأسئلة والفقرات.نقترح تقنيات فعالة لتحسين قدرات التفكير العددي NMNS من خلال إدراك السؤال المترجم والتقاط العلاقة بين الكيانات والأرقام.على نفس المجموعة الفرعية من DataSet Drop for CQA على النص، تظهر النتائج التجريبية أن إضافاتنا تتفوق على NMNS الأصلي بنسبة 3.0 نقاط للحصول على درجة F1 الإجمالية.
نحن نتعامل مع مشكلة الملاحة حيث يتبع الوكيل تعليمات اللغة الطبيعية مع مراقبة البيئة.التركيز على فهم اللغة، نظهر أهمية دلالات المكانية في تعليمات الملاحة الأساسية في التصورات المرئية.نقترح وكيل عصبي يستخدم عناصر التكوينات المكانية والتحقيق في نفوذهم ع لى قدرة مفطنة عامل الملاحة.علاوة على ذلك، نحن ننمذ نظام التنفيذ المتسلسل ومحاذاة الكائنات المرئية مع تكوينات مكانية في التعليمات.يحسن وكيلنا العصبي خطوط أساس قوية على البيئات المشاهدة ويظهر أداء تنافسي في البيئات غير المرئية.بالإضافة إلى ذلك، توضح النتائج التجريبية أن نمذجة صريحة للعناصر الدلالية المكانية في التعليمات يمكن أن تحسن من التفكير الأساسي والمكاني للنموذج.
يستخدم الأشخاص من المنتديات عبر الإنترنت إما أن نبحث عن معلومات أو للمساهمة به. بسبب شعبيتها المتنامية، تم إنشاء بعض المنتديات عبر الإنترنت خصيصا لتوفير الدعم والمساعدة والآراء للأشخاص الذين يعانون من مرض عقلي. الاكتئاب هو واحد من الأمراض النفسية الأ كثر شيوعا في جميع أنحاء العالم. يتواصل الأشخاص المزيد من المنتديات عبر الإنترنت للعثور على إجابات لأمراضهم النفسية. ومع ذلك، لا توجد آلية لقياس شدة الاكتئاب في كل وظيفة وإعطاء أهمية أعلى لأولئك الذين يشخصون بالاكتئاب بشدة. على الرغم من أن العديد من الأبحاث التي تستند إلى بيانات المنتدى عبر الإنترنت وتحديد الاكتئاب قد أجريت، نادرا ما يتم استكشاف شدة الاكتئاب. بالإضافة إلى ذلك، فإن غياب مجموعات البيانات سوف تنموي تطوير إجراءات تشخيصية جديدة للممارسين. من هذه الدراسة، نقدم مجموعة بيانات لدعم البحوث حول تقييم شدة الاكتئاب. النهج الحسابي لقياس عملية تلقائية، خطورة محددة من الاكتئاب هنا نهج جديد تماما. ومع ذلك، هناك حاجة إلى ذلك، هناك حاجة إلى هذا القياس الموضعي للاكتئاب في مشاركات المنتدى عبر الإنترنت لضمان موازين القياس المستخدمة في بحثنا يجتمع مع القواعد المتوقعة للبحث العلمي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا