ترغب بنشر مسار تعليمي؟ اضغط هنا

طرق قليلة من الأساطير والصفرية لتصنيف النص القانوني: دراسة حالة في القطاع المالي

Few-shot and Zero-shot Approaches to Legal Text Classification: A Case Study in the Financial Sector

293   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن تطبيق تقنيات الترميز التنبؤية للنصوص القانونية لديه القدرة على تقليل تكلفة المراجعة القانونية للوثائق، ومع ذلك، هناك مثل هذه المجموعة الواسعة من المهام القانونية والتشريعات المتطورة باستمرار من الصعب بناء بيانات تدريبية كافية لتغطية جميعهاحالات.في هذه الورقة، نقوم بالتحقيق في طرق قليلة من الأساطير والرصاص التي تتطلب بيانات تدريب أقل بكثير وإدخال هندسة ثلاثية، والتي تنتج البيانات الإذنية أداء قريبة من نظام نظام إشرافي.تسمح هذه الطريقة بطرق ترميز التنبؤ أن يتم تطويرها بسرعة للوائح والأسواق الجديدة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعتمد معالجة اللغة الطبيعية (NLP) بشكل متزايد على الأنظمة العامة المناسبة التي تحتاج إلى التعامل مع العديد من الظواهر اللغوية المختلفة والفروق الدقيقة. على سبيل المثال، يتعين على نظام الاستدلال باللغة الطبيعية (NLI) أن يتعرف على المعنويات، والتعامل م ع الأرقام، وإجراء حلول، وما إلى ذلك. لا تزال حلولنا للمشاكل المعقدة بعيدة عن الكمال، لذلك من المهم إنشاء أنظمة يمكن أن تتعلم تصحيح الأخطاء بسرعة، تدريجيا، ومع القليل من البيانات التدريبية. في هذا العمل، نقترح مهمة التعلم القليلة المستمرة (CFL)، حيث يتم الطعن للنظام بظاهرة صعبة وطلب منهم أن يتعلموا تصحيح الأخطاء مع أمثلة تدريبية فقط (10 إلى 15). تحقيقا لهذه الغاية، نقوم أولا بإنشاء معايير بناء على البيانات المشروحة مسبقا: DetaSets NLI (Anli and Snli) ومجموعات بيانات تحليل المشاعر (IMDB). بعد ذلك، نقدم خطوط أساس مختلفة من النماذج المتنوعة (على سبيل المثال، أخطاقات علم الذاكرة والشبكات النموذجية) ومقارنتها في التعلم القليل من الطلقات والكم من إعدادات التعلم القليلة المستمرة. إن مساهماتنا هي في إنشاء بروتوكول جناح وتقييم معيار لاستمرار التعلم القليل من الرصاص حول مهام تصنيف النص، وعمل العديد من الملاحظات المثيرة للاهتمام حول سلوك الأساليب القائمة على التشابه. نأمل أن يعمل عملنا كنقطة انطلاق مفيدة للعمل في المستقبل على هذا الموضوع الهام.
يمكن للبشر التمييز بين فئات جديدة بكفاءة للغاية مع عدد قليل من الأمثلة، إلى حد كبير بسبب حقيقة أن البشر يمكنهم الاستفادة من المعرفة التي تم الحصول عليها من المهام ذات الصلة.ومع ذلك، يميل نموذج تصنيف النص في التعلم العميق إلى الكفاح لتحقيق أداء مرض عن دما تكون البيانات المسمى نادرة.مستوحاة من الذكاء البشري، نقترح تقديم المعرفة الخارجية إلى سلطة قليلة التعلم لتقليد المعرفة الإنسانية.يتم التحقيق في شبكة مولدات المعلمة الرواية بهذا الغاية، والتي تتمكن من استخدام المعرفة الخارجية لتوليد مقاييس مختلفة لمهام مختلفة.المسلحة مع هذه الشبكة، يمكن لمهام مماثلة استخدام مقاييس مماثلة في حين تستخدم المهام المختلفة مقاييس مختلفة.من خلال التجارب، نوضح أن أسلوبنا تتفوق على نماذج تصنيف النص القليلة لقلة سوتا.
هدفت الدراسة إلى تقويم مدى نجاح تجربة استثمار القطاع الخاص لمحطة حاويات مرفأ طرطوس في تحسين الأداء المالي والتشغيلي للمحطة. عمدت الدراسة إلى تحليل المؤشرات المالية والتشغيلية لمحطة الحاويات قبل دخول القطاع الخاص وبعده. امتدت فترة الدراسة من 2004 حتى 2010 مع اعتبار 2007 سنة وسيطية, وتم الاعتماد على الأساليب الإحصائية المناسبة كاختبار (test t-) واختبار مان ويتني (Mann Whitney Test) لمقارنة أداء المحطة قبل دخول القطاع الخاص وبعده. وخلصت الدراسة إلى وجود تحسنٍ ملحوظٍ في المؤشرات التشغيلية ومؤشرات السيولة و تراجعٍ في مؤشرات الملاءة المالية ومؤشرات الربحية, كما خلصت الدراسة إلى بعض التوصيات التي كان من أهمها ضرورة القيام بإصلاحات على شركات القطاع العام ذات الطابع الاقتصادي والتي من شأنها أن تزيد المرونة والسرعة في اتخاذ القرارات, وإمكانية الاعتماد على كل من سياستي التخصيص والشركة بين القطاعين العام والخاص لمعالجة أوضاع بعض مشاريع القطاع العام التي أصبحت غير قادرة على مواكبة القطاع الخاص
نستكشف عدد قليل من التعلم (FSL) لتصنيف العلاقة (RC).مع التركيز على السيناريو الواقعي من FSL، والتي قد لا تنتمي مثيل الاختبار إلى أي من الفئات المستهدفة (لا شيء أعلاه، [nota])، فإننا أولا إعادة النظر في هيكل مجموعة البيانات الشعبية الأخيرة ل FSL، مشير ا إليهاتوزيع البيانات غير واقعية.لعلاج هذا، نقترح منهجية جديدة لاستكشاف بيانات اختبار القليل من الطوائم بشكل أكثر واقعية من مجموعات البيانات المتوفرة ل RC الإشراف، وتطبيقها على مجموعة البيانات المشبوكة.هذا ينتج معيارا صعبا جديدا ل FSL-RC، في أي حالة من النماذج الفنية تظهر أداء ضعيف.بعد ذلك، نقوم بتحليل مخططات التصنيف ضمن النهج الأقرب القائم على الإرشاد القائم على التضمين FSL، فيما يتعلق بالقيود التي يفرضونها على مساحة التضمين.الناجمة عن هذا التحليل، نقترح مخطط تصنيف جديد يتمثل فيه فئة NOTA كأداة مستفادة، مبين تجريبي ليكون خيارا جذابا ل FSL.
أصبحت تسليلات التسلسل الهرمي لاستغلال التسمية نهجا واعدا لمعالجة مشكلة تصنيف النص متعدد الملصقات الصفرية (ZS-MTC). تهدف الأساليب التقليدية إلى تعلم نموذج مطابق بين النص والملصقات، باستخدام تشفير رسم بياني لإدراج التسلسلات الهرمية التسمية للحصول على ت مثيلات تسمية فعالة (Rios and Kavuluru، 2018). في الآونة الأخيرة، تم استخدام نماذج مسبقا مثل Bert (Devlin et al.، 2018) لتحويل مهام التصنيف إلى مهمة استقامة نصية (يين وآخرون، 2019). هذا النهج مناسب بشكل طبيعي لمهمة ZS-MTC. ومع ذلك، فإن النماذج المحددة المسبقة هي غير مقصودة في العمل الحالي لأنها لا تولد تمثيلات ناقلات فردية للنصوص أو الملصقات، مما يجعلها بلا معنى الجمع بين أساليب ترميز الرسم البياني التقليدي. في هذه الورقة، نستكشف لتحسين النماذج المحددة مع التسلسلات الهرمية التسمية في مهمة ZS-MTC. نقترح نهج تسلسل التسلسل الهرمي العلوي (RLHR) لتشجيع الترابط بين الملصقات في التسلسلات الهرمية أثناء التدريب. وفي الوقت نفسه، للتغلب على ضعف التوقعات المسطحة، نقوم بتصميم خوارزمية Rollback التي يمكنها إزالة الأخطاء المنطقية من التنبؤات أثناء الاستدلال. تظهر النتائج التجريبية على ثلاث مجموعات بيانات حقيقية على أن نهجنا يحقق أداء أفضل وتتفوق على الأساليب السابقة غير مسبوقة في مهمة ZS-MTC.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا