ترغب بنشر مسار تعليمي؟ اضغط هنا

جوربرت: نموذج برت روماني لتنبؤ الحكم القانوني

jurBERT: A Romanian BERT Model for Legal Judgement Prediction

348   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أصبحت النماذج القائمة على المحولات القياسية الفعلية في مجال معالجة اللغة الطبيعية (NLP).من خلال الاستفادة من نصائح النص غير المستمر الكبيرة، فإنها تمكن من التعلم الفعال للتحويل المؤدي إلى نتائج أحدث النتائج في العديد من مهام NLP.ومع ذلك، بالنسبة إلى لغات الموارد المنخفضة والمهام المتخصصة للغاية، تميل نماذج المحولات إلى التخلف عن الأساليب الكلاسيكية أكثر (على سبيل المثال SVM، LSTM) بسبب الافتقار إلى كورسا المذكور أعلاه.في هذه الورقة نركز على المجال القانوني ونحن نقدم نموذج برت روماني مدربا مسبقا على كوربوس متخصص كبير.تتفوق نموذجنا على العديد من خطوط خطوط خطوط خطوط خطوط خطية قوية للتنبؤ بالحكم القانوني على شركتين مختلفين تتكون من حالات من المحاكمات التي تنطوي على البنوك في رومانيا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التعرف على الكيانات المسماة الحالية في النص هو خطوة مهمة نحو استخراج المعلومات وفهم اللغة الطبيعية.يعرض هذا العمل نظام التعرف على الكيان المسمى للنشاط القانوني الروماني.يستفيد النظام من Corpus Gold Legalnero المشروح.علاوة على ذلك، يجمع النظام بين الع ديد من العروض التوزيعية للكلمات، بما في ذلك Word Ageddings المدربين على كوربوس مجال قانوني كبير.جميع الموارد، بما في ذلك Corpus، النموذج و Adgeddings مفتوحة مفتوحة.أخيرا، يتوفر أفضل نظام للاستخدام المباشر في منصة Relale.
تعد تحديد الهياكل مهمة مع قابلية التطبيق في مجموعة واسعة من المجالات، تتراوح من التعرف على الكلام التلقائي إلى التعدين في الرأي.يقدم هذا العمل هياكناتنا المستخدمة في مهمة تحديد الهوية الرومانية لعام 2021.لقد أدخلنا سلسلة من الحلول بناء على المحولات ا لرومانية أو متعددة اللغات، فضلا عن تقنيات التدريب المشددي.في الوقت نفسه، جربنا أداة تقطير المعرفة من أجل التحقق مما إذا كان يمكن لنموذج أصغر الحفاظ على أداء أفضل أسلوبنا.تمكن أفضل الحلول لدينا للحصول على درجة F1 مرجحة من 0.7324، مما يتيح لنا الحصول على المركز الثاني على المتصدرين.
أثبتت نماذج اللغة أنها مفيدة للغاية عند تكييفها مع مجالات محددة.ومع ذلك، تم إجراء القليل من الأبحاث على تكيف نماذج بيرت الخاصة بالمجال في اللغة الفرنسية.في هذه الورقة، نركز على إنشاء نموذج لغة تتكيف مع النص القانوني الفرنسي بهدف مساعدة محترفي القانون .نستنتج أن بعض المهام المحددة لا تستفيد من نماذج اللغة العامة المدربة مسبقا على كميات كبيرة من البيانات.نستكشف استخدام الهندسة الصغيرة في اللغات الفرعية الخاصة بالمجال ومزاياها للنص القانوني الفرنسي.نثبت أن النماذج المحددة مسبقا للمجال يمكن أن تؤدي أفضل من تلك المعادلة المكافئة في المجال القانوني.أخيرا، نطلق سراح جوريبارت، مجموعة جديدة من نماذج بيرت تتكيف مع المجال القانوني الفرنسي.
في هذه الورقة، نقترح نموذجا مقرا له عناية سياقية مع تدريبات دقيقة على مرحلتين باستخدام روبرتا.أولا، نقوم بإجراء النغمة الجميلة في المرحلة الأولى على Corpus مع روبرتا، بحيث يمكن للنموذج أن يتعلم بعض المعرفة المسبقة المجال.ثم نحصل على التضمين السياقي ب كلمات السياق بناء على التضمين على مستوى الرمز المميز مع النموذج الدقيق.ونحن نستخدم KFOFT التحقق من الصحة للحصول على نماذج K وفرقة لهم للحصول على النتيجة النهائية.أخيرا، نحن نحصل على المركز الثاني في مرحلة التقييم النهائي من المهمة الفرعية 2 مع ارتباط بيرسون ب 0.8575.
تصف هذه الورقة تقديمنا لمهمة Wassa 2021 المشتركة فيما يتعلق بالتنبؤ بالتعاطف والضيق والعواطف من القصص الإخبارية.يعتمد الحل على الجمع بين تواتر الكلمات والمعلومات المستندة إلى المعجم والتركيبة السكانية للنظام المعلقين وشخصية المعلقين في نموذج خطي.يتم تنبؤ التعاطف والضيق باستخدام الانحدار الخطي بينما يتم تنفيذ التنبؤ بالعواطف باستخدام الانحدار اللوجستي.يتم تنفيذ كلا المهام باستخدام نفس الميزات.نماذجنا تصنيف 4th للتنبؤ بالعواطف والثاني للتنبؤ بالتعاطف والضيق.هذه النتائج مثيرة للاهتمام بشكل خاص عند اعتبار أن المتطلبات الحسابية للحل هي الحد الأدنى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا