الاستدلال السببية هو عملية التقاط علاقة تأثير السبب بين المتغيرات.تركز معظم الأعمال الموجودة على التعامل مع البيانات المنظمة، أثناء التعدين العلاقة السببية بين عوامل البيانات غير المنظمة، مثل النص، أقل فحصا، ولكنها ذات أهمية كبيرة، خاصة في المجال القانوني.في هذه الورقة، نقترح إطار الاستدلال السببية المستندة إلى الرسم البياني (GCI) على الرواية، والذي يبني الرسوم البيانية السببية من أوصاف الحقائق دون تورط إنساني كبير ويمكن الاستدلال السببية لتسهيل الممارسين القانونيين لإجراء قرارات مناسبة.نقيم الإطار على مهمة تحدي مهمة غموض مماثلة.تظهر النتائج التجريبية أن GCI يمكن أن تلتقط نفاد الفقراء من أوصاف الحقائق بين رسوم مربكة متعددة وتوفير تمييز قابل للتفسير، وخاصة في إعدادات قليلة.نلاحظ أيضا أن المعرفة السببية الواردة في GCI يمكن حقنها بشكل فعال في شبكات عصبية قوية لتحسين الأداء والتفسيرية.
Causal inference is the process of capturing cause-effect relationship among variables. Most existing works focus on dealing with structured data, while mining causal relationship among factors from unstructured data, like text, has been less examined, but is of great importance, especially in the legal domain. In this paper, we propose a novel Graph-based Causal Inference (GCI) framework, which builds causal graphs from fact descriptions without much human involvement and enables causal inference to facilitate legal practitioners to make proper decisions. We evaluate the framework on a challenging similar charge disambiguation task. Experimental results show that GCI can capture the nuance from fact descriptions among multiple confusing charges and provide explainable discrimination, especially in few-shot settings. We also observe that the causal knowledge contained in GCI can be effectively injected into powerful neural networks for better performance and interpretability.
المراجع المستخدمة
https://aclanthology.org/
أثبتت نماذج اللغة أنها مفيدة للغاية عند تكييفها مع مجالات محددة.ومع ذلك، تم إجراء القليل من الأبحاث على تكيف نماذج بيرت الخاصة بالمجال في اللغة الفرنسية.في هذه الورقة، نركز على إنشاء نموذج لغة تتكيف مع النص القانوني الفرنسي بهدف مساعدة محترفي القانون
تعلم تمثيل كامن جيد ضروري لنقل نمط النص، والذي يولد جملة جديدة عن طريق تغيير سمات جملة معينة مع الحفاظ على محتواها.تعتمد معظم الأعمال السابقة تمثيل تمثيل كامن Disentangled تعلم تحقيق نقل النمط.نقترح خوارزمية نقل نمط النص الجديد مع تمثيل كامن متشابكا،
نماذج اللغة واسعة النطاق مثل GPT-3 هي متعلمين بقلة قليلة، مما يتيح لهم السيطرة عليها عبر مطالبات النص الطبيعي. أبلغ الدراسات الحديثة أن التصنيف المباشر الفوري يزيل الحاجة إلى ضبط الدقيقة ولكن يفتقر إلى إمكانية التوسع للبيانات والاستدلال. تقترح هذه ال
يصف استخراج المعلومات عبر اللغات الصفرية (IE) بناء نموذج IE لبعض اللغة المستهدفة، بالنظر إلى التعليقات التوضيحية القائمة حصريا في لغة أخرى، عادة باللغة الإنجليزية. في حين أن تقدم اللوائح المتعددة اللغات المحددة مسبقا يشير إلى تفاؤل سهلة للقطار على ال
إن تطبيق تقنيات الترميز التنبؤية للنصوص القانونية لديه القدرة على تقليل تكلفة المراجعة القانونية للوثائق، ومع ذلك، هناك مثل هذه المجموعة الواسعة من المهام القانونية والتشريعات المتطورة باستمرار من الصعب بناء بيانات تدريبية كافية لتغطية جميعهاحالات.في