من الناحية التاريخية، يتم إهمال اللغة القانونية الألمانية على نطاق واسع في أبحاث NLP، خاصة في أنظمة التلخيص، لأن معظمها يعتمد على مقالات الصحف الإنجليزية. في هذه الورقة، نقترح مهمة تلخيص أحكام المحكمة الألمانية. نظرا لتعقيدها وطولها، فمن الأهمية بمكان أن يحدد الممارسون القانونيون بسرعة محتوى الحكم وبالتالي يتمكنوا من اتخاذ قرار بشأن أهمية قضية قانونية معينة. لمعالجة هذه المشكلة، نقدم مجموعة بيانات جديدة تتكون من الأحكام الألمانية 100K مع ملخصات قصيرة. تحتوي DataSet لدينا على أعلى نسبة ضغط من بين مجموعات بيانات التلخيص الأكثر شيوعا. تحتوي أحكام المحكمة الألمانية على الكثير من المعلومات الهيكلية، لذلك نقوم بإنشاء خط أنابيب مسبق المعالجة مصممة بشكل صريح إلى المجال القانوني الألماني. بالإضافة إلى ذلك، نقوم بتنفيذ أنظمة تلخيص متعددة وكذلك مبادرة وبناء مجموعة واسعة من النماذج الأساسية. أفضل نموذج لدينا يحقق درجة Rouge-1 من 30.50. لذلك مع هذا العمل، فإننا نضع الأساس الحاسم لمزيد من البحث في أنظمة التلخيص الألمانية.
Historically speaking, the German legal language is widely neglected in NLP research, especially in summarization systems, as most of them are based on English newspaper articles. In this paper, we propose the task of automatic summarization of German court rulings. Due to their complexity and length, it is of critical importance that legal practitioners can quickly identify the content of a verdict and thus be able to decide on the relevance for a given legal case. To tackle this problem, we introduce a new dataset consisting of 100k German judgments with short summaries. Our dataset has the highest compression ratio among the most common summarization datasets. German court rulings contain much structural information, so we create a pre-processing pipeline tailored explicitly to the German legal domain. Additionally, we implement multiple extractive as well as abstractive summarization systems and build a wide variety of baseline models. Our best model achieves a ROUGE-1 score of 30.50. Therefore with this work, we are laying the crucial groundwork for further research on German summarization systems.
References used
https://aclanthology.org/
This paper seeks to compare how the administrative disputes are seen before the
Supreme Constitutional Court in relating to allegation of a Non-constitutional law or
regulation relates to adjudicate in the case seeing before the Administrative Cour
This research mainly is based on one basic topic, namely, the
observation of German-Saudi relations in the period prior to the Second
World War. This study focuses on brief historical presentation of Arab-
European relation in the light of the imp
تسببت الزيادة الكبيرة في كمية المعلومات المتاحة في الانترنت من مختلف المصادر في السنوات الأخيرة إلى صعوبة الوصول والبحث في النصوص الكبيرة عن المعلومة المطلوبة بسرعة وكفاءة وكان من الصعب جداً استخراج تلاخيص النصوص بشكل يدوي وذلك بسبب النمو الهائل للمع
The Statute of the International Criminal Court authorized the appeal of
its judgments in two ways: ordinary, an appeal, an extraordinary review
of judgments, and in the eyes of both appeals the Appeals Chamber of
the International Criminal Court. The international legislator organized
the grounds, procedures, provisions and effects of the appeal, Much
more than what was prescribed in national legislation.
The widespread use of the Internet and the rapid dissemination of information poses the challenge of identifying the veracity of its content. Stance detection, which is the task of predicting the position of a text in regard to a specific target (e.g