نقدم أول كائن مشروح للتحليل متعدد اللغات من البنات غير العادلة المحتملة في شروط الخدمة عبر الإنترنت.تشتمل مجموعة البيانات على ما مجموعه 100 عقد، تم الحصول عليها من 25 وثيقة مشروح في أربع لغات مختلفة: الإنجليزية والألمانية والإيطالية والبولندية.لكل عقد، يتم تفاح البنود غير العادلة للمستهلك، لتسع فئات غير ظلم مختلفة.نظهر كيف يمكن استخدام تقنية الإسقاط التوضيحي بسيطة ولكنها فعالة استنادا إلى مدماج الجملة لإجراء التعليقات التوضيحية تلقائيا عبر اللغات.
We present the first annotated corpus for multilingual analysis of potentially unfair clauses in online Terms of Service. The data set comprises a total of 100 contracts, obtained from 25 documents annotated in four different languages: English, German, Italian, and Polish. For each contract, potentially unfair clauses for the consumer are annotated, for nine different unfairness categories. We show how a simple yet efficient annotation projection technique based on sentence embeddings could be used to automatically transfer annotations across languages.
المراجع المستخدمة