Pyeurovoc: أداة لتصنيف المستندات القانونية متعددة اللغات مع واصفات Eurovoc


الملخص بالعربية

يوروفوك هو عبارات متعددة اللغات تم بناؤها لتنظيم الوثائقي التشريعي لمؤسسات الاتحاد الأوروبي.يحتوي على الآلاف من الفئات في مستويات مختلفة من الخصوصية وتستهدف واصفاتها من قبل النصوص القانونية في ثلاثين لغة تقريبا.في هذا العمل، نقترح إطارا موحدا لتصنيف EUROVOC في 22 لغة من خلال ضبط نماذج اللغة المحولات الحديثة التي تعتمد على المحولات.نحن ندرس على نطاق واسع أداء نماذجنا المدربة وإظهار أنها تعمل بشكل كبير على تحسين النتائج التي تم الحصول عليها بواسطة أداة مماثلة - جيم - على نفس مجموعة البيانات.تم فتح الرمز والنماذج التي تم ضبطها بشكل جيد مصادر، بالإضافة إلى واجهة برنامجية تخفف عملية تحميل أوزان طراز مدرب وتصنيف مستند جديد.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث