من الدائرة إلى الاعتماد على أسلوب UD: بناء أول أداة تحويل التركية


الملخص بالعربية

تتداول هذه الورقة عن عملية بناء أول أداة تحويل الدائرة إلى التبعية التركية. نقطة الانطلاق لهذا العمل هي دراسة سابقة التي تحولت فيها 10 آلاف من أشجار هيكل العبارة يدويا إلى تركية من Corpus الأصلي Penntreebank. ضمن نطاق هذا المشروع، تم تحويل هذه العبارات التركية هذه الأشجار تلقائيا إلى هياكل التبعية على غرار UD، باستخدام خوارزمية تستند إلى القواعد وخوارزمية لتعلم الآلة محددة لمتطلبات اللغة التركية. تمت مقارنة نتائج الخوارزمية وكلاهما أن نهج التعلم الآلي أثبت أنه أكثر دقة من الخوارزمية القائمة على القواعد. تم تنقيح الناتج من قبل فريق من اللغويين. اتخذت الإصدارات المكررة عباحيات قياسية ذهبية لتقييم الخوارزميات. بالإضافة إلى مساهمتها في مشروع UD مع مجموعة بيانات كبيرة من 10،000 شجرة التبعية التركية، فإن هذا المشروع يفي أيضا فجوة مهمة للأداة التحويل التركية، مما يتيح التعدد السريع من شركة التبعية التي يمكن استخدامها لتدريب محلل التبعية الأفضل وبعد

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث