تقوم هذه الورقة بتحقيق تحديثات Treebanks التبعيات العالمية (UD) في 23 لغة وتأثيرها على تطبيق المصب.يشارك العديد من الأشخاص في تحديث المبادئ التوجيهية لشروح UD وشجرة Treebanks بلغات مختلفة.ومع ذلك، ليس من السهل التحقق مما إذا كانت الموارد المحدثة تحتفظ بالعالمية بموارد لغة أخرى.وبالتالي، ينبغي اختبار صلاحية واتساق وتناسقه متعدد اللغات من خلال مهام التطبيق التي تنطوي على هياكل النحوية مع علامات نقاط البيع، وعلامات التبعية، والميزات العالمية.نحن نطبق المحللين النحامين المدربين على UD Treebanks من إصدارات متعددة (2.0 إلى 2.7) مستخرج معنويات على مستوى البند.ثم نحلل العلاقات بين درجات المرفقات من محلل التبعية والأداء في مهام التطبيق.لتطورات UD المستقبلية، نعرض أمثلة على المخرجات التي تختلف حسب الإصدار.
This paper investigates updates of Universal Dependencies (UD) treebanks in 23 languages and their impact on a downstream application. Numerous people are involved in updating UD's annotation guidelines and treebanks in various languages. However, it is not easy to verify whether the updated resources maintain universality with other language resources. Thus, validity and consistency of multilingual corpora should be tested through application tasks involving syntactic structures with PoS tags, dependency labels, and universal features. We apply the syntactic parsers trained on UD treebanks from multiple versions (2.0 to 2.7) to a clause-level sentiment extractor. We then analyze the relationships between attachment scores of dependency parsers and performance in application tasks. For future UD developments, we show examples of outputs that differ depending on version.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة نظام مقترح لمهمة IWPT 2021 المشتركة بشأن التحليل في التبعيات العالمية المعززة (EUD).نقترح نظام مقرها إعادة كتابة الرسم البياني لحساب التبعيات العالمية المحسنة، بالنظر إلى التبعيات العالمية الأساسية (UD).
تجارب تفاصيل الورقة هذه التي أجريناها في التبعيات العالمية 2.7 كورسا من أجل التحقيق في أمر الكلمات المهيمنة في اللغات المتاحة.لهذا الغرض، استخدمنا أداة إعادة كتابة الرسم البياني، نمت، والتي سمحت لنا بتجاوز التعليقات التوضيحية السطح وتحديد الموضوعات ا
تقدم هذه الورقة العديد من التحديات التي تواجهها عند إشراف Treebanks التركية وفقا للمبادئ التوجيهية للتبض الشامل (UD) وتقترح الحلول لمعالجتها.معظم هذه التحديات تنبع من الافتقار إلى الدعم الكافي في إطار UD إلى بدقة تمثل مورفيمز البادئة والاشتقامات المع
هدف البحث إلى التعرف على مدى توافر متطلبات تطبيق منهجية ستة سيجما في الشركات محل البحث، من خلال التعرف على درجة إدراك العاملين لأهمية تطبيق منهجية ستة سيجما، و على مدى ملائمة الثقافة التنظيمية السائدة في الشركات محل البحث لتطبيق منهجية ستة سيجما، و ع
نحن تصف مهمة IWPT الثانية على تحليل نهاية إلى نهاية من النص الخام لتعزيز التبعيات العالمية.نحن نقدم تفاصيل حول مقاييس التقييم ومجموعات البيانات المستخدمة للتدريب والتقييم.قارنا النهج التي اتخذتها الفرق المشاركة ومناقشة نتائج المهمة المشتركة، والمقارنة أيضا مع الطبعة الأولى من هذه المهمة.