تجارب تفاصيل الورقة هذه التي أجريناها في التبعيات العالمية 2.7 كورسا من أجل التحقيق في أمر الكلمات المهيمنة في اللغات المتاحة.لهذا الغرض، استخدمنا أداة إعادة كتابة الرسم البياني، نمت، والتي سمحت لنا بتجاوز التعليقات التوضيحية السطح وتحديد الموضوعات الضمنية.قمنا أولا بقياس توزيع أوامر الكلمة الستة المختلفة (SVO، SOV، VSO، VOS، OVS، OSV) في كورسا والتحقيق فيها عندما كان هناك فرق كبير في Corga بلغة معينة.بعد ذلك، قارننا النتائج التي تم الحصول عليها مع المعلومات المقدمة في قاعدة بيانات Wals (مجفف ومشبيلماث، 2013) وفي (̈Ostling، 2015).أخيرا، درسنا تأثير استخدام أداة إعادة كتابة الرسم البياني لهذه المهمة.تتوفر الأدوات والموارد المستخدمة لهذا البحث بحرية.
This paper details experiments we performed on the Universal Dependencies 2.7 corpora in order to investigate the dominant word order in the available languages. For this purpose, we used a graph rewriting tool, GREW, which allowed us to go beyond the surface annotations and identify the implicit subjects. We first measured the distribution of the six different word orders (SVO, SOV, VSO, VOS, OVS, OSV) in the corpora and investigated when there was a significant difference in the corpora within a given language. Then, we compared the obtained results with information provided in the WALS database (Dryer and Haspelmath, 2013) and in ( ̈Ostling, 2015). Finally, we examined the impact of using a graph rewriting tool for this task. The tools and resources used for this research are all freely available.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة نظام مقترح لمهمة IWPT 2021 المشتركة بشأن التحليل في التبعيات العالمية المعززة (EUD).نقترح نظام مقرها إعادة كتابة الرسم البياني لحساب التبعيات العالمية المحسنة، بالنظر إلى التبعيات العالمية الأساسية (UD).
نقدم أول محلل محلل دائري على أساس أنظمة إعادة الكتابة الخالية من السياق (LCFRS).وهو يستخدم المصنفات العصبية والتفوق على المحللين السابقين في LCFRS في كل من الدقة وسرعة التحليل من هامش واسع.نتائجنا مواكبة أفضل المحللين المتساقين (العام)، وخاصة درجات ا
إعادة صياغة إعادة صياغة مهمة مهمة في معالجة اللغة الطبيعية. تركز الأشغال السابقة على توليد إعادة صياغة مستوى الجملة، مع تجاهل توليد إعادة صياغة مستوى المستند، وهي مهمة أكثر تحديا وقيمة. في هذه الورقة، نستكشف مهمة إعادة صياغة نص عن طريق الوثيقة لأول م
نحن تصف مهمة IWPT الثانية على تحليل نهاية إلى نهاية من النص الخام لتعزيز التبعيات العالمية.نحن نقدم تفاصيل حول مقاييس التقييم ومجموعات البيانات المستخدمة للتدريب والتقييم.قارنا النهج التي اتخذتها الفرق المشاركة ومناقشة نتائج المهمة المشتركة، والمقارنة أيضا مع الطبعة الأولى من هذه المهمة.
مجردة لأنظمة معالجة اللغات الطبيعية، وهي نوعين من الأدلة تدعم استخدام تمثيلات نصية من نماذج اللغة العصبية المحددة "على الفوروريا غير المخلفات الكبيرة: الأداء على معايير مستوحاة من التطبيقات (بيترز وآخرون، 2018، في جملة أمور أخرى)، والظهور من التجريدا