تقدم هذه الورقة العديد من التحديات التي تواجهها عند إشراف Treebanks التركية وفقا للمبادئ التوجيهية للتبض الشامل (UD) وتقترح الحلول لمعالجتها.معظم هذه التحديات تنبع من الافتقار إلى الدعم الكافي في إطار UD إلى بدقة تمثل مورفيمز البادئة والاشتقامات المعقدة، مما يؤدي إلى فقدان كبير للمعلومات من أجل التركية.تؤثر هذه الخسارة سلبا على الأدوات التي تم تطويرها بناء على هذه Treebanks.نشأنا وناقشت هذه القضايا داخل المجتمع على بوابة UD الرسمية.تعرض هذه الورقة هذه القضايا ومقترحاتنا تمثل أكثر دقة معلومات مورفوسنكتاسية للتركية في حين تلتزم بمبادئ توجيهية للتكييف.يهدف هذا العمل إلى المساهمة في تمثيل اللغات التركية وغيرها من اللغات الشاقة في Treebanks القائمة على UD، والتي بدورها تساعد على تطوير مجموعات بيانات مشروحة بدقة لهذه اللغات.
This paper presents several challenges faced when annotating Turkish treebanks in accordance with the Universal Dependencies (UD) guidelines and proposes solutions to address them. Most of these challenges stem from the lack of adequate support in the UD framework to accurately represent null morphemes and complex derivations, which results in a significant loss of information for Turkish. This loss negatively impacts the tools that are developed based on these treebanks. We raised and discussed these issues within the community on the official UD portal. This paper presents these issues and our proposals to more accurately represent morphosyntactic information for Turkish while adhering to guidelines of UD. This work aims to contribute to the representation of Turkish and other agglutinative languages in UD-based treebanks, which in turn aids to develop more accurately annotated datasets for such languages.
المراجع المستخدمة
https://aclanthology.org/
في السنوات الأخيرة، اكتسب الرعاية الصحية الرقمية عن بعد باستخدام الدردشات عبر الإنترنت زخما، خاصة في الجنوب العالمي. على الرغم من أن العمل السابق قد درس أنماط التفاعل في المنتديات عبر الإنترنت (الصحة)، مثل Talklife، Reddit و Facebook، كان هناك عمل مح
تصف هذه الورقة نظام مقترح لمهمة IWPT 2021 المشتركة بشأن التحليل في التبعيات العالمية المعززة (EUD).نقترح نظام مقرها إعادة كتابة الرسم البياني لحساب التبعيات العالمية المحسنة، بالنظر إلى التبعيات العالمية الأساسية (UD).
التعليق التوضيحي المعرفي العالمي (UCCA) هو مخطط توضيحي دلالي ينظم النصوص في هيكل الوسائد الخشن، مما يوفر تغطية واسعة من الظواهر الدلالية.في الوقت نفسه، لا تزال هناك حاجة إلى علاج محمظ من العديد من الفئات.فئة الإعلان ذات أهمية خاصة، حيث تغطي مجموعة وا
تجارب تفاصيل الورقة هذه التي أجريناها في التبعيات العالمية 2.7 كورسا من أجل التحقيق في أمر الكلمات المهيمنة في اللغات المتاحة.لهذا الغرض، استخدمنا أداة إعادة كتابة الرسم البياني، نمت، والتي سمحت لنا بتجاوز التعليقات التوضيحية السطح وتحديد الموضوعات ا
في هذه الورقة نناقش العديد من التحديات المتعلقة بتطوير لعبة ثلاثية الأبعاد، تهدف هدفها إلى زيادة الوعي بالتبريد الإلكتروني أثناء جمع التوضيح اللغوي في اللغة الهجومية.من المفترض أن تستخدم اللعبة من قبل المراهقين، وبالتالي رفع عدد من القضايا التي يجب م