تقدم هذه الورقة مجموعة بيانات من حكايات خرافية الألمانية، المشروح يدويا مع شبكات الأحرف التي تم الحصول عليها مع اتفاق متزايد في الترحيل.يوفر إصدار هذه الدولة فرصة للتدريب ومقارنة خوارزميات مختلفة لاستخراج شبكات الأحرف، والتي كانت بالكاد حتى الآن بسبب المصالح غير المتجانسة للباحثين السابقين.نوضح فائدة بياناتنا المحددة من خلال توفير تجارب أساسية لاستخراج شبكات الأحرف التلقائية، وتطبيق خط أنابيب قائم على القواعد وكذلك النهج العصبي، والعثور على النهج العصبي تفوق نهج القواعد في معظم إعدادات التقييم.
This paper presents a data set of German fairy tales, manually annotated with character networks which were obtained with high inter rater agreement. The release of this corpus provides an opportunity of training and comparing different algorithms for the extraction of character networks, which so far was barely possible due to heterogeneous interests of previous researchers. We demonstrate the usefulness of our data set by providing baseline experiments for the automatic extraction of character networks, applying a rule-based pipeline as well as a neural approach, and find the neural approach outperforming the rule-approach in most evaluation settings.
المراجع المستخدمة
https://aclanthology.org/
تعتمد شبكات الند للند على التعاون بين المستخدمين والتشارك في الموارد، و قد شاع استخدام هذا النوع من الشبكات في كثير من التطبيقات، من أشهرها مشاركة الملفات. تقسم تطبيقات مشاركة الملفات، المعتمدة على بنية الند للند إلى منظومات مركزية (تعتمد على وجود مخ
توضح هذه الورقة مشروع Glaux (اللغة اليونانية الآلية ")، بذل جهد مستمر لتطوير كورب غاميرية طويلة الأجل من اليونانية، تغطي ستة عشر قرنا من المواد الأدبية وغير الأدبية المشروح مع طرق NLP.بعد تقديم نظرة عامة على مشاريع Corpus ذات الصلة ومناقشة الهندسة ال
تقارير الورقة عن دراسة كوربوس للإنشاءات الفعلية للأفعال الألمانية (LVCS).تأتي LVCS في العائلات التي تجسد أنماط الترجمة المنهجية.الهدف من الورق هو حساب الخصائص التي تحدد هذه الأنماط على أساس دراسة Corpus حول LVCS الألمانية من النوع STEHEN UNTER "NP" (الوقوف تحت NP ").
من الناحية التاريخية، يتم إهمال اللغة القانونية الألمانية على نطاق واسع في أبحاث NLP، خاصة في أنظمة التلخيص، لأن معظمها يعتمد على مقالات الصحف الإنجليزية. في هذه الورقة، نقترح مهمة تلخيص أحكام المحكمة الألمانية. نظرا لتعقيدها وطولها، فمن الأهمية بمكا
يتم تعريف Sememes على أنها الوحدات الذرية لوصف المعنى الدلالي للمفاهيم.نظرا لصعوبة التعليق يدويا في التسجيل يدويا واستنادا إلى التعليق بين الخبراء، فقد تم اقتراح مهمة تنبؤات النظرة المعجمية.ومع ذلك، فإن الأساليب السابقة تعتمد بشدة على Word أو Artters