ترغب بنشر مسار تعليمي؟ اضغط هنا

The Fairynet Corpus - شبكات الأحرف من أجل حكايات خرافية الألمانية

The FairyNet Corpus - Character Networks for German Fairy Tales

157   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة مجموعة بيانات من حكايات خرافية الألمانية، المشروح يدويا مع شبكات الأحرف التي تم الحصول عليها مع اتفاق متزايد في الترحيل.يوفر إصدار هذه الدولة فرصة للتدريب ومقارنة خوارزميات مختلفة لاستخراج شبكات الأحرف، والتي كانت بالكاد حتى الآن بسبب المصالح غير المتجانسة للباحثين السابقين.نوضح فائدة بياناتنا المحددة من خلال توفير تجارب أساسية لاستخراج شبكات الأحرف التلقائية، وتطبيق خط أنابيب قائم على القواعد وكذلك النهج العصبي، والعثور على النهج العصبي تفوق نهج القواعد في معظم إعدادات التقييم.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعتمد شبكات الند للند على التعاون بين المستخدمين والتشارك في الموارد، و قد شاع استخدام هذا النوع من الشبكات في كثير من التطبيقات، من أشهرها مشاركة الملفات. تقسم تطبيقات مشاركة الملفات، المعتمدة على بنية الند للند إلى منظومات مركزية (تعتمد على وجود مخ دم مركزي لتنظيم العمل) و منظومات موزعة، كما يمكن أن تقسم إلى منظومات بنيوية أو غير بنيوية، تبعاً لآلية إدارة المعلومات و تنظيمها ضمن المنظومة. يقدم هذا المقال تطبيق ند لند مركزياً يستخدم من أجل مشاركة الملفات فضلاً عن نتائج الاختبارات على هذا التطبيق، التي تؤكد ميزات شبكات الند للند من حيث التصعيد الكبير و وثوقية التطبيق.
توضح هذه الورقة مشروع Glaux (اللغة اليونانية الآلية ")، بذل جهد مستمر لتطوير كورب غاميرية طويلة الأجل من اليونانية، تغطي ستة عشر قرنا من المواد الأدبية وغير الأدبية المشروح مع طرق NLP.بعد تقديم نظرة عامة على مشاريع Corpus ذات الصلة ومناقشة الهندسة ال معمارية العامة للأجنحة، فإنها تكبير عدد من القضايا المنهجية الأكبر في تصميم الأورام التاريخية.وتشمل هذه ترميز المتغيرات النصية، من خلال التعامل مع الاختلاف المبرم والتخلي عن الغموض اللغوي.وأخيرا، تتم مناقشة المنظورات طويلة الأجل لهذا المشروع.
تقارير الورقة عن دراسة كوربوس للإنشاءات الفعلية للأفعال الألمانية (LVCS).تأتي LVCS في العائلات التي تجسد أنماط الترجمة المنهجية.الهدف من الورق هو حساب الخصائص التي تحدد هذه الأنماط على أساس دراسة Corpus حول LVCS الألمانية من النوع STEHEN UNTER "NP" (الوقوف تحت NP ").
من الناحية التاريخية، يتم إهمال اللغة القانونية الألمانية على نطاق واسع في أبحاث NLP، خاصة في أنظمة التلخيص، لأن معظمها يعتمد على مقالات الصحف الإنجليزية. في هذه الورقة، نقترح مهمة تلخيص أحكام المحكمة الألمانية. نظرا لتعقيدها وطولها، فمن الأهمية بمكا ن أن يحدد الممارسون القانونيون بسرعة محتوى الحكم وبالتالي يتمكنوا من اتخاذ قرار بشأن أهمية قضية قانونية معينة. لمعالجة هذه المشكلة، نقدم مجموعة بيانات جديدة تتكون من الأحكام الألمانية 100K مع ملخصات قصيرة. تحتوي DataSet لدينا على أعلى نسبة ضغط من بين مجموعات بيانات التلخيص الأكثر شيوعا. تحتوي أحكام المحكمة الألمانية على الكثير من المعلومات الهيكلية، لذلك نقوم بإنشاء خط أنابيب مسبق المعالجة مصممة بشكل صريح إلى المجال القانوني الألماني. بالإضافة إلى ذلك، نقوم بتنفيذ أنظمة تلخيص متعددة وكذلك مبادرة وبناء مجموعة واسعة من النماذج الأساسية. أفضل نموذج لدينا يحقق درجة Rouge-1 من 30.50. لذلك مع هذا العمل، فإننا نضع الأساس الحاسم لمزيد من البحث في أنظمة التلخيص الألمانية.
يتم تعريف Sememes على أنها الوحدات الذرية لوصف المعنى الدلالي للمفاهيم.نظرا لصعوبة التعليق يدويا في التسجيل يدويا واستنادا إلى التعليق بين الخبراء، فقد تم اقتراح مهمة تنبؤات النظرة المعجمية.ومع ذلك، فإن الأساليب السابقة تعتمد بشدة على Word أو Artters dings، وتجاهل المعلومات المحبوسة الدقيقة.في هذه الورقة، نقترح طريقة رواية ما قبل التدريب والتي تم تصميمها لتحسين دمج المعلومات الداخلية للشخصية الصينية.يتم استخدام تمثيل الأحرف الصيني المحسنة Glyph (دول مجلس التعاون الخليجي) لمساعدة تنبؤة النظر.نقوم بتجربة وتقييم النموذج لدينا على HOWNET، وهو قاعدة المعرفة الشمالية الشهيرة.تظهر النتائج التجريبية أن أسلوبنا تتفوق على نماذج المعلومات غير الخارجية الموجودة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا