العثور على سنة الكتابة لنص تاريخي له أهمية حاسمة للبحث التاريخي.ومع ذلك، نادرا ما يتم ذكر السنة الإبداعية الأصلية بشكل صريح ويجب استنتاجها من المحتوى النصي والسجلات التاريخية والقرائن الترفيزية.بالنظر إلى نص مكبس، فقد تم استخدام تعلم الجهاز بنجاح لتقدير سنة الإنتاج.في هذه الورقة، نقدم نظرة عامة على عدة طرق تقدير لمحفوظات النص التاريخية التي تمتد من القرن الثاني عشر حتى اليوم.
Finding the year of writing for a historical text is of crucial importance to historical research. However, the year of original creation is rarely explicitly stated and must be inferred from the text content, historical records, and codicological clues. Given a transcribed text, machine learning has successfully been used to estimate the year of production. In this paper, we present an overview of several estimation approaches for historical text archives spanning from the 12th century until today.
المراجع المستخدمة
https://aclanthology.org/
في هذه الدراسة، ندرس تغيير اللغة في Biji الصينية باستخدام مهمة التصنيف: تصنيف النصوص الصينية القديمة حسب الفترات الزمنية. على وجه التحديد، نحن نركز على نوع فريد من نوعه في الأدب الصيني الكلاسيكي: BIJI (حرفيا دفتر الملاحظات "أو الملاحظات الفرشاة")، أي
تقدمت نماذج اللغة المحددة مثل بيرت حالة الفن للعديد من مهام NLP. لغات غنية بالموارد، لدى المرء الاختيار بين عدد من النماذج الخاصة باللغة، في حين أن النماذج متعددة اللغات تستحق الدراسة أيضا. هذه النماذج معروفة جيدا لأدائها Croadlingual، لكنها أظهرت أي
يتزايد استخدام التعرف على الكيان المسمى (NER) على النصوص العربية القديمة بشكل مطرد.ومع ذلك، فقد تم تطوير معظم الأدوات لإرجاع اللغة الإنجليزية الحديثة أو تدربت على وثائق اللغة الإنجليزية وهي محدودة للنص العربي التاريخي.حتى أدوات NER العربية غالبا ما ت
تصف هذه الورقة التقديمات من قبل Team HWR إلى المهمة المشتركة (DLI) التي تم تنظيمها في ورشة عمل فاريدية 2021. تتضمن مجموعة تدريب DLI 16،674 تعليقات يوتيوب مكتوبة في البرنامج النصي الروماني يحتوي على نص مختلط من التعليمات البرمجية مع اللغة الإنجليزية و
لتوفير تحليل الأبحاث الأخيرة من جيل الأسئلة التلقائي من النص، أجرينا مسح 9 أوراق بين عامي 2019 إلى أوائل 2021، تم استرجاعها من الورق مع التعليمات البرمجية (PWC).تتبع بحثنا الاستطلاع الذي أبلغ عنه كردي وآخرون. (2020)، حيث يتم توفير تحليل 93 ورقة من عا