في هذه الدراسة، لقد تطبيعنا ولميمتزات شركة الفنلندية الفنلندية القديمة باستخدام نموذج Lemmatization مدرب على النصوص من Agricola.نقوم بتحليل أنواع الخطأ التي تحدث وتظهر في عقود مختلفة، واستخدم معدل خطأ Word (WER) وأنواع الأخطاء المختلفة كوكيل لقياس الابتكار اللغوي والتغيير.نظرا لأن النهج المقترح يعمل، والآراء متصلة بتراكم التغييرات والابتكارات، مما يؤدي أيضا إلى انخفاض مستمر في دقة النموذج.تتضمن أنواع الخطأ الموصوفة أيضا العمل الإضافي في تحسين هذه النماذج، وثيقة المسائل الملحومة حاليا.كما قمنا بتدريب Adgeddings Word لمدة أربعة قرون من الفنلندية القديمة القديمة Lemmatized، والتي تتوفر على Zenodo.
In this study, we have normalized and lemmatized an Old Literary Finnish corpus using a lemmatization model trained on texts from Agricola. We analyse the error types that occur and appear in different decades, and use word error rate (WER) and different error types as a proxy for measuring linguistic innovation and change. We show that the proposed approach works, and the errors are connected to accumulating changes and innovations, which also results in a continuous decrease in the accuracy of the model. The described error types also guide further work in improving these models, and document the currently observed issues. We also have trained word embeddings for four centuries of lemmatized Old Literary Finnish, which are available on Zenodo.
المراجع المستخدمة
https://aclanthology.org/
يَبْقَى ضَبْطُ الْمَعْنَى وَ الْوُصُوْلُ إِلَيْهِ غاية كُلِّ بَاْحِثٍ فِي اللُّغَةِ، وَ مَاْ دَاْمَ الْمَعْنَى هُوَ نِتَاْج التَّرْكِيْبِ النَّحْوِيِّ فِيْ مَقَاْمٍ مُعَيَّنٍ، لَاْ بُدَّ لِذَلِكَ الْبَاْحِثِ أَلَّا يُقْصِيَ أَحَدَهُمَاْ عَلَى حِسَاْب
هدف البحث إلى تعرّف مهارات التفكير التاريخي المتضمنة في كتاب التاريخ للصف الثاني
الثانوي الأدبي، و اعتمد البحث على المنهج الوصفي، و استخدم الباحث أداة قائمة مهارات التفكير
التاريخي المكونة من ( 5 ) مهارات رئيسة، و ( 26 ) مهارة فرعية موزعة على المها
من المعروف أن الأساليب التاريخية تحتوي على أخطاء قدمتها أساليب OCR (التعرف على الأحرف البصرية) المستخدمة في عملية الرقمنة، غالبا ما يقال إنها مهينة أداء أنظمة NLP.تصحيح هذه الأخطاء يدويا هي عملية تستغرق وقتا طويلا، وقد تم الاعتماد على جزء كبير من الأ
تتعدد وجهات النظر تجاه مسألة منطق و آليات التطور التاريخي للمجتمع البشري ؛ و تختلف الرؤى و الإجابات ، إلى حد التضارب الكلي أحياناً ، حول مسائل أخرى تتصل ، عضوياً ، بالمسألة الأولى لعلّ أبرزها مسألة الصورة العامة التي يرتسم بها الخط البياني للتطور الت
يتناول البحث بدايات الكتابة التاريخية في بلاد المغرب العربي ، و يهدف إلى التعرف على خصائص التدوين التاريخي المغاربي من حيث تأخره عن الكتابات التاريخية المشرقية و مدى صلته و تأثره بها خاصةً أن الدراسات التي تناولت هذا الموضوع قليلة و ىمتفرقة ، و يعرض