دراسة حول تصنيف النصوص العربية باستخدام الأنطولوجيات


الملخص بالعربية

نقدم في هذا البحث خوارزمية لتجميع نصوص اللغة العربية. حيث نفذنا الخوارزمية على 5 أنطولوجيات عبر برنامج بلغة الجافا، ثم عالجنا النصوص بحيث حصلنا على 338667 مفردة مع أوزانها المقابلة لكل أنطولوجيا. و قد أثبتت الخوارزمية فعاليتها في تحسين أداء المصنفات التي تم تجربتها في هذه الدراسة و هي (NB,SVM) مقارنة مع نتائج مصنفات اللغة العربية السابقة.

المراجع المستخدمة

AL-Ghuribi,S Alshomrani,S. 2014. Bi-languages mining algorithm for classifying text documents (BiLTc), International Jornal of Academic Research Part A Vol. 6 No. 5, 16-25
Gruber,T. 1993. A translation approach to providing portable ontology specifications, Knowledge Acquisition, Vol.5 No 2, 199-220
Hastie,T Tibshirani,R Friedman.J. 2013-The elements of Statistical Learning - Data Mining, Inference, and Prediction. Springer-Verlag, second Ed, Berlin,764p

تحميل البحث