قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية
و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات
أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق
النصوص العربية باستخدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات
مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا
الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.
In our research we offer detailed study of one of the data
mining functions within the text data using the object properties in
databases. It studies the possibility of applying this function on the
Arabic texts. We use procedural query language PL / SQL that
deals with the object of Oracle databases.
Data mining model Has been built. It works on classification
of Arabic texts documents using SVM algorithm for indexing of
texts and texts preparation, Naïve Bayes algorithm to classify data
after transformation it into nested tables. So we made an evaluation
of the obtained results and conclusions.
المراجع المستخدمة
AGGARWAL, CH ,2014–Data Classification Algorithms and Applications. First Edition, Taylor & Francis Group, LLC, New York, USA,64P
ALPAYDIN, E, 2010-Introduction to Machine Learning. Second Edition, Cambridge, Massachusetts London, England, 579p
BARBER,D,2010-Bayesian Reasoning and Machine Learning. First Edition, Cambridge University Press, London, England, 610p