نقدم في بحثنا طريقة بسيطة, لتمييز صور المحارف المكتوبة يدوياً بالاعتماد
على عمليات التنقيب التنبئي. و ذلؾ من خلال استخراج إحداثيات النقاط السوداء من
صور المحارف الثنائية اللون (أسود, أبيض) المستخدمة في مراحل التدريب و الاختبار.
و تخزينها في قاعدة
بيانات, و فق بنية مناسبة لعمليات التنقيب التنبئي (بيانات تدريب
و بيانات اختبار). و من ثم استخدام بيانات التدريب المستخرجة لبناء نموذج تنبئي يساعد
على تمييز صور الاختبار, اعتماداً على خصائصها المستخرجة. و قد أجرينا عدة
اختبارات على عينات مختلفة من صور المحارف المكتوبة يدوياً, و حصلنا على نتائج
دقيقة, ضمن الشروط المطلوبة.
قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية
و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات
أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق
النصوص العربية باست
خدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات
مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا
الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.