ملخص البحث
تقدم الورقة البحثية نظامًا برمجيًا لاستخراج المعرفة الدلالية من الوثائق البحثية بصيغة PDF. يتكون النظام من عدة خطوات تشمل استخراج المعلومات من ملفات PDF، معالجة البيانات المسبقة، استخراج الكلمات المفتاحية وكلمات الخطاب، وبناء مخزن ثلاثي (Triple-Store). يتم استخدام تقنيات معالجة اللغات الطبيعية (NLP) وعلم الدلالة (ST) لاستخراج الجمل والكلمات الهامة وفقًا لقواعد محددة تتعلق باهتمامات المستخدم. يتم تصوير العلاقات بين الجمل المستخرجة على شكل شبكة رسم بياني، ويمكن للمستخدم اقتراح قواعد جديدة لاستخراج معرفة إضافية. تم اختبار النظام على مجموعة من الأوراق البحثية المتعلقة بإنترنت الأشياء (IoT) وحقق نتائج مقبولة في استخراج المعرفة الهامة.
قراءة نقدية
دراسة نقدية: الورقة البحثية تقدم نظامًا متكاملًا لاستخراج المعرفة الدلالية من الوثائق البحثية، وهو موضوع ذو أهمية كبيرة في عصر البيانات الضخمة. ومع ذلك، يمكن تحسين النظام من خلال تضمين تقنيات أكثر تقدمًا في معالجة اللغات الطبيعية لتحليل التركيب النحوي للجمل بشكل أفضل. كما يمكن تحسين دقة استخراج المعرفة من خلال تطوير قواعد استدلال أكثر تعقيدًا. بالإضافة إلى ذلك، يمكن توسيع نطاق التطبيق ليشمل مجالات أخرى غير إنترنت الأشياء، مما يزيد من فائدة النظام في مجالات متعددة.
أسئلة حول البحث