نحاول في هذا البحث أن نتناول أنظمة استخراج المعلومات المعتمدة على الأنتولوجي من خلال دراسة مرجعية مفصلة و شاملة، و نميز بينها و بين أنظمة أخرى مثل أنظمة استرجاع المعلومات و التنقيب في البيانات و كما نحاول أن نحدد البنية العامة لمثل هذه الأنظمة التي تشكل جزء من أنظمة أكبر مهمتها الإجابة على استفسارات المستخدمين بالاعتماد على المعلومات المستخرجة. بعد ذلك نستعرض الأنواع المختلفة لهذه الانظمة و التقنيات المستخدمة فيها و من ثم نحاول حصر التحديات الحالية و المستقبلية و ما يترتب عليها من مشاكل بحث.
و في النهاية نناقش تفاصيل التحقيقات المختلفة لهذه الانظمة من خلال شرح منصتي عمل للوسم الدلالي و هما (OpenCalais) و (Gate)
و نحاول المقارنة بين أنظمة الاستخراج الخاصة بهما و مناقشة النتائج.
We aimed to distinguish between them and the other research areas such as information retrieval and data mining. we tried to determine the general structure of such systems which form a part of larger systems that have a mission to answer user queries based on the extracted information. we reviewed the different types of these systems, used techniques with them and tried to define the current and future challenges and the consequent research problems.
Finally we tried to discuss the details of the various
implementations of these systems by explaining two platforms Gate and OpenCalais and comparing between their information
extraction systems and discuss the results.
المراجع المستخدمة
Berners Lee T, Hendler J, Lassila O, 2001, The Semantic Web, Scientific American
Hitzler P, Krötzsch M ,Rudolph S , 2009 , Foundations of Semantic Web Technologies Chapman& Hall/CRC
(Popov B, Kiryakov A , Kirilov A ,Manov D, Ognyanoff D , Goranov M , 2003, KIM – Semantic Annotation Platform . In: Proceedings of the 2nd International Semantic Web Conference, (Springer-Verlag, Berlin
Maynard D, 2014,Text Analysis with GATE، University of Sheffield، Search Solutions
يُعتبر الويب الدلالي ثورة جديدة في عالم الويب، حيث تصبح المعلومات و البيانات قابلة للمعالجة منطقياً من قِبل برامج الحاسوب، بحيث تتحول تلك المعلومات و البيانات إلى شبكة معارف ذات معنى مُحدّد. يُشكّل الويب الدلالي مستقبل الويب الحالي مع الإشارة إلى أن
فهم المعنى الدلالي للمحتوى على الويب من خلال عدسة الكيانات والمفاهيم له العديد من المزايا العملية.ومع ذلك، عند بناء أنظمة استخراج الكيانات على نطاق واسع، يواجه الممارسون تحديات فريدة تنطوي على إيجاد أفضل الطرق للاستفادة من نطاق البيانات ومجموعة متنوع
في الأعوام السابقة ظهر ويب جديد يعمل على التوازي مع الويب التقليدي، هو ويب البيانات المترابطة، و يكمن جوهره في تقديم البيانات بصيغة قابلة للفهم من قبل الآلة. و ذلك من خلال وصف هذه البيانات باستخدام مجموعة من المفردات تدعى انطولوجيا الويب، و في هذا ال
هذه المقالة تحوي ترجمة وتلخيص وتوضيح للمذكور في الورقة البحثية المذكور اسمها أعلاه والموجودة في https://annals-csis.org/Volume_8/pliks/221.pdf , والتي تقوم باستخراج المعلومات الدلالية المهمة الموجودة في الوثائق والملفات والأوراق البحثية .
تسمح منهجيات هندسة الوب Web Engineering بتمثيل خدمات الوب العادية و نمذجتها ضمن دورة الحياة البرمجية لتطوير تطبيقات الوب Web Development ضمن ما يسمى البنى الموجهة بالخدمات (Service Oriented Architecture (SOA, و لكن تتفاوت هذه المنهجيات في طريقة دعمها