مراجعة حول نهج استخراج معلومات المستند


الملخص بالعربية

أصبح استخراج المعلومات من المستندات استخداما رائعا لمناطق معالجة اللغة الطبيعية الجديدة. معظم منهجيات استخراج الكيانات متغير في سياق مثل المنطقة الطبية، المنطقة المالية، كما تقتصر على اللغة المحددة. من الأفضل أن يكون لديك نهج عام واحد ينطبق على أي نوع مستند لاستخراج معلومات الكيان بغض النظر عن اللغة والسياق والهيكل. أيضا، هناك مشكلة أخرى في هذا البحث تحليل هيكلي مع الحفاظ على ميزات التسلسل الهرمي والدلي والمثير. مشكلة أخرى تم تحديدها هي أنه عادة، فإنه يتطلب كوربا تدريب ضخما. لذلك، يركز هذا البحث على التخفيف من هذه الحواجز. تم تحديد العديد من النهج نحو بناء مستخرجات معلومات المستندات التي تركز على تخصصات مختلفة. تتضمن منطقة البحث هذه معالجة اللغة الطبيعية والتحليل الدلالي واستخراج المعلومات والنمذجة المفاهيمية. تقدم هذه الورقة مراجعة لآلية استخراج المعلومات لبناء إطار عام لاستخراج المستندات بهدف توفير قاعدة صلبة للبحث القادم.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث