إن استخلاص المعلومات هي مهمة العثور على المعلومات المنظمة من نص غير
منظم أو نص شبه منظم و هي مهمة هامة في التنقيب بالنصوص و قد تمت دراستها
على نطاق واسع في الأوساط البحثية المختلفة بما في ذلك معالجة اللغة الطبيعية،
و استرجاع المعلومات و التنقيب عل
ى شبكة الإنترنت إضافة إلى مجموعة واسعة من
التطبيقات في مجالات التنقيب في الطب الحيوي و الذكاء التجاري.
هناك مهمتين أساسيتين لاستخلاص المعلومات و هما التعرف على الكيان
و استخلاص العلاقة، المهمة الأولى تشير إلى العثور على الكيانات ذات العلاقة مثل
الأشخاص و أسماء الشركات و المواقع ، و المهمة الأخرى تشير إلى العثور على
العلاقات الدلالية بين هذه الكيانات.
في الآونة الأخيرة حدث تضخم للمعلومات على شكل أخبار ومقالات مختلفة وجزء كبير من هذه البيانات يكون بشكل غير منظم