ترغب بنشر مسار تعليمي؟ اضغط هنا

إن استخلاص المعلومات هي مهمة العثور على المعلومات المنظمة من نص غير منظم أو نص شبه منظم و هي مهمة هامة في التنقيب بالنصوص و قد تمت دراستها على نطاق واسع في الأوساط البحثية المختلفة بما في ذلك معالجة اللغة الطبيعية، و استرجاع المعلومات و التنقيب عل ى شبكة الإنترنت إضافة إلى مجموعة واسعة من التطبيقات في مجالات التنقيب في الطب الحيوي و الذكاء التجاري. هناك مهمتين أساسيتين لاستخلاص المعلومات و هما التعرف على الكيان و استخلاص العلاقة، المهمة الأولى تشير إلى العثور على الكيانات ذات العلاقة مثل الأشخاص و أسماء الشركات و المواقع ، و المهمة الأخرى تشير إلى العثور على العلاقات الدلالية بين هذه الكيانات.
قواعد الارتباط هي حقل هام في التنقيب عن البيانات، و الذي يُستخدم لاكتشاف معرفة مفيدة من قواعد بيانات ضخمة. و تُستخدم قواعد الارتباط لاستخلاص معلومات من صفقات قواعد البيانات. و خوارزمية الأسبقية هي التطبيق العملي لقواعد الارتباط، و بدورها تُستخدم ل إيجاد مجموعات من البيانات المتكررة في صفقات قواعد البيانات. نقدّم في هذا البحث تحسيناً جديداً لخوارزمية الأسبقية بتخفيض توليد مجموعات بنود البيانات المُرشّحة مما يؤدي إلى زيادة فعّالية خوارزمية الأسبقية.
استخدمت نظم استخلاص العلاقة استخداماً واسعاً للميزات المولدة من وحدات التحليل اللغوي. إذ تؤدي الأخطاء في هذه المميزات إلى أخطاء في كشف العلاقة و تصنيفها. في هذا البحث، نخرج من هذه الطرق التقليدية مع بنية مميز معقدة من خلال تقديم الشبكات العصبونية الالتفافية لاستخلاص العلاقة التي تتعلم تلقائيا ميزات من الجمل و تقلل من الاعتماد على مجموعة الأدوات و المصادر الخارجية. نموذجنا يأخذ مزايا أحجام لنوافذ متعددة للمرشحات و تضمينات الكلمة المدربة سابقا كدخل لبنية غير ثابتة لتحسين الأداء.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا