ترغب بنشر مسار تعليمي؟ اضغط هنا

تستخدم الأساليب القائمة على نطاق واسع على نطاق واسع لمهام استخراج مفاتيح المفاتيح غير المنشأة (UKE). بشكل عام، تقوم هذه الأساليب ببساطة بحساب أوجه التشابه بين Aregeddings و Award Action، وهو غير كاف لالتقاط سياق مختلف لنموذج UKE أكثر فعالية. في هذه ا لورقة، نقترح طريقة جديدة ل UKE، حيث يتم تصميم السياقات المحلية والعالمية بشكل مشترك. من وجهة نظر عالمية، نقوم بحساب التشابه بين عبارة معينة والوثيقة بأكملها في مساحة المتجهة كما نماذج تضمينها الانتقالية. من حيث الرأي المحلي، نقوم أولا ببناء هيكل رسم بياني يستند إلى المستند حيث تعتبر العبارات كأعلى رؤوس والحواف هي أوجه التشابه بين القمم. بعد ذلك، اقترحنا طريقة حساب مركزية جديدة لالتقاط المعلومات البارزة المحلية بناء على هيكل الرسم البياني. أخيرا، نكتف على نمذجة السياق العالمي والمحلي للتصنيف. نقوم بتقييم نماذجنا على ثلاثة معايير عامة (Inspec، DUC 2001، Semeval 2010) ومقارنتها مع النماذج الموجودة في أحدث النماذج. تظهر النتائج أن نموذجنا يفوق معظم النماذج أثناء التعميم بشكل أفضل على مستندات المدخلات ذات النطاقات والطول المختلفة. تظهر دراسة الاجتثاث الإضافية أن كل من المعلومات المحلية والعالمية أمر بالغ الأهمية لمهام استخراج المفاتيح غير المنشورة.
يؤدي استخراج الموجات القصيرة تلقائيا من المستندات العلمية إلى تمثيل موجز قيم يمكن أن يفهم البشر ويمكنهم معالجة الآلات للمهام، مثل استرجاع المعلومات، تجميع المقالات وتصنيف المادة.تهتم هذه الورقة بأجزاء مقالة علمية يجب أن تعطى كمدخلات لطرق استخراج الحر ارة.تأخذ أساليب التعلم العميق الحديثة الألقاب والملخصات كمدخلات بسبب زيادة التعقيد الحسابي في معالجة التسلسلات الطويلة، في حين أن الأساليب التقليدية يمكن أن تعمل أيضا مع النصوص الكاملة.العناوين والملخصات كثيفة في الجماهيرية، ولكن غالبا ما تفوت جوانب مهمة من المقالات، في حين أن النصوص الكاملة من ناحية أخرى أكثر ثراء في الجماهيرية ولكن الكثير من الضويرة.لمعالجة هذه المفاضلة، نقترح استخدام نماذج تلخيص الاستخراجية على النصوص الكاملة للمستندات العلمية.تظهر دراستنا التجريبية على 3 مجموعات مقالات باستخدام 3 طرق استخراج المفاتيح 3 نتائج واعدة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا