استخراج الحدث بالبروز يجمع بين محلل نحانوني مقرها المعرفة ومصنف بيرت للهولندية


الملخص بالعربية

المهمة الأساسية في استخراج المعلومات هي اكتشاف الحدث الذي يحدد مشغلات الحدث في الجمل التي يتم تصنيفها عادة في أنواع الأحداث. في هذه الدراسة، يعتبر الحدث وحدة لقياس التنوع والتشابه في مقالات إخبارية في إطار نظام أخبار التوصية. فشلت نهج اكتشاف الحدث المستندة إلى التصنيف الحالي في التعامل مع مجموعة متنوعة من الأحداث المعبر عنها في مواقف العالم الحقيقي. للتغلب على ذلك، نهدف إلى أداء تصنيف حفلات الأحداث واستكشاف ما إذا كان نموذج محول قادر على تصنيف معلومات جديدة في فصول بروز أقل وأكثر عمومية. بعد مقارنة خط الأساس من آلة ناقلات الدعم (SVM) وعروض التصنيف القائم على المحولات لدينا في العديد من تنسيقات سبين الأحداث، فقد تم تصميمنا حدث متعدد الكلام يمتد كشروط سليمة. يتم تغذية تلك الموجودة في تصنيفنا البرز الذي يتم ضبطه بشكل جيد على Adgeddings الهولندية المدربة مسبقا. علاوة على ذلك، نحن نتفوق على خط أنابيب لنهج حقل عشوائي مشروط (CRF) في اكتشاف كلمة الزناد في الأحداث والتصنيف المستند إلى BERT. إلى حد ما من معرفتنا، نقدم أول نهج استخراج الأحداث الذي يجمع بين محلل نصلي مقصورات مقره الخبراء مع مصنف تحويل محول للهولندية.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث