ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج الحدث بالبروز يجمع بين محلل نحانوني مقرها المعرفة ومصنف بيرت للهولندية

Event Prominence Extraction Combining a Knowledge-Based Syntactic Parser and a BERT Classifier for Dutch

212   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

المهمة الأساسية في استخراج المعلومات هي اكتشاف الحدث الذي يحدد مشغلات الحدث في الجمل التي يتم تصنيفها عادة في أنواع الأحداث. في هذه الدراسة، يعتبر الحدث وحدة لقياس التنوع والتشابه في مقالات إخبارية في إطار نظام أخبار التوصية. فشلت نهج اكتشاف الحدث المستندة إلى التصنيف الحالي في التعامل مع مجموعة متنوعة من الأحداث المعبر عنها في مواقف العالم الحقيقي. للتغلب على ذلك، نهدف إلى أداء تصنيف حفلات الأحداث واستكشاف ما إذا كان نموذج محول قادر على تصنيف معلومات جديدة في فصول بروز أقل وأكثر عمومية. بعد مقارنة خط الأساس من آلة ناقلات الدعم (SVM) وعروض التصنيف القائم على المحولات لدينا في العديد من تنسيقات سبين الأحداث، فقد تم تصميمنا حدث متعدد الكلام يمتد كشروط سليمة. يتم تغذية تلك الموجودة في تصنيفنا البرز الذي يتم ضبطه بشكل جيد على Adgeddings الهولندية المدربة مسبقا. علاوة على ذلك، نحن نتفوق على خط أنابيب لنهج حقل عشوائي مشروط (CRF) في اكتشاف كلمة الزناد في الأحداث والتصنيف المستند إلى BERT. إلى حد ما من معرفتنا، نقدم أول نهج استخراج الأحداث الذي يجمع بين محلل نصلي مقصورات مقره الخبراء مع مصنف تحويل محول للهولندية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

منطق episodic: نموذج منطقي غير مشدود '' (el-elf) هو تمثيل دلالي يلتقط بنية حجة المسنون وكذلك جوانب أكثر تحديا للغة داخل الشكليات المنطقية الباردة.نقدم النهج المستفاد الأول لأول مرة لتحليل الجمل إلى ULFS، باستخدام مجموعة متزايدة من الأمثلة المشروحة.تو فر النتائج خط أساس قوي للتحسين في المستقبل.تتعلم طريقتنا نموذج تسلسل إلى تسلسل للتنبؤ بتسلسل إجراء الانتقال داخل نظام انتقال ذاكرة التخزين المؤقت المعدلة.نقوم بتقييم فعالية القيود القائمة على القواعد، معجم من كلمة إلى رمز، وميزات ولاية نظام الانتقال في هذه المهمة.نظامنا متاح في https://github.com/genelkim/ulf-transition-parser.ونحن نقدم أيضا بيانات Oulf Oullf الرسمية الأولى في HTTPS://www.cs.rochester.edu/u/gkim21/ulf/resources/.
في السنوات الأخيرة، أثبتت نماذج اللغة المدربة مسبقا (PLM) مثل بيرت فعالة للغاية في مهام NLP المتنوعة مثل استخراج المعلومات وتحليل المعنويات والرد على الأسئلة.تدربت مع نص المجال العام الضخم، هذه النماذج اللغوية المدربة مسبقا تلتقط معلومات النحوية والد لية والجلطة الغنية في النص.ومع ذلك، نظرا للاختلافات بين نص مجال عام ومحدد (E.G.، Wikipedia مقابل ملاحظات عيادة)، قد لا تكون هذه النماذج مثالية للمهام الخاصة بالمجال (على سبيل المثال، استخراج العلاقات السريرية).علاوة على ذلك، قد يتطلب الأمر معرفة طبية إضافية لفهم النص السريري بشكل صحيح.لحل هذه القضايا، في هذا البحث، نقوم بإجراء فحص شامل للتقنيات المختلفة لإضافة المعرفة الطبية إلى نموذج برت مدرب مسبقا لاستخراج العلاقات السريرية.تتفوق أفضل طرازنا على مجموعة بيانات استخراج الحالة الإكلينيكية من أحدث طراز I2B2 / VA 2010.
تركز أساليب استخراج العلاقة الحالية (إعادة) عادة على استخراج الحقائق العلائقية بين أزواج الكيان داخل جمل أو مستندات واحدة.ومع ذلك، لا يمكن استنتاج كمية كبيرة من الحقائق العلائقية في قواعد المعرفة إلا في جميع الوثائق في الممارسة.في هذا العمل، نقدم مشك لة إعادة الوثيقة العملية، مما يجعل خطوة أولية نحو اكتساب المعرفة في البرية.لتسهيل البحث، نقوم ببناء أول مجموعة بيانات عبر الوثيقة المشروح البشرية.مقارنة مع مجموعات البيانات الحالية، تقدم Codred تحديين رئيسيين: بالنظر إلى كيانين، (1) يتطلب إيجاد المستندات ذات الصلة التي يمكن أن توفر أدلة لتحديد علاقاتها؛(2) يتطلب التفكير في مستندات متعددة لاستخراج الحقائق العلائقية.نقوم بإجراء تجارب شاملة لإظهار أن Codred هو تحدي أساليب إعادة الخدمات القائمة بما في ذلك النماذج القاعدة القائمة على بيرت.
نحن تصف محلول Nuig لمهمة IWPT 2021 بمهمة التعبير المعزز (ED) معزز بلغات متعددة.بالنسبة لهذه المهمة المشتركة، نقترح وتقييم محلل إد المحلي المستند SEQ2SEQ SEQ2SEQ ومقرها SEQ2SEQ الذي يتنبأ بمجموعة ED-Parse من جملة مدخلات معينة كأسلسلة موضعية موضعية للن موذج النسبي.نموذجنا المقترح هو شبكة عصبية متعددة الاستخدامات تؤدي خمس مهام رئيسية في وقت واحد وهي وضع علامات UPOS، ووضع العلامات UFEAT، والليمون، والتحليل التبعية والحد من التحليل.علاوة على ذلك، نستخدم النموذج اللغوي المتاح في قاعدة بيانات Wals لتحسين قدرة محللنا المحترفين المقترحين على الانتقال عبر اللغات.تشير النتائج إلى أن SEQ2SEQ ED-Parser المقترح لدينا يؤدي على قدم المساواة مع محلل ED-Art-Art على الرغم من وجود علامة أبسط.
الهوية واللغة القياسية الهوية هي مهام حاسمة للعديد من تطبيقات معالجة اللغة العربية.في هذه الورقة، نقدم نظامنا القائم على التعلم العميق، المقدم إلى المهمة المشتركة الثانية من النادي الثاني لتحديد المستوى القطري على مستوى المحافظة على اللغة العربية الم عيارية الحديثة (MSA) واللهولية العربية (DA).يعتمد النظام على نموذج تعليمي عميق متعدد الإنهائي (MTL) لمعالجة كلا من الرتبة البلد والمستوى من المستوى MSA / DA.يتكون نموذج MTL الأخير من محولات تمثيل ترميز ترميز مشترك (بيرت)، طبقات اهتمام خاصتين بمهام العمل، واثنين من المصنفين.تتمثل فكرتنا الرئيسية في الاستفادة من كل من التمييز على المهمة والميزات المشتركة بين المهام للبلد والمقاطعة MSA / DA الهوية.تظهر النتائج التي تم الحصول عليها أن نموذج MTL يتفوق على نماذج مهمة واحدة في معظم المهام الفرعية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا