ترغب بنشر مسار تعليمي؟ اضغط هنا

مبادئ التقييم الواقعية لدقة Coreference عبر الوثيقة

Realistic Evaluation Principles for Cross-document Coreference Resolution

513   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نشير إلى أن ممارسات التقييم المشتركة لحل النواة المستندات كانت غير متسقة بشكل غير واقعي في إعداداتها المفترضة، مما أثار نتائج تضخيم.نقترح معالج هذه المشكلة عبر مبادئ منهجية التقييم.أولا، كما هو الحال في المهام الأخرى، ينبغي تقييم النماذج بشأن الأهمية المتوقعة بدلا من الإشراهات الذهبية.القيام بذلك يثير قضية خفية فيما يتعلق بمجموعات Singleton Comeference، والتي نتعلمها عن طريق فصل تقييم التقييم للكشف عن ربط COMELES.ثانيا، نجرب أن النماذج يجب ألا تستغل بنية الموضوع الاصطناعي لمجموعة بيانات البنك المركزي الأوروبي + المعيار، مما أجبر النماذج لمواجهة تحدي الغموض المعجمي، على النحو المقصود من قبل منشئو البيانات.نوضح بالتجريد التأثير الجذراني لمبادئ تقييمنا الأكثر واقعية لدينا على نموذج تنافسي، مما يؤدي إلى درجة أقل 33 F1 مقارنة بتقييم الممارسات اللانوية السابقة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الكيانات المتعلقة بالأحداث والأحداث في النص هي مكون رئيسي لفهم اللغة الطبيعية.دقة Coreference Coreference، على وجه الخصوص، أمر مهم بالنسبة للمصلحة المتزايدة بمهام تحليل المستندات متعددة الوثائق.في هذا العمل، نقترح نموذجا جديدا يمتد نموذج التنبؤ المتس لسل الفعال لتحليل Corefery لإعدادات تبادل المستندات وتحقق نتائج تنافسية لكلا كلا كلا كائن الكيان والحدث مع توفير أدلة قوية على فعالية كل من النماذج المتسلسلة والاستدلال المرتفعإعدادات الوثيقة عبر المستندات.يتطلب نموذجنا بشكل تدريجي يذكر في تمثيل الكتلة ويتوقع الروابط بين الإشارة والمجموعات التي تم إنشاؤها بالفعل، تقريب نموذج أعلى للترتيب.بالإضافة إلى ذلك، نقوم بإجراء دراسات بديلة الأزمة التي توفر رؤى جديدة في أهمية مختلف المدخلات وأنواع التمثيل في Courceer.
نقترح النموذج الفوري الحدث العصبي الذي يتم فيه تدريب كائن تحرير الحدث بشكل مشترك مع خمس مهام: اكتشاف الزناد، كائن كور السلاح، تصميم المشمول، اكتشاف Realis، استخراج الوسيطة.لتوجيه تعلم هذا النموذج المعقد، فإننا ندمج قيود الاتساق عبر المهام في عملية ال تعلم كقيوب ناعمة من خلال تصميم عقوبة الوظائف.بالإضافة إلى ذلك، نقترح فكرة الرواية المتمثلة في عرض كائن العناية والحقوق الحدث بمهمة كائن تحرير واحدة، والتي نعتقد أنها خطوة نحو نموذج موحد لدق السلاح.ينتج النموذج الناتج نتائج أحدث النتائج في مجموعة بيانات QBP 2017 Aquerence.
تدرس هذه الورقة مشكلة دقة Aquerence Aquerence Coursence (CDE) التي تسعى إلى تحديد ما إذا كان يذكر الحدث عبر مستندات متعددة تشير إلى نفس الأحداث في العالم الحقيقي.أظهر العمل المسبق فوائد معلومات الوسائد وسياق الوثيقة لحل فور معلومات الحدث.ومع ذلك، لم يتم التقاط هذه المعلومات بفعالية في العمل السابق ل CDECR.لمعالجة هذه القيود، نقترح نموذجا تعليميا عميقا جديدا ل CDEG الذي يقدم الرصاص الهرمي للشبكات العصبية التنافعية (GCN) إلى إشراف الكيان والحكام المشترك.على هذا النحو، تمكن GCNs مستوى الجملة من ترميز كلمات السياق المهمة لذكر الحدث وحججها بينما يهدف GCN على مستوى المستند إلى تذكر هياكل التفاعل الحدث والحجج لحساب تمثيلات الوثيقة لأداء CDU.يتم إجراء تجارب واسعة لإظهار فعالية النموذج المقترح.
تقدير أنظمة التشابه الدلالي النصي (STS) درجة تشابه معنى بين جملتين.تقدر أنظمة STS عبر اللغات درجة تشابه معنى بين جملتين، كل منها بلغة مختلفة.عادة ما تستخدم الخوارزميات الحديثة عادة نهجا بالغضب بشدة، يصعب استخدامه لغات ضعف الموارد.ومع ذلك، يحتاج أي نه ج للحصول على بيانات التقييم لتأكيد النتائج.من أجل تبسيط عملية التقييم لغات ضعف الموارد (من حيث مجموعات بيانات تقييم STS)، نقدم مجموعات بيانات جديدة ل STS عبر اللغات والأحمر غير المباشر لغات دون بيانات التقييم هذه.نقدم أيضا نتائج العديد من الطرق الحديثة على هذه البيانات التي يمكن استخدامها كأساس للحصول على مزيد من البحث.نعتقد أن هذه المقالة لن تمد فقط أبحاث STS الحالية فقط إلى لغات أخرى، ولكنها ستشجع أيضا المنافسة على هذه بيانات التقييم الجديدة.
ندرس مشكلة جديدة في التعلم عبر التحويلات المتبادلة لحدث القرار (ECR) حيث يتم تكييف النماذج المدربة على البيانات من لغة مصدر للتقييمات باللغات المستهدفة المختلفة. نقدم النموذج الأساسي الأول لهذه المهمة بناء على نموذج لغة XLM-Roberta، وهو نموذج لغوي مت عدد اللغات مسبقا. نحن نستكشف أيضا الشبكات العصبية اللغوية اللغوية (LANN) التي تتولى التمييز بين النصوص من المصدر واللغات المستهدفة لتحسين تعميم اللغة ل ECR. بالإضافة إلى ذلك، نقدم آليتين رواية لتعزيز التعلم التمثيلي العام ل LANN، والتي تتميز بما يلي: (1) محاذاة متعددة الرؤية لمعاقبة محاذاة التسمية العاصمة من Aquerence من الأمثلة في المصدر واللغات المستهدفة، و (2) النقل الأمثل إلى حدد أمثلة وثيقة في المصدر واللغات المستهدفة لتوفير إشارات تدريبية أفضل لتمييز اللغة. أخيرا، نقوم بإجراء تجارب مكثفة ل ECR عبر اللغات من الإنجليزية إلى الإسبانية والصينية لإظهار فعالية الأساليب المقترحة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا