إن استخراج وسيطة الحدث الضمني (EAE) هي مهمة حاسمة لاستخراج المعلومات على مستوى المستندات تهدف إلى تحديد حجج الحدث بما يتجاوز مستوى الجملة.على الرغم من الجهود العديدة لهذه المهمة، فإن عدم وجود بيانات تدريبية كافية قد أعاقت الدراسة.في هذه الورقة، نأخذ منظورا جديدا لمعالجة قضية Sparsity الخاصة بالبيانات التي تواجهها EAE الضمنية، من خلال سد المهمة مع فهم القراءة بالآلة (MRC).على وجه الخصوص، نحن ابتكرت نظاميين تكبير البيانات عبر MRC، بما في ذلك: 1) يتيح نقل المعرفة الضمني، مما يتيح نقل المعرفة من المهام الأخرى، من خلال بناء إطار تدريب موحد في صياغة MRC، و 2) تكبير بيانات صريح، والتي يمكن أن تولد جديدا جديداأمثلة تدريبية، عن طريق علاج نماذج MRC كهندان.لقد بررت التجارب الواسعة فعالية نهجنا - - لا يحصل فقط على أداء حديثة على معيارين، ولكن أيضا يوضح نتائج متفوقة في سيناريو منخفضة البيانات.
Implicit event argument extraction (EAE) is a crucial document-level information extraction task that aims to identify event arguments beyond the sentence level. Despite many efforts for this task, the lack of enough training data has long impeded the study. In this paper, we take a new perspective to address the data sparsity issue faced by implicit EAE, by bridging the task with machine reading comprehension (MRC). Particularly, we devise two data augmentation regimes via MRC, including: 1) implicit knowledge transfer, which enables knowledge transfer from other tasks, by building a unified training framework in the MRC formulation, and 2) explicit data augmentation, which can explicitly generate new training examples, by treating MRC models as an annotator. The extensive experiments have justified the effectiveness of our approach --- it not only obtains state-of-the-art performance on two benchmarks, but also demonstrates superior results in a data-low scenario.
المراجع المستخدمة
https://aclanthology.org/
لقد أثبتت تدريب الخصم (AT) كطريقة تنظيمي فعاليتها على المهام المختلفة.على الرغم من وجود تطبيقات ناجحة في بعض مهام NLP، إلا أن الخصائص المميزة لمهام NLP لم يتم استغلالها.في هذه الورقة، نهدف إلى تطبيق مهام فهم القراءة (MRC).علاوة على ذلك، فإننا نتكيف م
نحن ندرس مشكلة استخراج وسيطة الأحداث عبر اللغات (CEAE). تهدف المهمة إلى التنبؤ بأدوار حجة من يذكر الأحداث في النص، والتي تختلف لغتها عن اللغة التي تم تدريبها على نموذج تنبؤي. أظهر العمل السابق على CEAE الفوائد المتبادلة لأشجار الاعتماد الشامل في التق
تعظيم البيانات غير المزعجة (UDA) هي تقنية شبه بيئية تنطبق على فقدان الاتساق لمعاقبة الاختلافات بين تنبؤات النماذج على (أ) أمثلة ملحوظة (غير مسفحة)؛ و (ب) الأمثلة الواضحة المقابلة التي تم إنتاجها عبر تكبير البيانات. في حين أن UDA اكتسبت شعبية لتصنيف ا
تقدم هذه الورقة المهمة المشتركة Semeval-2021 4: قراءة الفهم من معنى مجردة (Recam). تم تصميم هذه المهمة المشتركة للمساعدة في تقييم قدرة الآلات في تمثيل وفهم مفهوم مجردة. يتعين على النظام المقابل، من المتوقع أن يختار نظام المشاركة، الإجابة الصحيحة من خ
في هذه الورقة، نقدم مجموعة بيانات مفهوم التحقق من قراءة جديدة تسمى vgaokao من اختبارات اللغة الصينية في Gaokao.تختلف عن الجهود الحالية، تم تصميم مجموعة البيانات الجديدة في الأصل لتقييم المتحدثين الأصليين، وبالتالي تتطلب مهارات تفاهم لغة أكثر تقدما.لم