تعمل الأعمال الموجودة على استخراج المعلومات (IE) بشكل أساسي المهام الرئيسية الأربعة بشكل منفصل (إبلاغ الكيان بالاعتراف بالاعتراف، واستخراج العلاقة، والكشف عن الحدث، واستخراج الوسيطة)، وبالتالي الفشل في الاستفادة من التبعيات بين المهام. تقدم هذه الورقة نموذجا تعليميا عميقا جديدا لحل المهام الأربع الأربعة في وقت واحد في نموذج واحد (يسمى Fourie). بالمقارنة مع عدد قليل من العمل السابق في أداء مهام IE المشتركة، تتميز Fourie بمساهمات جديدة لالتقاط التبعيات بين المهام. أولا، في مستوى التمثيل، نقدم رسم بياني تفاعل بين مثيلات المهام الأربعة المستخدمة لإثراء تمثيل التنبؤ بمثيل واحد مع أولئك من مثيلات المهام الأخرى ذات الصلة. ثانيا، على مستوى العلامة، نقترح رسم بياني للاعتماد لأنواع المعلومات في المهام الأربعة IE التي تلتقط الاتصالات بين الأنواع المعبر عنها في جملة مدخلات. يتم تقديم آلية تنظيمية جديدة لإنفاذ الاتساق بين الرسوم البيانية الذهبية المتوقعة والتنبؤ بها لتحسين تعلم التمثيل. نظهر أن النموذج المقترح يحقق الأداء الحديثة للمفصل IE على كل من إعدادات التعلم أحادية اللغات وغير اللغوية بأثلاثة لغات مختلفة.
Existing works on information extraction (IE) have mainly solved the four main tasks separately (entity mention recognition, relation extraction, event trigger detection, and argument extraction), thus failing to benefit from inter-dependencies between tasks. This paper presents a novel deep learning model to simultaneously solve the four tasks of IE in a single model (called FourIE). Compared to few prior work on jointly performing four IE tasks, FourIE features two novel contributions to capture inter-dependencies between tasks. First, at the representation level, we introduce an interaction graph between instances of the four tasks that is used to enrich the prediction representation for one instance with those from related instances of other tasks. Second, at the label level, we propose a dependency graph for the information types in the four IE tasks that captures the connections between the types expressed in an input sentence. A new regularization mechanism is introduced to enforce the consistency between the golden and predicted type dependency graphs to improve representation learning. We show that the proposed model achieves the state-of-the-art performance for joint IE on both monolingual and multilingual learning settings with three different languages.
المراجع المستخدمة
https://aclanthology.org/
تبادل مهام التحليل الدلالي الغني، مثل تمثيل المعنى التجريدي (AMR)، أهداف مماثلة مع استخراج المعلومات (أي) تحويل نصوص اللغة الطبيعية إلى تمثيلات دلالية منظم.للاستفادة من مثل هذه التشابه، نقترح إطارا رواية موجه AMR لاستخراج المعلومات المشترك لاكتشاف ال
ندرس مشكلة تحديد السببية الحدث (ECI) للكشف عن العلاقة السببية بين الحدث تذكر أزواج في النص. على الرغم من أن نماذج التعلم العميق أظهرت مؤخرا الأداء الحديثة من أجل ECI، إلا أنها تقتصر على إعداد الجملة حيث يتم تقديم الحدث أزواج في نفس الجمل. يعالج هذا ا
نهج تحديد استعارة الحديثة النظر أساسا في ميزات النص السياقية في غضون جملة أو إدخال ميزات لغوية خارجية إلى النموذج. لكنهم عادة ما يتجاهلون المعلومات الإضافية التي يمكن أن توفرها البيانات، مثل معلومات الاستعارة السياقية ومعلومات الخطاب الأوسع نطاقا. في
أظهرت التقدم المحرز الأخير في نماذج اللغة المستندة إلى المحولات الاحترام نجاحا كبيرا في تعلم التمثيل السياقي للنص.ومع ذلك، نظرا لتعقيد الاهتمام من الدرجة الثانية، يمكن لمعظم نماذج المحولات مسبقا التعامل مع النص القصير نسبيا.لا يزال يمثل تحديا عندما ي
نحن نقدم مخطط شرح حالة إعلام من المحبوس الذي يتبع مباشرة من نموذج وحدة مجردة تدريجية لمعالجة الحوار عند استخدامها داخل إعداد متعدد الوسائط والشريط المشترك.نوضح نموذج الوحدة الإضافية وإعطاء طلب مثال باستخدام مجموعة بيانات الروايات المترجمة، ثم تقديم طرق للبحث في المستقبل.