أصبحت الرسوم البيانية المستمدة وتعديل الرسوم البيانية من نص اللغة الطبيعية تقنية أساس متعدد الاستخدامات لاستخراج المعلومات مع التطبيقات في العديد من المواد الفرعية، مثل بناء الرسم البياني الدلالي أو المعرفة الرسم البياني. استخدم العمل الأخير هذه التقنية لتعديل الرسوم البيانية المشهد (هو et al. 2020)، من خلال الترميز أولا الرسم البياني الأصلي ثم إنشاء واحد المعدلة بناء على هذا الترميز. في هذا العمل، نوضح أنه يمكننا زيادة الأداء بشكل كبير في هذه المشكلة من خلال صياغة ذلك كملحق رسم بياني بدلا من جيل الرسم البياني. نقترح النموذج الأول لمشكلة امتداد الرسم البياني الناتج استنادا إلى وضع العلامات التسلسل التلقائي. في مجموعات بيانات تعديل الرسم البياني المشهد، يؤدي هذا الصيانة إلى تحسينات في الدقة على أحدث من بين الفنين بين 13 نقطة مئوية 24 نقطة. علاوة على ذلك، نقدم بيانات جديدة مجموعة من المجال الطبي الطبيعي والتي لديها تقلب لغوي أكبر بكثير ورسم رسوم بيانية أكثر تعقيدا من مجموعات بيانات تعديل الرسم البياني المشهد. بالنسبة إلى مجموعة البيانات هذه، فشلت حالة الفن في التعميم، في حين أن طرازنا يمكن أن ينتج تنبؤات ذات مغزى.
Deriving and modifying graphs from natural language text has become a versatile basis technology for information extraction with applications in many subfields, such as semantic parsing or knowledge graph construction. A recent work used this technique for modifying scene graphs (He et al. 2020), by first encoding the original graph and then generating the modified one based on this encoding. In this work, we show that we can considerably increase performance on this problem by phrasing it as graph extension instead of graph generation. We propose the first model for the resulting graph extension problem based on autoregressive sequence labelling. On three scene graph modification data sets, this formulation leads to improvements in accuracy over the state-of-the-art between 13 and 24 percentage points. Furthermore, we introduce a novel data set from the biomedical domain which has much larger linguistic variability and more complex graphs than the scene graph modification data sets. For this data set, the state-of-the art fails to generalize, while our model can produce meaningful predictions.
References used
https://aclanthology.org/
Complex natural language applications such as speech translation or pivot translation traditionally rely on cascaded models. However,cascaded models are known to be prone to error propagation and model discrepancy problems. Furthermore, there is no p
A mind-map is a diagram that represents the central concept and key ideas in a hierarchical way. Converting plain text into a mind-map will reveal its key semantic structure and be easier to understand. Given a document, the existing automatic mind-m
Sentence fusion is a conditional generation task that merges several related sentences into a coherent one, which can be deemed as a summary sentence. The importance of sentence fusion has long been recognized by communities in natural language gener
The task of dialogue rewriting aims to reconstruct the latest dialogue utterance by copying the missing content from the dialogue context. Until now, the existing models for this task suffer from the robustness issue, i.e., performances drop dramatic
This paper describes a system proposed for the IWPT 2021 Shared Task on Parsing into Enhanced Universal Dependencies (EUD). We propose a Graph Rewriting based system for computing Enhanced Universal Dependencies, given the Basic Universal Dependencies (UD).