التمثيل الدلالي الذي يدعم اختيار الشبكة المناسبة بين أزواج من الطابور يتناول بطبيعته تماسك الخطاب، وهو أمر مهم للمهام مثل الفهم السردي والحجة وتحليل الخطاب. نقترح طريقة تضمين شرطة رواية تطبق تعلم الرسم البياني في تعلم بنية البيانات، نشير إليها كشركة بيانية مرساة بالاعتماد. يشتمل الرسم البياني أنشور التبعية على نوعين من المعلومات النحوية وبنية الدوائر الانتخابية وعلاقات التبعية، لتسليط الضوء على العلاقة بين الموضوعات والفعال. هذا يعزز جوانب التمثيل المرتبطة بالتماسك. نقوم بتصميم نموذج عصبي لتعلم تمثيل دلالي للحصول على بنود من Confolution Graph حول تمثيلات كامنة لموضوع العبارة الفعلية. نقيم طريقنا على مجموعة بيانات جديدة: مجموعة فرعية من كوربوس كبيرة حيث يتم نشر النصوص المصدر رواية، ومجموعة بيانات جديدة تم جمعها من مقالات الطلاب. توضح النتائج تحسنا كبيرا على النماذج القائمة على الأشجار، مما يؤكد أهمية التركيز على موضوع العبارة والفعل. يوضح فجوة الأداء بين مجموعة البيانات الخاصة بتحديات تحليل النص المكتوب للطالب، بالإضافة إلى مهمة تقييم محتملة لنمذجة التماسك وتطبيقا لاقتراح تنقيحات الطلاب.
Semantic representation that supports the choice of an appropriate connective between pairs of clauses inherently addresses discourse coherence, which is important for tasks such as narrative understanding, argumentation, and discourse parsing. We propose a novel clause embedding method that applies graph learning to a data structure we refer to as a dependency-anchor graph. The dependency anchor graph incorporates two kinds of syntactic information, constituency structure, and dependency relations, to highlight the subject and verb phrase relation. This enhances coherence-related aspects of representation. We design a neural model to learn a semantic representation for clauses from graph convolution over latent representations of the subject and verb phrase. We evaluate our method on two new datasets: a subset of a large corpus where the source texts are published novels, and a new dataset collected from students' essays. The results demonstrate a significant improvement over tree-based models, confirming the importance of emphasizing the subject and verb phrase. The performance gap between the two datasets illustrates the challenges of analyzing student's written text, plus a potential evaluation task for coherence modeling and an application for suggesting revisions to students.
المراجع المستخدمة
https://aclanthology.org/