التعرف على علاقة الخطاب الضمني (IDRR) هو مهمة حاسمة في تحليل الخطاب. الدراسات السابقة فقط اعتبارها مهمة التصنيف وتفتقر إلى فهم متعمق لدل العلاقات المختلفة. لذلك، نرى أولا EDRR كامرأة توليد ومزيد من اقتراح طريقة النمذجة المشتركة للتصنيف والجيل. على وجه التحديد، نقترح نموذجا مشتركا، CG-T5، للتعرف على تسمية العلاقة وتوليد الجملة المستهدفة التي تحتوي على معنى العلاقات في وقت واحد. علاوة على ذلك، نقوم بتصميم ثلاث نماذج جملة مستهدفة، بما في ذلك نموذج الأسئلة، لنموذج الجيل لإدماج المعرفة السابقة. لمعالجة مشكلة أن وحدات الخطاب الكبيرة غير متضمنة بالكاد في الجملة المستهدفة، نقترح أيضا آلية بناء الجملة المستهدفة التي تستخرج الجمل الأساسية تلقائيا من تلك الوحدات الخطابية الكبيرة. تظهر النتائج التجريبية على حد سواء على مجموعات بيانات MCDTB والإنجليزية الصينية أن نموذج CG-T5 لدينا يحقق أفضل أداء ضد العديد من الأنظمة الحديثة.
Implicit discourse relation recognition (IDRR) is a critical task in discourse analysis. Previous studies only regard it as a classification task and lack an in-depth understanding of the semantics of different relations. Therefore, we first view IDRR as a generation task and further propose a method joint modeling of the classification and generation. Specifically, we propose a joint model, CG-T5, to recognize the relation label and generate the target sentence containing the meaning of relations simultaneously. Furthermore, we design three target sentence forms, including the question form, for the generation model to incorporate prior knowledge. To address the issue that large discourse units are hardly embedded into the target sentence, we also propose a target sentence construction mechanism that automatically extracts core sentences from those large discourse units. Experimental results both on Chinese MCDTB and English PDTB datasets show that our model CG-T5 achieves the best performance against several state-of-the-art systems.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة تقديمنا إلى Thesemeval'21: المهمة 7- Hahackathon: الكشف عن الفكاهة والجريمة.في هذا التحدي، نستكشف معدل تكبير متوسطة، وتعزيز الترجمة، والتعلم المتعدد الكثافة، وتمييز نماذج اللغة المختلفة.من الغريب، لا يحسن الثمينة والخلفية المتوسطة الأد
تهدف التعرف على علاقة الخطاب الضمني (IDRR) إلى تحديد العلاقات المنطقية بين جملتين مجاورة في الخطاب.تفشل النماذج الحالية في الاستفادة الكاملة من المعلومات السياقية التي تلعب دورا مهما في تفسير كل جملة محلية.في هذه الورقة، فإننا نقترحنا بالتالي شبكة تت
يتعرف محللون المحاورون على العلاقات المتعمدة والتنزاعية التي تنظم النصوص الموسعة. لقد كان لديهم تأثير كبير على مجموعة متنوعة من مهام NLP وكذلك الدراسات النظرية في اللغويات والعلوم المعرفية. ومع ذلك، غالبا ما يكون من الصعب تحقيق نتائج جيدة من نماذج ال
في تصنيف علاقة الخطاب الضمني، نريد التنبؤ بالعلاقة بين الجمل المجاورة في غياب أي اتصال خطاب علني. هذا أمر صعب حتى بالنسبة للبشر، مما يؤدي إلى نقص البيانات المشروح، وهي حقيقة تجعل المهمة أكثر صعوبة في نهج التعلم الآلي الإشراف. في الدراسة الحالية، نؤدي
في مهام توليد اللغة الطبيعية، يتم استخدام نموذج لغة عصبي لتوليد سلسلة من الكلمات التي تشكل جملة.يمكن اعتبار مصفوفة الوزن الأعلى من طراز اللغة، المعروف باسم طبقة التصنيف، كمجموعة من المتجهات، كل منها يمثل كلمة مستهدفة من قاموس الهدف.يتم تعلم ومكافحة ا