تجزئة موضوع الحوار أمر بالغ الأهمية في العديد من مشاكل نموذج الحوار.ومع ذلك، فإن النهج الشائعة غير المعينة الشائعة لاستغلال الميزات السطحية فقط في تقييم التماسك الموضعي بين الكلام.في هذا العمل، نتعامل مع هذا القيد من خلال الاستفادة من الإشارات الإشرافية من مهمة التسجيل في اتساق زوج الكلام.أولا، نقدم استراتيجية بسيطة ولكنها فعالة لتوليد كوربوس التدريب لتسجيلات التماسك زوج الكلام.بعد ذلك، ندرب نموذج متماسك نطق برت مقره برت مع Corpus التدريب الذي تم الحصول عليه.أخيرا، يتم استخدام هذا النموذج لقياس الملاءمة الموضعية بين الكلام، والتصرف كأساس لاستدلال التجزئة.تجارب على ثلاث مجموعات بيانات عامة باللغة الإنجليزية والصينية توضح أن اقتراحنا يتفوق على خطوط الأساس الحديثة.
Dialogue topic segmentation is critical in several dialogue modeling problems. However, popular unsupervised approaches only exploit surface features in assessing topical coherence among utterances. In this work, we address this limitation by leveraging supervisory signals from the utterance-pair coherence scoring task. First, we present a simple yet effective strategy to generate a training corpus for utterance-pair coherence scoring. Then, we train a BERT-based neural utterance-pair coherence model with the obtained training corpus. Finally, such model is used to measure the topical relevance between utterances, acting as the basis of the segmentation inference. Experiments on three public datasets in English and Chinese demonstrate that our proposal outperforms the state-of-the-art baselines.
المراجع المستخدمة
https://aclanthology.org/
تتضمن الأساليب الحديثة الحديثة في حوار المجال المفتوح نماذج التعليم العميق في نهاية إلى نهج لتعلم العديد من ميزات المحادثة مثل المحتوى العاطفي للاستجابة، والانتقال الرمز الرمزي سياقات الحوار في الرسم البياني المعرفي وشخصية الوكيل والمستخدم، من بين آخ
مع الوفاء المتزايد من نصوص الاجتماعات، اجتذبت ملخص الاجتماع المزيد والمزيد من الاهتمام من الباحثين. حققت طريقة التدريب المسبق غير المعروضة على أساس هيكل المحولات المبلغة مع ضبط المهام المصب الناجمة نجاحا كبيرا في مجال تلخيص النص. ومع ذلك، فإن الهيكل
يعيد هذا العمل مهمة اكتشاف الكلمات المتعلقة بالقرار في حوار متعدد الأحزاب.نستكشف أداء نهج تقليدي ونهج عميق قائم على التعلم بناء على نماذج لغة المحولات، مع تقدم الأخير تحسينات متواضعة.ثم نحلل تحريف الموضوع في النماذج باستخدام معلومات الموضوع التي تم ا
نقدم تقنية جديدة لتوليد الصفر عن إعادة صياغة الصفر.المساهمة الرئيسية هي طراز إعادة صياغة متعددة اللغات من طرف تم تدريبه على استخدام كورسرا المتوازي المترجمة لتوليد الصياغة في المساحات المعنى "- استبدال طبقة SoftMax النهائية مع Adgeddings Word.يتيح هذ
على الرغم من التقدم الرائع في مجال الوسائط الحسابية، غالبا ما تعتمد نظم الحوار المعنية ذات المهام الجدلية على المعرفة المهيكلة حول الحجج وعلاقاتها. نظرا لأن الاستحواذ اليدوي لهياكل الوسيطة هذه تستغرق وقتا طويلا، فإن النظم المقابلة غير مرنة فيما يتعلق