لفتت تلخيص الحوار اهتماما كبيرا مؤخرا. خاصة في مجال خدمة العملاء، يمكن للوكلاء استخدام ملخصات الحوار للمساعدة في زيادة أعمالهم من خلال معرفة قضايا العملاء بسرعة وتقدم الخدمة. تتطلب هذه التطبيقات ملخصات لاحتواء منظور مكبر صوت واحد ولديك هيكل تدفق موضوع واضح، في حين لا يتوفر في مجموعات البيانات الحالية. لذلك، في هذه الورقة، نقدم مجموعة بيانات صينية جديدة لتلخيص حوار خدمة العملاء (CSDS). يعمل CSDS على تحسين الملخصات الإفراطية في جوانب: (1) بالإضافة إلى الملخص العام للحوار بأكمله، كما يتم تقديم ملخصات الأدوار أيضا للحصول على وجهات نظر مكبرات صوت مختلفة. (2) تلخص جميع الملخصات لكل موضوع بشكل منفصل، وبالتالي تحتوي على هيكل مستوى الموضوع للحوار. نحدد المهام في CSDS كمولية الملخص الشامل والملخصات المختلفة الموجهة نحو الأدوار لحوار معين. بعد ذلك، نقارن العديد من طرق التلخيص على CSDS، وإظهار نتائج التجربة أن الطرق الحالية عرضة لتوليد ملخصات زائدة وغير متماسكة. علاوة على ذلك، يصبح الأداء أسوأ بكثير عند تحليل الأداء في ملخصات الأدوار وهياكل الموضوعات. نأمل أن تتمكن هذه الدراسة من مراجعة تلخيص الحوار الصيني وفائدة المزيد من الدراسات.
Dialogue summarization has drawn much attention recently. Especially in the customer service domain, agents could use dialogue summaries to help boost their works by quickly knowing customer's issues and service progress. These applications require summaries to contain the perspective of a single speaker and have a clear topic flow structure, while neither are available in existing datasets. Therefore, in this paper, we introduce a novel Chinese dataset for Customer Service Dialogue Summarization (CSDS). CSDS improves the abstractive summaries in two aspects: (1) In addition to the overall summary for the whole dialogue, role-oriented summaries are also provided to acquire different speakers' viewpoints. (2) All the summaries sum up each topic separately, thus containing the topic-level structure of the dialogue. We define tasks in CSDS as generating the overall summary and different role-oriented summaries for a given dialogue. Next, we compare various summarization methods on CSDS, and experiment results show that existing methods are prone to generate redundant and incoherent summaries. Besides, the performance becomes much worse when analyzing the performance on role-oriented summaries and topic structures. We hope that this study could benchmark Chinese dialogue summarization and benefit further studies.
References used
https://aclanthology.org/
In a typical customer service chat scenario, customers contact a support center to ask for help or raise complaints, and human agents try to solve the issues. In most cases, at the end of the conversation, agents are asked to write a short summary em
Large-scale pretrained transformer models have demonstrated state-of-the-art (SOTA) performance in a variety of NLP tasks. Nowadays, numerous pretrained models are available in different model flavors and different languages, and can be easily adapte
This paper introduces MediaSum, a large-scale media interview dataset consisting of 463.6K transcripts with abstractive summaries. To create this dataset, we collect interview transcripts from NPR and CNN and employ the overview and topic description
Sentiment analysis has attracted increasing attention in e-commerce. The sentiment polarities underlying user reviews are of great value for business intelligence. Aspect category sentiment analysis (ACSA) and review rating prediction (RP) are two es
Cant is important for understanding advertising, comedies and dog-whistle politics. However, computational research on cant is hindered by a lack of available datasets. In this paper, we propose a large and diverse Chinese dataset for creating and un