إن اكتساب كوربوس للحوار هو خطوة أساسية في عملية تدريب نموذج الحوار. في هذا السياق، تم تصميم عمليات الاستحواذ من Corpora إما لمهام استرجاع المعلومات أو ملء الفتحات المفتوحة (E.G. Restaurant). ومع ذلك، كان هناك بحث نادر في مشكلة جمع المحادثات الشخصية مع المستخدمين على مدى فترة طويلة من الزمن. في هذه الورقة نركز على أنواع الحوارات المطلوبة لتطبيقات الصحة العقلية. أحد هذه الأنواع هو حوار المتابعة الذي سيبدأ فيه مواد عملية نفسية في مراجعة التقدم المحرز في تدخل العلاج السلوكي المعرفي (CBT). يتم تحقيق تنازلات الحوارات من خلال المحفزات النصية المقدمة لكتاب الحوار. نقترح خوارزمية أوتوماتيكية تنشئ محفزات نصية من الروايات الشخصية التي تم جمعها أثناء تدخلات العلاج النفسي. يتم تقديم المحفزات التي تم إنشاؤها تلقائيا كصحة للكتاب الحوار بعد المبادئ التوجيهية المبدئية. نقوم بتحليل الجودة اللغوية للجنة التي تم جمعها ومقارنة عروض أخصائيي الأطباء النفسيين وكتاب الحوار غير الخبراء. علاوة على ذلك، نبلغ عن التقييم البشري لنموذج اختيار الاستجابة القائمة على Corpus.
The acquisition of a dialogue corpus is a key step in the process of training a dialogue model. In this context, corpora acquisitions have been designed either for open-domain information retrieval or slot-filling (e.g. restaurant booking) tasks. However, there has been scarce research in the problem of collecting personal conversations with users over a long period of time. In this paper we focus on the types of dialogues that are required for mental health applications. One of these types is the follow-up dialogue that a psychotherapist would initiate in reviewing the progress of a Cognitive Behavioral Therapy (CBT) intervention. The elicitation of the dialogues is achieved through textual stimuli presented to dialogue writers. We propose an automatic algorithm that generates textual stimuli from personal narratives collected during psychotherapy interventions. The automatically generated stimuli are presented as a seed to dialogue writers following principled guidelines. We analyze the linguistic quality of the collected corpus and compare the performances of psychotherapists and non-expert dialogue writers. Moreover, we report the human evaluation of a corpus-based response-selection model.
References used
https://aclanthology.org/
Automated systems that negotiate with humans have broad applications in pedagogy and conversational AI. To advance the development of practical negotiation systems, we present CaSiNo: a novel corpus of over a thousand negotiation dialogues in English
This paper investigates the effectiveness of automatic annotator assignment for text annotation in expert domains. In the task of creating high-quality annotated corpora, expert domains often cover multiple sub-domains (e.g. organic and inorganic che
We propose MultiDoc2Dial, a new task and dataset on modeling goal-oriented dialogues grounded in multiple documents. Most previous works treat document-grounded dialogue modeling as machine reading comprehension task based on a single given document
Humans make appropriate responses not only based on previous dialogue utterances but also on implicit background knowledge such as common sense. Although neural response generation models seem to produce human-like responses, they are mostly end-to-e
In the social media, users frequently use small images called emojis in their posts. Although using emojis in texts plays a key role in recent communication systems, less attention has been paid on their positions in the given texts, despite that use