شخصية مفيدة لتنبؤ استجابة الحوار. ومع ذلك، فإن الشخصية المستخدمة في الدراسات الحالية محددة مسبقا ويصعب الحصول عليها قبل محادثة. لمعالجة هذه المشكلة، نقوم بدراسة مهمة جديدة، اسمه مكبر صوت مكبر الصوت (SPD)، الذي يهدف إلى اكتشاف شخصيات المتكلم بناء على نص المحادثة العادي. في هذه المهمة، يتم تفتيش شخص أفضل مطابقة من المرشحين بالنظر إلى نص المحادثة. هذه مهمة مطابقة دهالية متعددة إلى العديد لأن كل من السياقات والشخصية في SPD تتكون من جمل متعددة. يعزز التبعية الطويلة الأجل والتكرار الديناميكي بين هذه الجمل صعوبة هذه المهمة. نحن نبني مجموعة بيانات ل SPD، التي يطلق عليها مواضيع شخصيا على أخصائي الدردشة (PMPC). علاوة على ذلك، نقيم العديد من النماذج الأساسية واقتراح شبكات مطابقة الكلام إلى الملف الشخصي (U2P) لهذه المهمة. تعمل نماذج U2P بتصبيح جيد يعالج كل من السياقات والعشرون كمجموعات من تسلسل متعددة. بعد ذلك، يتم تسجيل كل زوج تسلسل ويتم الحصول على درجة إجمالية قابلة للتفسير للحصول على زوج سياق شخصي من خلال التجميع. تظهر نتائج التقييم أن نماذج U2P تتفوق على نظرائهم الأساسيين بشكل كبير.
Personas are useful for dialogue response prediction. However, the personas used in current studies are pre-defined and hard to obtain before a conversation. To tackle this issue, we study a new task, named Speaker Persona Detection (SPD), which aims to detect speaker personas based on the plain conversational text. In this task, a best-matched persona is searched out from candidates given the conversational text. This is a many-to-many semantic matching task because both contexts and personas in SPD are composed of multiple sentences. The long-term dependency and the dynamic redundancy among these sentences increase the difficulty of this task. We build a dataset for SPD, dubbed as Persona Match on Persona-Chat (PMPC). Furthermore, we evaluate several baseline models and propose utterance-to-profile (U2P) matching networks for this task. The U2P models operate at a fine granularity which treat both contexts and personas as sets of multiple sequences. Then, each sequence pair is scored and an interpretable overall score is obtained for a context-persona pair through aggregation. Evaluation results show that the U2P models outperform their baseline counterparts significantly.
المراجع المستخدمة
https://aclanthology.org/
تصبح الصحة العقلية أكثر اهتماما مؤخرا مؤخرا، والاكتئاب كونه مرض شائع جدا في الوقت الحاضر، ولكن أيضا اضطرابات أخرى مثل القلق أو الاضطرابات القهرية الهوس أو اضطرابات التغذية أو اضطرابات نقص الانتباه / اضطرابات نقص الانتباه / فرط النشاط. توفر كمية كبيرة
كانت جودة تلخيص الجماعة لديها تحسينات كبيرة منذ تقنيات محاكاة اللغة الأخيرة.ومع ذلك، هناك حاليا نقص في مجموعات البيانات للاحتياجات المتزايدة لتطبيقات تلخيص المحادثة.وبالتالي نحن جمعنا منتديات، مجموعة بيانات ملخصة محادثة متنوعة وعالية الجودة مع ملخصات
تصنيف قانون الحوار (DA) هو مهمة تصنيف الكلمات فيما يتعلق بالوظيفة التي يخدمها في حوار.الأساليب الحالية لإعلام نموذج تصنيف DA دون دمج التغييرات بدوره بين مكبرات الصوت في جميع أنحاء الحوار، وبالتالي تعاملها لا تختلف عن النص المكتوب غير التفاعلي.في هذه
في هذه الورقة، نركز على تحسين جودة الملخص الذي تم إنشاؤه بواسطة أنظمة تلخيص الحوار المبشور العصبي.على الرغم من أن طرازات اللغة المدربة مسبقا تولد نتائج رائعة واعدة، إلا أنها لا تزال تحديا لتلخيص محادثة المشاركين المتعددين منذ أن تتضمن الملخص وصفا للو
بالنسبة للأطفال، أدى النظام المدرب على جثة كبيرة من مكبرات الصوت الكبار أسوأ من النظام المدربين على جثة أصغر بكثير من خطاب الأطفال.هذا بسبب عدم تطابق الصوت بين التدريب واختبار البيانات.لالتقاط المزيد من التقلبات الصوتية، قامنا بتدريب نظام مشترك مع بي