ترغب بنشر مسار تعليمي؟ اضغط هنا

Forumsumum: محادثة محادثة متعددة المتكلم

ForumSum: A Multi-Speaker Conversation Summarization Dataset

253   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كانت جودة تلخيص الجماعة لديها تحسينات كبيرة منذ تقنيات محاكاة اللغة الأخيرة.ومع ذلك، هناك حاليا نقص في مجموعات البيانات للاحتياجات المتزايدة لتطبيقات تلخيص المحادثة.وبالتالي نحن جمعنا منتديات، مجموعة بيانات ملخصة محادثة متنوعة وعالية الجودة مع ملخصات مكتوبة بشرية.تتم جمع المحادثات في DiversionMum DataSet من مجموعة واسعة من منتديات الإنترنت.لجعل مجموعة البيانات قابلة للتوسيع بسهولة، نقوم أيضا بإصدار عملية إنشاء DataSet.تظهر تجاربنا أن النماذج المدربة على Forumsum لديها أفضل صفر - لقدرة على تحويل القليل من الطوابق إلى مجموعات البيانات الأخرى من بيانات ملخصات الدردشة الكبيرة الحالية Samsum.نظهر أيضا أن استخدام Corpus Corpustation للمحدثين يحسن ما قبل التدريب على تحسين جودة نموذج تلخيص الدردشة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبح التعرف على العاطفة في محادثة متعددة الأحزاب (ermc) شعبية بشكل متزايد كقاعدة بحثية ناشئة في معالجة اللغة الطبيعية.يركز البحث المسبق على استكشاف معلومات متتابعة ولكن يتجاهل هياكل المحادثات.في هذه الورقة، يمكننا التحقيق في أهمية هياكل الخطاب في الت عامل مع الإشارات السياقية الإعلامية والمعلومات الخاصة بالمتكلات الخاصة ب armc.تحقيقا لهذه الغاية، نقترح علما رسميا في رسم بياني (ERMC-DISGCN) ل ERMC.على وجه الخصوص، نقوم بتصميم الأزلاء العلائقية إلى رافعة تبعية المتكلم الذاتي للواقعاء نشر معلومات سياقية.علاوة على ذلك، فإننا نستنفذ عن مراقبة بوابات لاختيار إشارات أكثر إفادة ل armc من التحويلات المعالين.تظهر النتائج التجريبية طريقة أن أسلوبنا تتفوق على خطوط أساس متعددة، مما يوضح أن هياكل الخطاب ذات قيمة كبيرة ل armc.
تلقى تلخيص محادثة الجماع اهتماما كبيرا مؤخرا.ومع ذلك، غالبا ما تعاني هذه الملخصات التي تم إنشاؤها من محتوى غير كاف أو زائد أو غير صحيح، ويعزى ذلك إلى حد كبير إلى الخصائص غير المنظمة والمعقدة للتفاعلات البشرية البشرية.تحقيقا لهذه الغاية، نقترح نموذجا صراحة الهياكل الغنية في محادثات للحصول على تلخيص محادثة أكثر دقة ودقيقة، من خلال إدراج علاقات الخطاب الأولى بين الكلام والأربع من الليئات (WHO - ما ") في كلام من خلال الرسوم البيانية المنظمة لتشفير المحادثات بشكل أفضلثم تصميم وحدة فك ترميز متعددة الحبيبات لتوليد ملخصات من خلال الجمع بين جميع مستويات المعلومات.تشير التجارب إلى أن نماذجنا المقترحة تفوقت على الطرق الحديثة والتعميم بشكل جيد في المجالات الأخرى من حيث التقييمات التلقائية والأحكام البشرية.لقد أصدرنا علنا رمزنا في https://github.com/gt-salt/sulture-aware-bart.
توليد الاستجابات الإعلامية والمناسبة صعبة ولكنها مهمة لبناء أنظمة الحوار يشبه الإنسان. على الرغم من أن نماذج المحادثة المختلفة المعرفة قد اقترحت، إلا أن هذه النماذج لها قيود في الاستفادة من المعرفة التي تحدث بشكل غير منتظم في بيانات التدريب، ناهيك عن دمج المعرفة غير المرئية في جيل المحادثة. في هذه الورقة، نقترح طريقة تعلم التمثيل المتعصب للكيان (EARL) لإدخال الرسوم البيانية المعرفة لتوليد المحادثة بالمعلومات. على عكس الأساليب التقليدية التي تقترب المعلمة التمثيل المحدد لكل كيان، فإن إيرل يستخدم سياق المحادثات والهيكل العلائقي لرسوم البيان البيئية لمعرفة تمثيل الفئة للكيانات، المعمم لإدماج كيانات غير مرئية في الرسوم البيانية المعرفة في جيل المحادثة. التقييمات التلقائية واليدوية توضح أن طرازنا يمكن أن يولد ردود أكثر إعلامية ومتماسكة وغير طبيعية من النماذج الأساسية.
تقنيات تعزيز الرفاهية والرعاية الصحية والرصد هي في ارتفاع. ومع ذلك، على الرغم من اهتمام المرضى، تعاني هذه التقنيات من اعتماد منخفض. فرضية واحدة لهذا التبني المحدود هو فقدان التفاعل البشري هو أمر أساسي لقاءات الطبيب المريض. في هذه الورقة، نسعى إلى معا لجة هذا القيد من خلال وكيل محادثة يعتمد جانب واحد من تفاعلات الطبيب الواحد في شخصيا: صورة شخصية بشرية لتسهيل الإجابة على الأسئلة الطبية. هذا أقرب إلى سيناريو شخصيا حيث قد يشير الطبيب إلى جسم الإنسان أو قد يشير المريض إلى جسدهم للتعبير عن شروطهم. بالإضافة إلى ذلك، يحتوي وكيلنا على أوضاع متعددة التفاعل، قد تعطي المزيد من الخيارات للمريض لاستخدام الوكيل، وليس فقط للمسألة الطبية الإجابة، ولكن أيضا للانخراط في محادثات حول الموضوعات العامة والأحداث الحالية. كل من الصورة الرمزية، ويمكن أن تساعد أوضاع التفاعل المتعددة في تحسين الالتزام. نقدم نظرة عامة رفيعة المستوى على تصميم وكيلنا، ماري بوت الرفاهية. نحن نبلغ أيضا عن تفاصيل التنفيذ من النموذج الأولي المبكر لدينا، وتقديم النتائج الأولية.
محادثة Deventangle تهدف إلى فصل الرسائل المتداخلة إلى جلسات منفصلة، ​​وهي مهمة أساسية في فهم المحادثات متعددة الأحزاب. يعتمد العمل الحالي في محادثة DEVENTANGLEMELE بشكل كبير على مجموعات البيانات المشروح البشرية، وهي مكلفة للحصول عليها في الممارسة الع ملية. في هذا العمل، نستكشف تدريب نموذج محادثة محادثة دون الرجوع إلى أي شروح بشرية. تم بناء طريقتنا على خوارزمية التدريب العميق، والتي تتكون من شبكات اثنين من الشبكات العصبية: مصنف رسالة للزوج وفيديو الجلسة. السابق هو المسؤول عن استرجاع العلاقات المحلية بين رسالتين بينما يقتصر الأخير رسالة إلى جلسة من خلال التقاط معلومات السياق. يتم تهيئة كلتا الشبكتين على التوالي مع بيانات زائفة مبنية من Corpus غير المخلفات. خلال عملية التدريب التعويضي العميق، نستخدم مصنف الجلسة كمكون تعليمي للتعزيز لتعلم جلسة تعيين سياسة من خلال تعظيم المكافآت المحلية التي قدمها مصنف زوج الرسائل. بالنسبة إلى مصنف زوج الرسائل، فإننا نشعر بإثراء بيانات التدريب الخاصة بها عن طريق استرداد أزواج الرسائل بثقة عالية من جلسات DESTANGLED المتوقعة من قبل مصنف الجلسة. النتائج التجريبية على مجموعة بيانات حوار السينما الكبيرة تثبت أن نهجنا المقترح يحقق أداء تنافسي مقارنة بالأساليب الخاضعة للإشراف السابقة. تشير المزيد من التجارب إلى أن محادثات الإعصابات المتوقعة يمكن أن تعزز الأداء على المهمة المصب لمختيار استجابة متعددة الأحزاب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا