ترغب بنشر مسار تعليمي؟ اضغط هنا

تلخيص الحوار عبارة عن مهمة طويلة الأمد في مجال NLP، وعدة مجموعات بيانات مع حوارات ووجود ملخصات مكتوبة بشرية من الأنماط المختلفة موجودة.ومع ذلك، فمن غير الواضح لأي نوع من الحوار أي نوع الموجز هو الأنسب.لهذا السبب، نطبق النموذج اللغوي لأنواع الحوار لاس تخلاص عناصر ملخص مطابقة ومهام NLP.يتيح لنا هذا تعيين بيانات تلخيص الحوار الموجودة في هذا النموذج وتحديد الفجوات والاتجاهات المحتملة للعمل في المستقبل.كجزء من هذه العملية، نقدم أيضا نظرة عامة واسعة النطاق عن مجموعات بيانات تلخيص الحوار الموجودة.
في هذه الورقة، نركز على تحسين جودة الملخص الذي تم إنشاؤه بواسطة أنظمة تلخيص الحوار المبشور العصبي.على الرغم من أن طرازات اللغة المدربة مسبقا تولد نتائج رائعة واعدة، إلا أنها لا تزال تحديا لتلخيص محادثة المشاركين المتعددين منذ أن تتضمن الملخص وصفا للو ضع العام وإجراءات كل مكبر صوت.تقترح هذه الورقة استراتيجيات ذات إشراف ذاتي لتصحيح ما بعد تركز على المتكلم في تلخيص حوار المبادرة.على وجه التحديد، تميز نموذجنا أولا أي نوع من تصحيح المتكلم مطلوب في مشروع ملخص ثم يولد ملخص منقح وفقا للنوع المطلوب.تظهر النتائج التجريبية أن أسلوبنا المقترح بتصحيح مشاريع الملخصات بشكل كاف، ويتم تحسين الملخصات المنقحة بشكل كبير في كل من التقييمات الكمية والنوعية.
مع الزيادة السريعة في حجم بيانات الحوار من الحياة اليومية، هناك طلب متزايد على تلخيص الحوار. لسوء الحظ، تدريب نموذج تلخيص كبير بشكل عام بشكل عام بسبب عدم كفاية بيانات الحوار مع ملخصات مشروح. معظم الأعمال الموجودة لتلخيص حوار الموارد المنخفضة بشكل مبا شر مؤمن النماذج بشكل مباشر في مجالات أخرى، على سبيل المثال، مجال الأخبار، لكنهم يهملون بشكل عام الفرق الكبير بين الحوارات والمقالات التقليدية. لسد الفجوة بين الاحتجاج بها من خارج المجال والضبط الجميل داخل المجال، في هذا العمل، نقترح نموذجا محددا متعدد المصدر لتحسين الاستفادة من البيانات الموجزة الخارجية. على وجه التحديد، نستمس في بيانات موجزة داخل المجال واسعة النطاق بشكل منفصل بدرجة أن تشفير الحوار ومكتشف الملخص. ثم يتم الاحتمية بعد ذلك نموذج فك تشفير التشفير على البيانات الموجزة خارج المجال باستخدام منتقدي العدوين، تهدف إلى تسهيل تلخيص المجال اللاإرادي. تظهر النتائج التجريبية على مجموعة من مجموعات البيانات العامة أنه مع بيانات تدريب محدودة فقط، يحقق نهجنا أداء تنافسي وتعميم جيد في سيناريوهات الحوار المختلفة.
في هذه الورقة، نقترح إطار جيل عصبي قابل للتحكم يمكن أن توجه بمرونة تلخيص الحوار مع تخطيط الكيانات المسماة الشخصية. يتم تعديل التسلسلات الشرطية لتحديد أنواع المعلومات أو منظور التركيز عند تشكيل ملخصات لمعالجة المشكلة الخاضعة للحدود في مهام التلخصات. ي دعم هذا الإطار نوعين من حالات الاستخدام: (1) منظور شامل، وهو حالة غرض لأغراض عامة مع عدم تحديد تفضيل المستخدم، بالنظر إلى نقاط موجزة من جميع محطات المحادثة والأشخاص المذكورين؛ (2) منظور التركيز، ضع الملخص بناء على كيان شخصي محدد من قبل المستخدم، والتي يمكن أن تكون واحدة من المحاورين أو أحد الأشخاص المذكورين في المحادثة. أثناء التدريب، استغلنا تخطيط حدوثها للكيانات المسماة الشخصية ومعلومات العناية الأساسية لتحسين الاتساق الزمني وتقليل الهلوسة في الجيل العصبي. تظهر النتائج التجريبية أن إطار عملنا المقترح يولد ملخصات بطلاقة ومتسقة في الواقع بموجب ضوابط التخطيط المختلفة باستخدام المقاييس الموضوعية والتقييمات البشرية.
لفتت تلخيص الحوار اهتماما كبيرا مؤخرا. خاصة في مجال خدمة العملاء، يمكن للوكلاء استخدام ملخصات الحوار للمساعدة في زيادة أعمالهم من خلال معرفة قضايا العملاء بسرعة وتقدم الخدمة. تتطلب هذه التطبيقات ملخصات لاحتواء منظور مكبر صوت واحد ولديك هيكل تدفق موضو ع واضح، في حين لا يتوفر في مجموعات البيانات الحالية. لذلك، في هذه الورقة، نقدم مجموعة بيانات صينية جديدة لتلخيص حوار خدمة العملاء (CSDS). يعمل CSDS على تحسين الملخصات الإفراطية في جوانب: (1) بالإضافة إلى الملخص العام للحوار بأكمله، كما يتم تقديم ملخصات الأدوار أيضا للحصول على وجهات نظر مكبرات صوت مختلفة. (2) تلخص جميع الملخصات لكل موضوع بشكل منفصل، وبالتالي تحتوي على هيكل مستوى الموضوع للحوار. نحدد المهام في CSDS كمولية الملخص الشامل والملخصات المختلفة الموجهة نحو الأدوار لحوار معين. بعد ذلك، نقارن العديد من طرق التلخيص على CSDS، وإظهار نتائج التجربة أن الطرق الحالية عرضة لتوليد ملخصات زائدة وغير متماسكة. علاوة على ذلك، يصبح الأداء أسوأ بكثير عند تحليل الأداء في ملخصات الأدوار وهياكل الموضوعات. نأمل أن تتمكن هذه الدراسة من مراجعة تلخيص الحوار الصيني وفائدة المزيد من الدراسات.
يلخص الحوار يساعد القراء على التقاط المعلومات البارزة من محادثات طويلة في الاجتماعات والمقابلات والمسلسلات التلفزيونية. ومع ذلك، فإن حوالات العالم الحقيقي تشكل تحديا كبيرا لنماذج التلخيص الحالية، حيث يتجاوز طول الحوار عادة حدود المدخلات التي تفرضها ا لنماذج المدربة مسبقا القائمة على المحولات، والطبيعة التفاعلية للحوالات هي المعلومات ذات الصلة أكثر تعتمد على السياق وقدر موزعة من المقالات الإخبارية. في هذا العمل، نقوم بإجراء دراسة شاملة حول تلخيص الحوار الطويل من خلال التحقيق في ثلاث استراتيجيات للتعامل مع مشكلة الإدخال المطول وتحديد موقع المعلومات ذات الصلة: (1) نماذج المحولات الموسعة مثل Longformer، (2) استرداد نماذج خط أنابيب العديد من طرق استرجاع الحوار النطق، و (3) نماذج ترميز الحوار الهرمي مثل HMNet. نتائجنا التجريبية على ثلاث مجموعات بيانات حوار طويلة (QMSUM، MediaSum، Searscreen) تبين أن نماذج خط أنابيب الاسترداد - بعد ذلك، تسفر عن أفضل أداء. نوضح أيضا أنه يمكن تحسين جودة الملخص مع نموذج استرجاع أقوى وأحيث محاكاة بيانات الملخصات الخارجية المناسبة.
تكتسب المحادثات التي تلخيصها عبر النهج العصبية الجر أبحث في الآونة الأخيرة، ومع ذلك، لا تزال تحديا للحصول على حلول عملية. وتشمل أمثلة مثل هذه التحديات تبادل المعلومات غير منظم في الحوارات والتفاعلات غير الرسمية بين المتحدثين والتغيرات الديناميكية للم تكلمين كما يتطور الحوار. العديد من هذه التحديات تؤدي إلى روابط كوراسة المعقد. لذلك، في هذا العمل، يمكننا التحقيق في نهج مختلفة لإدماج معلومات Aquerfery بشكل صريح في نماذج تلخيص الحوار المبادرة العصبية لمعالجة التحديات المذكورة أعلاه. تظهر النتائج التجريبية أن النهج المقترحة تحقق من الأداء الحديثة، مما يعني أنه من المفيد استخدام معلومات Aquerence في تلخيص الحوار. توصي نتائج التقييم على صحة واقعية تشير إلى أن هذه النماذج المفيدة هي أفضل في تتبع تدفق المعلومات بين المحاورين وربط الوضع / الإجراءات الدقيقة مع المحاورين المقابلين وذكر الشخص.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا