ترغب بنشر مسار تعليمي؟ اضغط هنا

هل نحن تلخيص الطريق الصحيح؟دراسة استقصائية لحضور بيانات علمة الحوار

Are We Summarizing the Right Way? A Survey of Dialogue Summarization Data Sets

372   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تلخيص الحوار عبارة عن مهمة طويلة الأمد في مجال NLP، وعدة مجموعات بيانات مع حوارات ووجود ملخصات مكتوبة بشرية من الأنماط المختلفة موجودة.ومع ذلك، فمن غير الواضح لأي نوع من الحوار أي نوع الموجز هو الأنسب.لهذا السبب، نطبق النموذج اللغوي لأنواع الحوار لاستخلاص عناصر ملخص مطابقة ومهام NLP.يتيح لنا هذا تعيين بيانات تلخيص الحوار الموجودة في هذا النموذج وتحديد الفجوات والاتجاهات المحتملة للعمل في المستقبل.كجزء من هذه العملية، نقدم أيضا نظرة عامة واسعة النطاق عن مجموعات بيانات تلخيص الحوار الموجودة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تكتسب المحادثات التي تلخيصها عبر النهج العصبية الجر أبحث في الآونة الأخيرة، ومع ذلك، لا تزال تحديا للحصول على حلول عملية. وتشمل أمثلة مثل هذه التحديات تبادل المعلومات غير منظم في الحوارات والتفاعلات غير الرسمية بين المتحدثين والتغيرات الديناميكية للم تكلمين كما يتطور الحوار. العديد من هذه التحديات تؤدي إلى روابط كوراسة المعقد. لذلك، في هذا العمل، يمكننا التحقيق في نهج مختلفة لإدماج معلومات Aquerfery بشكل صريح في نماذج تلخيص الحوار المبادرة العصبية لمعالجة التحديات المذكورة أعلاه. تظهر النتائج التجريبية أن النهج المقترحة تحقق من الأداء الحديثة، مما يعني أنه من المفيد استخدام معلومات Aquerence في تلخيص الحوار. توصي نتائج التقييم على صحة واقعية تشير إلى أن هذه النماذج المفيدة هي أفضل في تتبع تدفق المعلومات بين المحاورين وربط الوضع / الإجراءات الدقيقة مع المحاورين المقابلين وذكر الشخص.
في ورقة الموقف هذه، نقدم جدول أعمال وأفكار بحثية لتسهيل التعرض للنقاط المتنوعة في توصية الأخبار. التوصية الأخبار من وجهات النظر المتنوعة مهمة لمنع تأثيرات فقاعة المرشح المحتملة في الاستهلاك الأخبار، وتحفيز نقاش صحي ديمقراطي. لحساب التعقيد الذي يتصاعد للبشر كمواطنين في الديمقراطية، نتوقع (من بين أمور أخرى) اختلافات على المستوى الفردي في قبول التنوع. نقوم بتوصيل هذه الفكرة بالتقنيات في معالجة اللغة الطبيعية، حيث تتيح لنا نماذج اللغة التوزيعية لوضع مستخدمين مختلفين ومقالات إخبارية في مساحة متعددة الأبعاد بناء على المحتوى الدلالي، حيث يتم تشغيل التنوع كمسافة وتباين. وبهذه الطريقة، يمكننا تصميم خطوط العرض الفردية من التنوع "بالنسبة للمستخدمين المختلفين، وبالتالي تخصيص تنوع وجهة نظر لدعم مناقشة عامة صحية. بالإضافة إلى ذلك، نحدد القضايا التقنية والأخلاقية والمفاهيمية المتعلقة بأفكارنا المقدمة. وصفنا يصف كيف يمكن ل NLP لعب دورا رئيسيا في تنويع توصيات الأخبار.
يتعرف محللون المحاورون على العلاقات المتعمدة والتنزاعية التي تنظم النصوص الموسعة. لقد كان لديهم تأثير كبير على مجموعة متنوعة من مهام NLP وكذلك الدراسات النظرية في اللغويات والعلوم المعرفية. ومع ذلك، غالبا ما يكون من الصعب تحقيق نتائج جيدة من نماذج ال خطاب الحالية، ويعزى ذلك إلى حد كبير إلى صعوبة المهمة، لا سيما الاعتراف بعلاقات الخطاب الضمني. أظهرت التطورات الأخيرة في النماذج القائمة على المحولات وعد كبير على هذه التحليلات، لكن التحديات لا تزال تبقى. نقدم ورقة وضع توفر تحليلا منهيا لحالة محلل خطاب الفن. نحن نهدف إلى فحص أداء نماذج تحليل الخطاب الحالي عبر نوبة المجال التدريجي: داخل Corpus، على النصوص داخل المجال، وعلى النصوص خارج المجال، ونناقش الاختلافات بين النماذج القائمة على المحولات والنماذج السابقة في التنبؤ بأنواع مختلفة من العلاقات الضمنية كل من العلاقات الأساسية. نستنتج عن طريق وصف العديد من أوجه القصور في النماذج الحالية ومناقشة حول كيفية اتباع العمل في المستقبل هذه المشكلة.
تقدم هذه الورقة MediaSum، مجموعة بيانات مقابلة الوسائط على نطاق واسع تتكون من نصوص 463.6 كيلو بايت مع ملخصات إبتياج.لإنشاء هذه البيانات، نجمع مخالفات المقابلة من NPR و CNN وتوظيف نظرة عامة وأوصاف موضوع كملخصات.مقارنة مع الشركة العامة القائمة للحصول ع لى تلخيص الحوار، فإن DataSet لدينا هي أمر من حيث الحجم ويحتوي على محادثات متعددة الأحزاب المعقدة من مجالات متعددة.نقوم بإجراء تحليل إحصائي لإظهار التحيز الموضعي الفريد المعروض في نصوص المقابلات التلفزيونية والإذاعية.نظهر أيضا أن MediaSum يمكن استخدامه في تعلم التعلم لتحسين أداء نموذج على مهام تلخيص حوار أخرى.
نقدم دراسة شاملة للسبوريا المتاحة للحوار متعدد الأحزاب.نقوم بإجراء أكثر من 300 منشور مرتبط بالحوار المتعدد الأحزاب والكتالوج كافة شركة متاحة في التصنيف الجديد.نقوم بتحليل أساليب جمع البيانات لشركة حوار متعددة الأحزاب والحساب وتحديد العديد من المضادات في نهج جمع البيانات الحالية المستخدمة لجمع هذا الحوار.نقدم هذا الاستطلاع، والمسح الأول يركز حصريا على برج الحوار متعدد الأحزاب، لتحفيز البحث في هذا المجال.من خلال مناقشتنا بطرق جمع البيانات الحالية، نحدد Desiderata والمبادئ التوجيهية لمجموعة بيانات متعددة الأحزاب للمساهمة بزيادة تعزيز هذا المجال بحوث الحوار.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا