ترغب بنشر مسار تعليمي؟ اضغط هنا

تحسين تجزئة موضوع الحوار غير الخاضعة للرقابة مع سجل تماسك الزوج

Improving Unsupervised Dialogue Topic Segmentation with Utterance-Pair Coherence Scoring

283   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تجزئة موضوع الحوار أمر بالغ الأهمية في العديد من مشاكل نموذج الحوار.ومع ذلك، فإن النهج الشائعة غير المعينة الشائعة لاستغلال الميزات السطحية فقط في تقييم التماسك الموضعي بين الكلام.في هذا العمل، نتعامل مع هذا القيد من خلال الاستفادة من الإشارات الإشرافية من مهمة التسجيل في اتساق زوج الكلام.أولا، نقدم استراتيجية بسيطة ولكنها فعالة لتوليد كوربوس التدريب لتسجيلات التماسك زوج الكلام.بعد ذلك، ندرب نموذج متماسك نطق برت مقره برت مع Corpus التدريب الذي تم الحصول عليه.أخيرا، يتم استخدام هذا النموذج لقياس الملاءمة الموضعية بين الكلام، والتصرف كأساس لاستدلال التجزئة.تجارب على ثلاث مجموعات بيانات عامة باللغة الإنجليزية والصينية توضح أن اقتراحنا يتفوق على خطوط الأساس الحديثة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتضمن الأساليب الحديثة الحديثة في حوار المجال المفتوح نماذج التعليم العميق في نهاية إلى نهج لتعلم العديد من ميزات المحادثة مثل المحتوى العاطفي للاستجابة، والانتقال الرمز الرمزي سياقات الحوار في الرسم البياني المعرفي وشخصية الوكيل والمستخدم، من بين آخ رين. في حين أن النماذج العصبية قد أظهرت نتائج معقولة، فإن نمذجة العمليات المعرفية التي يستخدمها البشر عند التحدث مع بعضهم البعض تحسين جودة الوكيل للردود. يتمثل عنصر رئيسي في المحادثة الطبيعية في تكييف استجابة المرء بحيث يمثل المفاهيم التي يجوز لها السماعة والمستمع بها أو قد لا يعرفها وأهمية السياق لجميع المفاهيم السابقة المستخدمة في المحادثة. نظرا لأن تمثيل غني ونمذجة صريحة لهذه العمليات النفسية يمكن أن تحسن التنبؤات التي قدمتها نماذج الشبكة العصبية الحالية. في هذا العمل، نقترح نهجا احتمالا جديدا باستخدام حقول Markov العشوائية (MRF) لزيادة طرق التعلم العميق الموجودة لتحسين التنبؤ القادم للكلام. باستخدام التقييمات البشرية والآلية، نظير على أن نهجنا للتكبير لدينا يحسن بشكل كبير من أداء نماذج استرجاع الحالة القائمة من أحدث الوكلاء المحادثة للمجموعات المفتوحة.
مع الوفاء المتزايد من نصوص الاجتماعات، اجتذبت ملخص الاجتماع المزيد والمزيد من الاهتمام من الباحثين. حققت طريقة التدريب المسبق غير المعروضة على أساس هيكل المحولات المبلغة مع ضبط المهام المصب الناجمة نجاحا كبيرا في مجال تلخيص النص. ومع ذلك، فإن الهيكل الدلالي وأسلوب حقول الاجتماع يختلف تماما عن مقالات. في هذا العمل، نقترح شبكة فك ترميز ترميز ترميز هيرسلجية ذات مهام مسبقة مهام متعددة. على وجه التحديد، نحن نخفي الجمل الرئيسية في تشفير مستوى الكلمات وتوليدها في وحدة فك الترميز. علاوة على ذلك، نقع بشكل عشوائي بعض محاذاة الدور في نص الإدخال وإجبار النموذج على استعادة علامات الدور الأصلية لإكمال المحاذاة. بالإضافة إلى ذلك، نقدم آلية تجزئة موضوعا لمواصلة تحسين جودة الملخصات التي تم إنشاؤها. تظهر النتائج التجريبية أن طرازنا متفوق على الأساليب السابقة في مجموعات بيانات ملخص الاجتماع AMI و ICSI.
يعيد هذا العمل مهمة اكتشاف الكلمات المتعلقة بالقرار في حوار متعدد الأحزاب.نستكشف أداء نهج تقليدي ونهج عميق قائم على التعلم بناء على نماذج لغة المحولات، مع تقدم الأخير تحسينات متواضعة.ثم نحلل تحريف الموضوع في النماذج باستخدام معلومات الموضوع التي تم ا لحصول عليها عن طريق التوضيح اليدوي.النتيجة لدينا هي أنه عند اكتشاف بعض الأنواع من القرارات في بياناتنا، تعتمد النماذج أكثر على موضوع الكلمات المحددة التي تدور حولها القرارات بدلا من الكلمات التي تشير بشكل عام إلى اتخاذ القرارات بشكل عام.نستكشف ذلك أيضا عن طريق إزالة معلومات الموضوع من بيانات القطار.نظهر أن هذا يحل قضايا التحيز إلى حد ما، ومدهشا، يعزز في بعض الأحيان.
نقدم تقنية جديدة لتوليد الصفر عن إعادة صياغة الصفر.المساهمة الرئيسية هي طراز إعادة صياغة متعددة اللغات من طرف تم تدريبه على استخدام كورسرا المتوازي المترجمة لتوليد الصياغة في المساحات المعنى "- استبدال طبقة SoftMax النهائية مع Adgeddings Word.يتيح هذ ا التعديل المعماري، بالإضافة إلى إجراء تدريبي يشتمل على هدف AutoNCoding، مع المعلمة الفعالة تقاسم لغات لمزيد من إعادة كتابة أحادي الأبعاد بطلاقة، ويسهل الطلاقة والتنوع في المخرجات التي تم إنشاؤها.تتفوق نماذج توليد الناتج المستمر الناتج عن إعادة صياغة خطوط خطوط خطوط إعادة صياغة صفرية عند تقييم لغتين باستخدام بطارية من المقاييس الحسابية وكذلك في التقييم البشري.
على الرغم من التقدم الرائع في مجال الوسائط الحسابية، غالبا ما تعتمد نظم الحوار المعنية ذات المهام الجدلية على المعرفة المهيكلة حول الحجج وعلاقاتها. نظرا لأن الاستحواذ اليدوي لهياكل الوسيطة هذه تستغرق وقتا طويلا، فإن النظم المقابلة غير مرنة فيما يتعلق بالموضوعات التي يمكنهم مناقشتها. لمعالجة هذه المشكلة، نقترح مجموعة من أنظمة الحوار الجدلية مع تكنولوجيا البحث الحجة التي تمكن النظام من مناقشة أي موضوع يقوم بمحرك البحث قادرا على العثور على حجج مناسبة. يستخدم نهجنا تصنيف العلاقة المستندة إلى التعلم في التعلم لتعيين الحجج المستردة في بنية شجرة عامة للاستخدام في أنظمة الحوار. نقيم النهج مع حالة من محرك البحث الفني ونموذج حوار تم إدخاله مؤخرا في دراسة مستخدم مكثفة فيما يتعلق بتماسك الحوار. تختلف النتائج بين الموضوعات التي تم التحقيق فيها (وبالتالي تعتمد على جودة البيانات الأساسية) ولكنها في بعض الحالات قريبة بشكل مدهش من النتائج التي تحققت مع هيكل الوسيطة المشروح يدويا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا