ترغب بنشر مسار تعليمي؟ اضغط هنا

لدينا هذه المحادثة قبل: نهج رواية للقياس تشابه الحوار

We've had this conversation before: A Novel Approach to Measuring Dialog Similarity

283   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مربع الحوار هو كتلة لبناء أساسية لتفاعلات اللغة البشرية البشرية.يحتوي على كلمات متعددة الأحزاب المستخدمة لنقل المعلومات من طرف إلى آخر بطريقة ديناميكية ومتطورة.إن القدرة على مقارنة الحوار هي مفيدة في العديد من حالات استخدام العالم الحقيقي، مثل تحليلات المحادثة لمكالمات مركز الاتصال وتصميم الوكيل الظاهري.نقترح تكيف جديد من أداة تحرير المسافة إلى سيناريو تشابه الحوار.يأخذ نهجنا في الاعتبار مختلف جوانب المحادثة مثل دلالات الكلام وتدفق المحادثة والمشاركين.نقيم هذا النهج الجديد ومقارنة مع تدابير التشابه الوثيقة الحالية على مجموعة من مجموعات البيانات الخاصة بالجملي.توضح النتائج أن أسلوبنا تتفوق على النهج الأخرى في اتخاذ تدفق حوار الاستسلام، ومن الأفضل أن يتماشى مع التصور البشري لمشاكل المحادثة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

منذ فترة طويلة انتهت التقييم التلقائي الموثوق لأنظمة الحوار بموجب بيئة تفاعلية. تحتاج بيئة مثالية لتقييم أنظمة الحوار، المعروفة أيضا باسم اختبار Turing، إلى إشراك التفاعل البشري، وعادة ما تكون غير متناول تجارب واسعة النطاق. على الرغم من أن الباحثين ق د حاولوا استخدام مقاييس مهام توليد اللغة (على سبيل المثال، الحيرة، بلو) أو بعض طرق التعزيز القائمة على الطراز (مثل تقييم التشغيل الذاتي) للتقييم التلقائي، إلا أن هذه الطرق تظهر فقط ارتباط ضعيف للغاية مع التقييم البشري الفعلي في التمرين. لكسر هذه الفجوة، نقترح إطارا جديدا يدعى لغز لتقدير درجات التقييم البشرية بناء على التقدم الأخير للتقييم خارج السياسات في التعلم التعزيز. يتطلب Enigma فقط حفنة من بيانات الخبرة التي تم جمعها مسبقا، وبالتالي لا تنطوي على تفاعل بشري مع السياسة المستهدفة أثناء التقييم، مما يجعل التقييمات التلقائية الممكنة. والأهم من ذلك أن Enigma هو خال من النموذج والأذرع لسياسات السلوك لجمع بيانات الخبرة، مما يخفف بشكل كبير الصعوبات التقنية في بيئات الحوار المعقدة النمذجة والسلوكيات البشرية. تظهر تجاربنا أن لغز تتفوق بشكل كبير على الأساليب الحالية من حيث الارتباط مع درجات التقييم البشري.
على الرغم من التقدم الرائع في مجال الوسائط الحسابية، غالبا ما تعتمد نظم الحوار المعنية ذات المهام الجدلية على المعرفة المهيكلة حول الحجج وعلاقاتها. نظرا لأن الاستحواذ اليدوي لهياكل الوسيطة هذه تستغرق وقتا طويلا، فإن النظم المقابلة غير مرنة فيما يتعلق بالموضوعات التي يمكنهم مناقشتها. لمعالجة هذه المشكلة، نقترح مجموعة من أنظمة الحوار الجدلية مع تكنولوجيا البحث الحجة التي تمكن النظام من مناقشة أي موضوع يقوم بمحرك البحث قادرا على العثور على حجج مناسبة. يستخدم نهجنا تصنيف العلاقة المستندة إلى التعلم في التعلم لتعيين الحجج المستردة في بنية شجرة عامة للاستخدام في أنظمة الحوار. نقيم النهج مع حالة من محرك البحث الفني ونموذج حوار تم إدخاله مؤخرا في دراسة مستخدم مكثفة فيما يتعلق بتماسك الحوار. تختلف النتائج بين الموضوعات التي تم التحقيق فيها (وبالتالي تعتمد على جودة البيانات الأساسية) ولكنها في بعض الحالات قريبة بشكل مدهش من النتائج التي تحققت مع هيكل الوسيطة المشروح يدويا.
مجردة، تم اقتراح العديد من المقاييس لتقييم تشابه (مجردة) بمعنى تمثيلات (AMRS)، لكن القليل يعرف عن الطريقة التي تتعلق بتصنيفات التشابه البشري. علاوة على ذلك، فإن المقاييس الحالية لديها نقاط القوة والضعف التكميلية: يتأكيد البعض على السرعة، في حين أن ال بعض الآخر يجعل محاذاة هياكل الرسوم البيانية الصريحة، بسعر خطوة محاذاة مكلفة. في هذا العمل، نقترح مقاييس تشابه Weisfeiler-Leman Amr الجديدة التي توحد نقاط القوة المقاييس السابقة، مع تخفيف نقاط ضعفها. على وجه التحديد، فإن مقاييسنا الجديدة قادرة على مطابقة التحسسات الفاصلة والحرية والحث على N: M بين العقد. علاوة على ذلك، نقدم معيارا لمقاييس AMR بناء على الأهداف العلنية (الخيزران)، أول معيار لدعم التقييم التجريبي لمقاييس التشابه الرسمي في الرسم البياني. يزيد الخيزران إمكانية تفسير النتائج عن طريق تحديد أهداف علنية متعددة تتراوح بين أهداف تشابه الجملة لإجراء اختبارات الإجهاد التي تحقق متانة متري ضد تحويلات الرسم البياني المعني بالمعنى والمعنى. نعرض فوائد الخيزران عن طريق تنميط المقاييس السابقة ومقاييس خاصة بنا. تشير النتائج إلى أن مقاييس جديدة قد تكون بمثابة خط أساس قوي للعمل في المستقبل.
معالجة البريد هي النهج الأكثر تقليدية لتصحيح الأخطاء التي تسببها أنظمة التعرف على الأحرف البصرية (OCR).يتم اتخاذ خطوتين عادة لتصحيح أخطاء تعض عبر الإنترنت: الكشف والتصحيحات.بالنسبة للمهمة الأولى، أظهرت طرق تعلم الآلات الخاضعة للإشراف عروضا حديثة.تركز ت النهج المقترحة في السابق بشكل بارز على الجمع بين الميزات المعجمية والسياقية والإحصائية للكشف عن الأخطاء.في هذه الدراسة، نبلغ عن نظام رواية للكشف عن الأخطاء وهو ما يعتمد فقط على التهم N-Gram من رمز المرشح.بالإضافة إلى كونها بسيطة وأقل تكلفة حسابية، فإن نظامنا المقترح يدق النظم السابقة المبلغ عنها في مسابقة ICDAR2019 على اكتشاف خطأ OCR مع هوامش ملحوظة.حققنا درجات F1 الحديثة لمدة ثمانية من أصل عشر لغات أوروبية.الحد الأقصى للتحسين هو الإسبانية التي تحسنت من 0.69 إلى 0.90، والحد الأدنى للبولندية من 0.82 إلى 0.84.
توليد الحوار المكيف يعاني من ندرة الردود المسمى.في هذا العمل، استغلالنا بيانات نصية غير حوار مرتبطة بالشرط، والتي هي أسهل بكثير لجمعها.نقترح نهج تعليمي متعدد المهام للاستفادة من كل من الحوار والبيانات النصية المسمى.تقوم المهام الثلاثة بتحسين نفس مهمة توليد الحوار المحول مدببت مسبقا على بيانات الحوار المسمى، ومهمة ترميز اللغة مشروطة ومهمة توليد اللغة مشروطة على البيانات النصية المسمى.تظهر النتائج التجريبية أن نهجنا يتفوق على النماذج الحديثة من خلال الاستفادة من النصوص المسمى، كما أنه يحصل أيضا على تحسين أكبر في الأداء مقارنة بالطرق السابقة لاستفادة البيانات النصية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا