ترغب بنشر مسار تعليمي؟ اضغط هنا

البيانات التعاونية للتصليح لتوصية تطبيقات صوت قوية ومتنوعة في المساعدين الشخصيين الذكي

Collaborative Data Relabeling for Robust and Diverse Voice Apps Recommendation in Intelligent Personal Assistants

210   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مساعد شخصي ذكي (IPAS) مثل Amazon Alexa و Assistant Google وسيري سيري يمدد قدراتهم المدمجة من خلال دعم التطبيقات الصوتية التي طورها مطورو الطرف الثالث. في بعض الأحيان يكون المساعد الذكي غير قادر على الاستجابة بنجاح لأوامر صوت المستخدم (ويعرف أيضا باسم الكلام). هناك العديد من الأسباب بما في ذلك خطأ التعرف على الكلام التلقائي (ASR)، وفهم اللغة الطبيعية (NLU)، وتوجيه الكلام إلى تطبيق صوت غير ذي صحي أو ببساطة أن المستخدم يطلب إمكانية غير مدعومة بعد. يؤدي الفشل في التعامل مع أمر صوتي إلى إحباط العملاء. في هذه الورقة، نقدم نظام توصية مهارة الاحتياطية لاقتراح تطبيق صوتي إلى عميل أمر صوتي غير معالج. واحدة من التحديات البارزة في تطوير نظام موصوف المهارات ل IPAS هو ملاحظة جزئية. لحل مشكلة الملاحظة الجزئية، نقترح طريقة إعادة انتكاسات البيانات التعاونية (CDR). بالإضافة إلى ذلك، يحسن CDR أيضا تنوع المهارات الموصى بها. نقيم الطريقة المقترحة على حد سواء دون اتصال وعلى الإنترنت. تظهر نتائج التقييم غير المتصلة بالإنترنت أن النظام المقترح يتفوق على الأساس. تظهر نتائج اختبار Online A / B زيادة كبيرة من مقاييس تجربة العملاء.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

اكتسبت توصية الأخبار التلقائية الكثير من الاهتمام من المجتمع الأكاديمي والصناعة. تكشف الدراسات الحديثة أن مفتاح هذه المهمة يكمن في تعلم التمثيل الفعال في كل من الأخبار والمستخدمين. تعمل الأعمال الحالية عادة عنوان الأخبار والمحتوى بشكل منفصل مع إهمال تفاعلها الدلالي، وهو غير كاف من أجل فهم نص الأخبار. إلى جانب ذلك، ترميز النماذج السابقة سجل تصفح المستخدم دون الاستفادة من الارتباط الهيكلي لأخبار استعراض المستخدمين لتعكس اهتمامات المستخدم صراحة. في هذا العمل، نقترح إطار توصية أخبار يتكون من ترميز الأخبار التعاونية (CNE) وترميز المستخدم الهيكلية (SUE) لتعزيز تعلم الأخبار وتمثيل المستخدم. CNE مجهزة LSTMS ثنائي الاتجاه ترميز عنوان الأخبار والمحتوى التعاوني مع الوحدات النمطية الشاملة والاهتمام لمعرفة تمثيل الأخبار الدلالية التفاعلية. تستخدم SUE الشبكات التنافسية الرسمية لاستخراج السمات الهيكلية الكتلة لسجل المستخدم، تليها وحدات الانتباه بين الكتلة والإنتباه إلى التعلم لتعلم تمثيلات فائدة المستخدم الهرمية. نتائج التجربة على DataSet العقل التحقق من صحة فعالية نموذجنا لتحسين أداء توصية الأخبار.
تقوم أنظمة الترجمة التقليدية المدربين على وثائق مكتوبة بشكل جيد للترجمة المستندة إلى النصوص ولكن ليس كذلك للتطبيقات المستندة إلى الكلام.نحن نهدف إلى تكييف نماذج الترجمة إلى الكلام عن طريق إدخال أخطاء معجمية حقيقية من أخطاء ASR والتجزئة من علامات التر قيم التلقائية في بيانات تدريب الترجمة الخاصة بنا.نقدم نهج إسقاط مقلوب تم اكتشافه تلقائيا شرائح النظام تلقائيا على النصوص البشرية ومن ثم إعادة الشرائح ترجمة الذهب إلى محاذاة النصوص الإنسانية المتوقعة.نوضح أن هذا يتغلب على عدم تطابق اختبار القطار الموجود في نهج التدريب الأخرى.يحقق نهج الإسقاط الجديد مكاسب أكثر من 1 نقطة بلو على خط أساس يتعرض للنصوص البشرية والجزء، وهذه المكاسب تعقد لكلا بيانات IWSLT وبيانات YouTube.
تم إحراك المصالح المتزايدة في أنظمة الموافقة على المحادثة (CRS)، والتي تستكشف تفضيل المستخدم من خلال تفاعلات المحادثة من أجل تقديم توصية مناسبة. ومع ذلك، لا يزال هناك نقص في القدرة في CRS الحالية إلى (1) اجتياز مسارات التفكير المتعددة على المعرفة الأ ساسية لإدخال العناصر والسمات ذات الصلة، و (2) ترتيب كيانات مختارة بشكل مناسب بموجب نود النظام الحالي للسيطرة على جيل الاستجابة. لمعالجة هذه المشكلات، نقترح Walker CR-Walker في هذه الورقة، وهو نموذج يقوم بتنفيذ التفكير منظم في الأشجار في رسم بياني للمعرفة، ويولد أعمال حوار إعلامية لتوجيه توليد اللغة. ينظر المخطط الفريد من المنطق المنظم في الأشجار إلى الكيان اجتاز كل قفزة كجزء من أعمال الحوار لتسهيل توليد اللغة، والذي يربط كيف يتم اختيار الكيانات والأعرب عنها. تظهر التقييمات التلقائية والبشرية أن CR-Walker يمكن أن يصل إلى توصية أكثر دقة، وتوليد استجابات أكثر إعلامية وجذابة.
إن الاندماج المثالي للوكلاء المستقلين في عالم بشري يعني أنهم قادرون على التعاون على الشروط الإنسانية.على وجه الخصوص، تلعب نظرية العقل دورا مهما في الحفاظ على أرضية مشتركة أثناء التعاون البشري والتواصل.لتمكين نظرية العقل النمذجة في التفاعلات الموجزة، نقدم مجموعة بيانات رائعة من المهام التعاونية التي أجرتها أزواج من الموضوعات البشرية في العالم الافتراضي ثلاثي الأبعاد في عالم MINECRAFT.يوفر المعلومات التي تلتقط معتقدات الشركاء في العالم وبعضها البعض كتفاعل تتكشف، مما يجعل فرصا وفرة لدراسة السلوكيات التعاونية البشرية في الاتصالات اللغوية المحددة.كخطوة أولى نحو هدفنا المتمثل في تطوير وكلاء منظمة العفو الدولية المجسدة قادرة على استنتاج حالات الاعتقاد بالشركاء التعاوني في الموقع، ونحن نبني وتقديم النتائج على النماذج الحسابية لعدة نظرية مهام العقل.
في حين أن التعرف التلقائي على الكلام قد أظهر عرضة لهجمات الخصومة، فإن الدفاعات ضد هذه الهجمات لا تزال متأخرة.يمكن كسر الدفاعات الحالية والساذجة جزئيا مع هجوم على التكيف.في مهام التصنيف، تبين أن نموذج التجانس العشوائي فعال في النماذج الدفاعية.ومع ذلك، من الصعب تطبيق هذه النموذج لمهام ASR، بسبب تعقيدها والطبيعة المتسلسلة لمخرجاتها.تتغلب الورق لدينا على بعض هذه التحديات من خلال الاستفادة من الأدوات الخاصة بالكلام مثل التحسين والتصويت Rover لتصميم نموذج ASR قوي للقلق.نحن نطبق الإصدارات التكيفية من الهجمات الحديثة، مثل هجوم ASR غير المحدد، ونموذجنا، وإظهار أن أقوى دفاعنا هو قوي لجميع الهجمات التي تستخدم الضوضاء غير المسموعة، ولا يمكن كسرها إلا مع تشويه كبير للغايةوبعد

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا