ترغب بنشر مسار تعليمي؟ اضغط هنا

شبكة Bertway Network Network للكشف عن صفر طلقة متعددة النوايا في فهم اللغة المنطوقة

A Label-Aware BERT Attention Network for Zero-Shot Multi-Intent Detection in Spoken Language Understanding

508   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مع النجاح المبكر لمساعدات الإجابة في الاستعلام مثل Alexa و Siri، فإن محاولات البحث لتوسيع إمكانات النظام من أتمتة خدمة التعامل هي الآن وفيرة. ومع ذلك، فقد عثرت الأنظمة الأولية بسرعة على عدم كفاية في الاعتماد على تقنيات التصنيف البسيطة لتحقيق مهمة الأتمتة بشكل فعال. التحدي الرئيسي هو أن الحوار يتضمن في كثير من الأحيان التعقيد في نوايا المستخدم (أو أغراض) معتلقها، مع مراعاة التغيير التلقائي، ويصعب تتبعه. علاوة على ذلك، لم تعتبر مجموعات البيانات العامة هذه المضاعفات والشروح الدلالية العامة غير موجودة والتي قد تؤدي إلى مشكلة تسديدة صفرية. بدافع من ما ورد أعلاه، نقترح شبكة انتباه بيرت علم الملصقات (Laban) للكشف عن الصفر طلقة متعددة النوايا. نقوم أولا بتشفير كلمات الإدخال مع بيرت وبناء مساحة مضمنة تسمية من خلال النظر في دلالات مضمنة في ملصقات النوايا. ثم يتم تصنيف كلمة الإدخال بناء على أوزان الإسقاط على كل تضمين نية في هذه المساحة المضمنة. نظهر أنه تمتد بنجاح إلى عدد قليل من الإعدادات / الصفر، حيث يكون جزء من ملصقات النوايا غير مرئية في بيانات التدريب، من خلال مراعاة الدلالات أيضا في هذه الملصقات النية غير المرئية. تظهر النتائج التجريبية أن نهجنا قادر على اكتشاف العديد من الملصقات النية غير المرئية بشكل صحيح. كما أنه يحقق الأداء الحديثة في خمس مجموعات بيانات متعددة النوايا في الحالات العادية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مع التعلم Landit العديد المصنعة، يمكن تدريب النماذج بناء على ردود فعل إيجابية وسالبة وردت للتنبؤات التاريخية، دون الحاجة إلى البيانات المسمى.ومع ذلك، غالبا ما تكون هذه الملاحظات متوفرة في أنظمة الحوار في العالم الحقيقي، ومع ذلك، فإن الهندسة المعمارية المعيارية المستخدمة عادة في أنظمة واسعة النطاق يمنع التطبيق المباشر لهذه الخوارزميات.في هذه الورقة، ندرس مشكلة إريقات التغذية المرتدة التي تنشأ عند استخدام التعلم Landit Adderfactual لفهم اللغة المنطوقة متعددة المجالات.نقدم إعداد تجريبي لمحاكاة المشكلة في مجموعات البيانات العامة على نطاق صغير، اقترح طرق الإسناد المستوحاة من التعزيز التعزيز متعدد الوكلات وتقييمها ضد خطوط خطوط خطوط خطوط خطوط خطوط طويلة.نجد أنه أثناء استخدام الملاحظات الشاملة مباشرة يؤدي إلى أداء كارثي، يمكن أن تسمح طرقنا الإسناد المقترحة لدينا نماذج تنافسية للتدريب من ملاحظات المستخدم.
يعادل الافتقار إلى بيانات التقييم المتاحة للجمهور لغات الموارد المنخفضة التقدم المحرز في فهم اللغة المنطوقة (SLU).نظرا لأن المهام الرئيسية مثل تصنيف النوايا وملء الفتحات تتطلب بيانات تدريبية وفيرة، فمن المستحسن إعادة استخدام البيانات الحالية بلغات ال موارد عالية الوزن لتطوير نماذج لسيناريوهات الموارد المنخفضة.نقدم XSID، معيار جديد للفتحة عبر اللغات (x) والكشف عن النوايا في 13 لغة من 6 أسر لغوية، بما في ذلك لهجة الموارد المنخفضة للغاية.لمعالجة التحدي، نقترح نهجا تعليميا مشتركا، مع بيانات تدريب Slu الإنجليزية والمهام المساعدة غير الإنجليزية من النص الخام، بناء الجملة والترجمة للنقل.نقوم بدراسة اثنين من الإعدادات التي تختلف عن طريق تغطية النوع واللغة من المبيعات المدربة مسبقا.تظهر نتائجنا أن تعلم المشترك التعلم بالمهام الرئيسية ذات النمذجة اللغوية المعقدة فعالة للفتحات، في حين أن تحويل الترجمة الآلية يعمل بشكل أفضل لتصنيف النية.
نقدم دراسة منهجية حول الكشف عن النية متعددة اللغات والتبلغة من البيانات المنطوقة.تنفد الدراسة على أن مورد جديد تم طرحه في هذا العمل، الذي يطلق عليه عقول -14، وهو موارد تدريب وتقييم أول مهمة معرف مع البيانات المنطوقة.ويغطي 14 حداثة مستخرجة من نظام تجا ري في مجال الخدمات المصرفية الإلكترونية، المرتبطة بالأمثلة المنطوقة في 14 نوعا متنوعا باللغة.تشير نتائجنا الرئيسية إلى أن الجمع بين نماذج الترجمة الآلية مع وجود ترميز جملة متعددة اللغات الحديثة (على سبيل المثال، LASSE) تسفر عن كاشفات نية قوية في غالبية اللغات المستهدفة المشمولة في العقول -14، وتقديم تحليلات مقارنة عبر محاور مختلفة: على سبيل المثال، اتجاه الترجمة، تأثير التعرف على الكلام، تكبير البيانات من مجال ذي صلة.نرى هذا العمل كخطوة مهمة نحو تطوير وتقييم أكثر شمولية لمعرف متعدد اللغات من البيانات المنطوقة، ونأمل في طيف أوسع بكثير من اللغات مقارنة بالعمل السابق.
الطريقة التي يتم إنشاؤها ونشرها قد تغيرت بشكل كبير خلال العقد الماضي.إن تحديد المنظور السياسي يشكل طريقة مناقشة الأحداث المناقشة في وسائل الإعلام أكثر أهمية بسبب الزيادة الحادة في عدد منافذ الأخبار والمقالات.الأساليب السابقة عادة ما تستفيد فقط المعلو مات اللغوية.ومع ذلك، فإن المقالات الإخبارية تحاول الحفاظ على المصداقية ويبدو أنها محايدة.لذلك، يتم تقديم التحيز بطرق خفية، عادة من خلال التركيز على جوانب مختلفة من القصة.في هذه الورقة، نقترح إطارا جديدا يعتبر الكيانات المذكريات في المقالات الإخبارية والمعرفة الخارجية بها، مما أسفر عن التحيز فيما يتعلق بهذه الكيانات.نستكشف طرق مختلفة لحقن معلومات الكيان في نموذج النص.تظهر التجارب أن إطار عملنا المقترح يحقق تحسينات كبيرة على النماذج النصية القياسية، وهو قادر على تحديد الفرق في روايات الأخبار مع وجهات نظر مختلفة.
يعرض عدم وجود بيانات تدريبية تحديا كبيرا لتحجيم فهم اللغة المنطوقة لغات الموارد المنخفضة.على الرغم من أن نهج تكبير البيانات المختلفة قد اقترحت توليف البيانات التدريبية في لغات مستهدفة منخفضة الموارد، فإن مجموعات البيانات المعززة غالبا ما تكون صاخبة، وبالتالي تعيق أداء نماذج SLU.في هذه الورقة نركز على تخفيف الضوضاء في البيانات المعززة.نقوم بتطوير نهج تدريب Denosising.يتم تدريب نماذج متعددة مع البيانات التي تنتجها الطرق المعززة المختلفة.توفر هذه النماذج إشارات الإشراف لبعضها البعض.تظهر النتائج التجريبية أن أسلوبنا تتفوق على الحالة القائمة من الفن الموجودة بمقدار 3.05 و 4.24 نقطة مئوية عن مجموعات بيانات قياسية على التوالي.سيتم تقديم الرمز مفتوح المصادر على جيثب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا