ترغب بنشر مسار تعليمي؟ اضغط هنا

معيار خدمات الكشف عن النية التجارية مع تقييمات مدفوعة بالممارسة

Benchmarking Commercial Intent Detection Services with Practice-Driven Evaluations

360   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعد الكشف عن النية مكونا رئيسيا في أنظمة الحوار الحديثة الموجهة نحو الأهداف التي تنجز مهمة مستخدم من خلال التنبؤ بمثابة إيداع نص المستخدمين. هناك ثلاثة تحديات أساسية في تصميم نماذج الكشف عن النية قوية ودقيقة. أولا، تتطلب نماذج الكشف عن النية النموذجية كمية كبيرة من البيانات المسمى لتحقيق دقة عالية. لسوء الحظ، في السيناريوهات العملية هو أكثر شيوعا للعثور على مجموعات بيانات صغيرة وغير متوازنة وصاخبة. ثانيا، حتى مع بيانات تدريب كبيرة، يمكن أن ترى نماذج الكشف عن النية توزيعا مختلفا لبيانات الاختبار عند نشرها في العالم الحقيقي، مما يؤدي إلى دقة سيئة. أخيرا، يجب أن يكون نموذج اكتشاف نوايا عمليا فعاليا في كل من التدريب واستنتاج الاستعلام الفردي بحيث يمكن استخدامه بشكل مستمر وإعادة تدريبه بشكل متكرر. نحن نؤيد أساليب الكشف عن النية في مجموعة متنوعة من مجموعات البيانات. تظهر نتائجنا أن نموذج الكشف عن نية مساعد Watson يفوق الحلول التجارية الأخرى ومقارنة مع نماذج اللغة المحددة مسبقا كبيرة مع حدوث جزء صغير فقط من الموارد الحسابية وبيانات التدريب. يدل مساعد واتسون درجة أعلى من المتانة عند تختلف توزيعات التدريب والاختبار.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

التحدي الرئيسي في أبحاث أنظمة الحوار هو التكيف بشكل فعال وكفاءة مع مجالات جديدة. يتطلب نموذجا قابل للتطوير للتكيف تطوير النماذج التعميمية التي تؤدي بشكل جيد في إعدادات قليلة. في هذه الورقة، نركز على مشكلة تصنيف النية التي تهدف إلى تحديد نوايا المستخد مين المعطاة الكلام الموجهة إلى نظام الحوار. نقترح اقترابين لتحسين تعميم نماذج تصنيف الكلام: (1) مراقبون و (2) تدريب على سبيل المثال لقد أظهر العمل السابق أن النماذج التي تشبه بيرت تميل إلى تنسيق مبلغ كبير من الاهتمام ل [CLS] الرمز المميز، والتي نفترض النتائج في تمثيلات مخففة. المراقبون هم الرموز التي لا تحضرها، وهي بديل من رمزية [CLS] كتمثيل دلالي للكلمات. يتعلم التدريب على سبيل المثال أن تصنف الكلام من خلال مقارنة بالأمثلة، وبالتالي استخدام التشفير الأساسي كنموذج تشابه الجملة. هذه الأساليب مكملة؛ إن تحسين التمثيل من خلال المراقبين يسمحون بالنموذج الذي يحركه المثال إلى تحسين أوجه تشابه الجملة. عند دمجها، فإن الأساليب المقترحة تحقق نتائج أحدث نتائج من ثلاث مجموعات من مجموعات بيانات التنبؤ النية (Banking77، CLINC150، HWU64) في كلا البيانات الكاملة وإعدادات قليلة (10 أمثلة لكل نية). علاوة على ذلك، نوضح أن النهج المقترح يمكن أن ينقل إلى النوايا الجديدة وعبر مجموعات البيانات دون أي تدريب إضافي.
نقدم دراسة منهجية حول الكشف عن النية متعددة اللغات والتبلغة من البيانات المنطوقة.تنفد الدراسة على أن مورد جديد تم طرحه في هذا العمل، الذي يطلق عليه عقول -14، وهو موارد تدريب وتقييم أول مهمة معرف مع البيانات المنطوقة.ويغطي 14 حداثة مستخرجة من نظام تجا ري في مجال الخدمات المصرفية الإلكترونية، المرتبطة بالأمثلة المنطوقة في 14 نوعا متنوعا باللغة.تشير نتائجنا الرئيسية إلى أن الجمع بين نماذج الترجمة الآلية مع وجود ترميز جملة متعددة اللغات الحديثة (على سبيل المثال، LASSE) تسفر عن كاشفات نية قوية في غالبية اللغات المستهدفة المشمولة في العقول -14، وتقديم تحليلات مقارنة عبر محاور مختلفة: على سبيل المثال، اتجاه الترجمة، تأثير التعرف على الكلام، تكبير البيانات من مجال ذي صلة.نرى هذا العمل كخطوة مهمة نحو تطوير وتقييم أكثر شمولية لمعرف متعدد اللغات من البيانات المنطوقة، ونأمل في طيف أوسع بكثير من اللغات مقارنة بالعمل السابق.
غالبا ما تستخدم أنظمة المحادثة الموجهة نحو المهام تتبع حالة الحوار لتمثيل نوايا المستخدم، والتي تنطوي على ملء قيم فتحات محددة مسبقا.تم اقتراح العديد من النهج، وغالبا ما تستخدم الهندسة المعنية بمهام المهام مع مصنفات ذات الأغراض الخاصة.في الآونة الأخير ة، تم الحصول على نتائج جيدة باستخدام هياكل عامة أكثر بناء على نماذج اللغة المحددة مسبقا.هنا، نقدم اختلافا جديدا لنهج نمذجة اللغة التي تستخدم مطالبة مخطط مدفوعة بتوفير ترميز التاريخ على علم المهام المستخدمة لكل من الفتحات الفئوية وغير القشرية.ونحن كذلك تحسين الأداء من خلال زيادة المطالبة بأوصاف المخطط، وهو مصدر حدوث طبيعي للمعرفة داخل المجال.لدينا نظام التوليد البحت يحقق الأداء الحديثة في MultiWoz 2.2 وتحقق أداء تنافسي على اثنين من المعايير الأخرى: MultiWoz 2.1 و M2M.ستكون البيانات والرمز متاحة في https://github.com/chiahsuan156/dst-as-prompting.
تم إدخال نماذج اللغة القائمة على المحولات خطوة ثورية لأبحاث معالجة اللغة الطبيعية (NLP). أدت هذه النماذج، مثل Bert، GPT و Electra، إلى أداء أحدث في العديد من مهام NLP. تم تطوير معظم هذه النماذج في البداية للغة الإنجليزية ولغات أخرى تبعها لاحقا. في ال آونة الأخيرة، بدأت عدة نماذج عربية خاصة الناشئة. ومع ذلك، هناك مقارنات محدودة مباشرة بين هذه النماذج. في هذه الورقة، نقيم أداء 24 من هذه النماذج على المعنويات العربية والكشف عن السخرية. تظهر نتائجنا أن النماذج التي تحققت أفضل أداء هي تلك التي يتم تدريبها على البيانات العربية فقط، بما في ذلك اللغة العربية ذاتي، واستخدام عدد أكبر من المعلمات، مثل Marbert صدر مؤخرا. ومع ذلك، لاحظنا أن ARAELECTRA هي واحدة من أفضل النماذج الأدائية بينما تكون أكثر كفاءة في تكلفتها الحسابية. أخيرا، أظهرت التجارب على المتغيرات Aragpt2 أداء منخفضة مقارنة بنماذج Bert، مما يشير إلى أنه قد لا يكون مناسبا لمهام التصنيف.
في هذا العمل، نركز على سيناريو عددا أقل تحديا للكشف عن قلة الرصاص حيث يكون العديد من النوايا المحبوسة بشكل جيد ومشبه بشكل صحيح.نقدم مخطط اكتشاف عديدي بسيطة ولكنه فعالة من القلة عبر التدريب المسبق والضبط الناعم الصنع.على وجه التحديد، نقوم أولا بإجراء تدريبات مسبقة من الناحية التي تم إشرافها ذاتيا على مجموعات بيانات النية التي تم جمعها، والتي تتعلم ضمنيا التمييز بين الكلام المماثلة الدلوية دون استخدام أي ملصقات.ثم نقوم بعد ذلك بإجراء اكتشاف عهد القليل من الرصاص مع التعلم البسيط المشروع، والذي يسحب صراحة النطق من نفس النية أقرب ويغطي الكلام عبر النوايا المختلفة أبعد.تظهر النتائج التجريبية أن أسلوبنا المقترح يحقق أداء حديثة على ثلاثة مجموعات بيانات للكشف عن النوايا الصعبة تحت 5 لقطة و 10 لقطة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا