ترغب بنشر مسار تعليمي؟ اضغط هنا

فهم اللغة المنطوقة (SLU) يستخرج المتوسط المقصود من كلام المستخدم وهو عنصر حرج في عوامل المحادثة الافتراضية.في الوكلاء الافتراضيين للمؤسسة (EVAS)، فهم اللغة تحديا كبيرا.أولا، المستخدمين متصلون نادرون غير مألوفين بتوقع تدفق محادثة مصممة مسبقا.ثانيا، يد فع المستخدمون للعملاء من المؤسسة الذين يطالبون بتجربة مستخدم موثوقة ومتسقة وفعالة عند حل مشكلاتها.في هذا العمل، نصف إطارا عاما وقوي لاستخراج النوايا والكيان باستخدام هجينة من النهج الإحصائية القائمة على القواعد.يشمل إطارنا نمذجة الثقة التي تتضمن معلومات من جميع المكونات في خط أنابيب Slu، إضافة نقدية للإستقاط إلى الدقة بالتأكيد.يركز تركيزنا على إنشاء وحدة دقيقة وقابلة للتطوير التي يمكن نشرها بسرعة للحصول على فئة كبيرة من تطبيقات إيفا مع القليل من الحاجة إلى التدخل البشري.
تعتبر العلامات الموثوقة للتعبيرات الزمنية (TES، على سبيل المثال، كتاب طاولة في L'Osteria مساء الأحد) هو الشرط المركزي للمساعدين الصوتيين (VAS).ومع ذلك، هناك ندرة الموارد والأنظمة لنطاق VA، حيث يتم تدريب التقنيص الزمني المتاحين علنا فقط على مجالات مخت لفة إلى حد كبير، مثل الأخبار والنص السريري.نظرا لأن تكلفة التسجيل في مجموعات البيانات الكبيرة عبارة عن محظور، فإننا نحقق في المفاضلة بين البيانات والأداء داخل المجال في DA-Time، وهو Tagger الزمني الهجين للمجال الإنجليزي VA الذي يجمع بين الهندسة المعمارية العصبية للاعتراف القوي، مع محللباس te نومي.نجد أن التعلم النقل يقطع شوطا طويلا حتى مع وجود 25 جمل داخل المجال: يؤدي DA-Time في حالة الفن في مجال الأخبار، وتفوقه بشكل كبير على نطاق VA.
أحد كتل المبنى الأولى لإنشاء مساعد صوت يتعلق بمهمة وضع علامة الكيانات أو السمات في استعلامات المستخدم. يمكن أن يكون هذا تحديا بشكل خاص عندما تكون الكيانات في العاشر من الملايين، كما هو الحال على سبيل المثال كتالوجات الموسيقى. تتطلب نماذج وضع العلامات التدريبية التدريبية على نطاق صناعي كميات كبيرة من استفسارات المستخدم المسمى بدقة، والتي غالبا ما تكون صعبة ومكلفة لجمعها. من ناحية أخرى، جمع المساعدون الصوتيين عادة الكثير من الاستفسارات غير المستمرة التي لا تزال غير منفصلة في كثير من الأحيان. تقدم هذه الورقة منهجية خاضعة للإشراف ضعيفا لتسمية كميات كبيرة من سجلات الاستعلام الصوتية، معززة مع خطوة تصفية يدوية. تظهر التقييمات التجريبية لدينا أن نماذج علامات الشريعة المدربة على البيانات المتفوقة على البيانات التي تجريب ضعيف تدربت على البيانات المشروحة باليد أو الاصطناعية، بتكلفة أقل. علاوة على ذلك، يؤدي التصفية اليدوية للبيانات الخاضعة للإشراف إلى انخفاض كبير في معدل خطأ العقوبة، مع السماح لنا بتقليل جهود الرعاية البشرية بشكل كبير من أسابيع إلى ساعات، فيما يتعلق بالتعليق اليدوي للاستفسارات. يتم تطبيق الطريقة بنجاح Bootstrap نظام علامات Slot لخدمة تدفق الموسيقى الرئيسية التي تخدم حاليا العديد من عشرات الآلاف من الاستفسارات الصوتية اليومية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا