ترغب بنشر مسار تعليمي؟ اضغط هنا

نقدم دراسة منهجية حول الكشف عن النية متعددة اللغات والتبلغة من البيانات المنطوقة.تنفد الدراسة على أن مورد جديد تم طرحه في هذا العمل، الذي يطلق عليه عقول -14، وهو موارد تدريب وتقييم أول مهمة معرف مع البيانات المنطوقة.ويغطي 14 حداثة مستخرجة من نظام تجا ري في مجال الخدمات المصرفية الإلكترونية، المرتبطة بالأمثلة المنطوقة في 14 نوعا متنوعا باللغة.تشير نتائجنا الرئيسية إلى أن الجمع بين نماذج الترجمة الآلية مع وجود ترميز جملة متعددة اللغات الحديثة (على سبيل المثال، LASSE) تسفر عن كاشفات نية قوية في غالبية اللغات المستهدفة المشمولة في العقول -14، وتقديم تحليلات مقارنة عبر محاور مختلفة: على سبيل المثال، اتجاه الترجمة، تأثير التعرف على الكلام، تكبير البيانات من مجال ذي صلة.نرى هذا العمل كخطوة مهمة نحو تطوير وتقييم أكثر شمولية لمعرف متعدد اللغات من البيانات المنطوقة، ونأمل في طيف أوسع بكثير من اللغات مقارنة بالعمل السابق.
في هذا العمل، نركز على سيناريو عددا أقل تحديا للكشف عن قلة الرصاص حيث يكون العديد من النوايا المحبوسة بشكل جيد ومشبه بشكل صحيح.نقدم مخطط اكتشاف عديدي بسيطة ولكنه فعالة من القلة عبر التدريب المسبق والضبط الناعم الصنع.على وجه التحديد، نقوم أولا بإجراء تدريبات مسبقة من الناحية التي تم إشرافها ذاتيا على مجموعات بيانات النية التي تم جمعها، والتي تتعلم ضمنيا التمييز بين الكلام المماثلة الدلوية دون استخدام أي ملصقات.ثم نقوم بعد ذلك بإجراء اكتشاف عهد القليل من الرصاص مع التعلم البسيط المشروع، والذي يسحب صراحة النطق من نفس النية أقرب ويغطي الكلام عبر النوايا المختلفة أبعد.تظهر النتائج التجريبية أن أسلوبنا المقترح يحقق أداء حديثة على ثلاثة مجموعات بيانات للكشف عن النوايا الصعبة تحت 5 لقطة و 10 لقطة.
يقدم هذا العمل استراتيجية عامة أوتوماتيكية عامة لملء طبولوجيا المجال لنظام حوار موجه نحو المهام التي يحركها الأوجه، بهدف إجراء الكشف الناجح النقد في عملية الحوار، وأعد استخدام الموارد متعددة اللغات الحالية بالفعل.يتيح هذا النهج شبه الأوتوماتيكي مهندس ي OnTology استغلال الموارد المتاحة من أجل ربط المواقف المحتملة في حالة الاستخدام إلى إطارات Framenet والحصول على الوحدات المعجمية ذات الصلة المرتبطة بها في اللغة المستهدفة، بعد المعايير المعجمية والدلية، دون معرفة خبراء لغويةوبعدتم التحقق من صحة هذه الاستراتيجية وتقييمها في حالات الاستخدام اثنين، من السيناريوهات الصناعية، للتفاعل باللغة الإسبانية مع روبوت دليل ومع نظام إدارة الصيانة المحوسبة (CMMS).في كلتا الحالتين، سمحت هذه الطريقة بمهندس OnTology لإنشاء عنوان Ontology للمجال مع المعلومات ذات الصلة بالقصد مع بيانات عالية الجودة بطريقة بسيطة منخفضة الموارد.
يعتمد النمذجة وفهم الحوارات في محادثة على تحديد نية المستخدم من النص المحدد. كشف نية غير معروفة أو جديدة مهمة حاسمة، كما هو الحال في سيناريو واقعي قد يتغير نية المستخدم بشكل متكرر مع مرور الوقت وتحويله حتى إلى نية غير مرفدة. هذه المهمة المتمثلة في فص ل عينات النية المجهولة من النوايا المعروفة واحدة صعبة حيث يمكن أن يتراوح نية المستخدم غير المعروفة من النوايا المشابهة للحالة المحددة مسبقا لشيء مختلف تماما. غالبا ما ينظر البحث المسبق في اكتشاف النية كهمة تصنيف حيث يمكن أن ينتمي نية غير معروفة إلى مجموعة محددة مسبقا من فئات النية المعروفة. في هذه الورقة، نتعامل مع مشكلة الكشف عن نية غير معروفة تماما دون أي تلميحات مسبقة حول نوع الطبقات التي تنتمي إلى نوايا غير معروفة. نقترح طريقة فعالة لما بعد المعالجة باستخدام التحسين متعدد الأهداف لضبط مصنف نوايا NEWRET NEWRET NEWELTION موجود وجعله قادر على اكتشاف حطاء غير معروف. نحن نقوم بإجراء تجارب باستخدام مصنفات النوايا الحالية الحالية واستخدام طريقةنا على رأسها لكشف نية غير معروفة. تظهر تجاربنا عبر المجالات المختلفة ومجموعات البيانات في العالم الحقيقي أن طريقتنا تعطي تحسينات كبيرة مقارنة بالطرق الحديثة للكشف عن النية غير معروفة.
يعد الكشف عن النية مكونا رئيسيا في أنظمة الحوار الحديثة الموجهة نحو الأهداف التي تنجز مهمة مستخدم من خلال التنبؤ بمثابة إيداع نص المستخدمين. هناك ثلاثة تحديات أساسية في تصميم نماذج الكشف عن النية قوية ودقيقة. أولا، تتطلب نماذج الكشف عن النية النموذجي ة كمية كبيرة من البيانات المسمى لتحقيق دقة عالية. لسوء الحظ، في السيناريوهات العملية هو أكثر شيوعا للعثور على مجموعات بيانات صغيرة وغير متوازنة وصاخبة. ثانيا، حتى مع بيانات تدريب كبيرة، يمكن أن ترى نماذج الكشف عن النية توزيعا مختلفا لبيانات الاختبار عند نشرها في العالم الحقيقي، مما يؤدي إلى دقة سيئة. أخيرا، يجب أن يكون نموذج اكتشاف نوايا عمليا فعاليا في كل من التدريب واستنتاج الاستعلام الفردي بحيث يمكن استخدامه بشكل مستمر وإعادة تدريبه بشكل متكرر. نحن نؤيد أساليب الكشف عن النية في مجموعة متنوعة من مجموعات البيانات. تظهر نتائجنا أن نموذج الكشف عن نية مساعد Watson يفوق الحلول التجارية الأخرى ومقارنة مع نماذج اللغة المحددة مسبقا كبيرة مع حدوث جزء صغير فقط من الموارد الحسابية وبيانات التدريب. يدل مساعد واتسون درجة أعلى من المتانة عند تختلف توزيعات التدريب والاختبار.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا