ترغب بنشر مسار تعليمي؟ اضغط هنا

يشكل التعرف التلقائي للأصويات مشكلة صعبة لتطبيقات NLP. في حين أن المتحدثين الأصليين يمكنهم التعامل بشكل حدسي مع تعبيرات متعددة الكلمات التي من الصعب تتبع معاني الكلمات التي تعود معانيها التركيبية إلى دلالات الكلمة الفردية، لا يزال هناك نطاق واسع لتحس ين الأساليب الحسابية. نحن نفترض أن الإنشاءات الاصطلاحية يمكن أن تتم بها شدة تدريجية من عدم التركيز الدلالي، والتحددات الرسمية، وسياق استخدام غير عادي، وإدخال عدد من التدابير اللازمة لهذه الخصائص، وتتألف تدابير تجميع قائمة على العد والتنبؤية مع تدابير السياق (الأمم المتحدة )تشابه. نحن نقيم نهجنا على معيار الذهب المسمى يدويا، مشتقة من كائن من كلمات البوب ​​الألمانية. تحقيقا لهذه الغاية، نطبق مصنف غابات عشوائي لتحليل المساهمة الفردية للميزات للكشف عن التعابير تلقائيا، ودراسة المفاضلة بين الاستدعاء والدقة. أخيرا، نقوم بتقييم المصنف في مجموعة بيانات مستقلة من التعابير المستخرجة من قائمة التعابير في ويكيبيديا، وتحقيق الدقة الحديثة.
التعبيرات الاصطلاحية المحتملة (الفطائر) غامضة بين التفسيرات الاصطلاحية غير المركزة والتفسيرات الحرفية الشفافة. على سبيل المثال، اضغط على الطريق "" يمكن أن يكون له معنى اصطلاحي يقابل بدء رحلة "أو لديك تفسير حرفي. في هذه الورقة، نقترح نموذجا للإشراف عل ى أساس تضمينات السياق للتنبؤ بما إذا كانت تهدف الفطائر هي اصطلاحي أو حرفي. نحن نفكر في تجارب أحادية اللغة باللغتين الإنجليزية والروسية، وتظهر أن النموذج المقترح يتفوق على النهج السابقة، بما في ذلك في حالة اختبار النموذج على حالات أنواع فطيرة لم يلاحظ أثناء التدريب. ثم نفكر في تجارب عبر اللغات التي يتم فيها تدريب النموذج على حالات فطيرة بلغة أو الإنجليزية أو الروسية، واختبارها على اللغة الأخرى. نجد أن النموذج يتفوق على خطوط الأساس في هذا الإعداد. تشير هذه النتائج إلى أن المدينات السياقية قادرة على تعلم التمثيلات التي ترميز معرفة الاصطلاحية غير المقصورة على تعبيرات محددة، ولا لغة محددة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا