المعجمات المعجمية ونماذج التنبؤ هي مكون رئيسي في العديد من أنظمة التوليف والتعرف على الكلام. نحن نعلم أن الكلمات ذات الصلة المورفولوجية تتبع عادة نمط ثابت من النطق والذين يمكن وصفها بالنماذج الخاصة باللغة. في هذا العمل، نستكشف مدى استخدام الشبكات العصبية المتكررة العميقة لتعلم هذا النمط تلقائيا واستغلال هذا النمط لتحسين جودة تنبؤ الكلمات ذات الصلة من خلال انعطاف مورفولوجي. نقترح مقارنتين جديدة لتزويد المعلومات المورفولوجية، باستخدام الطبقة المورفولوجية للكلمة وليمما، والتي يتم تفوحها عادة في المعجم القياسي. نبلغ عن التحسينات عبر عدد من اللغات الأوروبية بدرجات متفاوتة من التعقيد الصوتي والمورفولوجي، وعائلتين لغتان، مع تحسينات أكبر لغات حيث تكون مهمة تنبؤ النطق بطبيعتها أكثر تحديا. ونحن نلاحظ أيضا أن الجمع بين شبكات LSTM ثنائية الاتجاه مع آليات الاهتمام هي نهج عصبي فعال للمشكلة الحسابية التي نظرت، عبر اللغات. يبدو أن نهجنا مفيدا بشكل خاص في إعداد الموارد المنخفض، سواء من تلقاء نفسها وبتعلم التحويل.
Pronunciation lexicons and prediction models are a key component in several speech synthesis and recognition systems. We know that morphologically related words typically follow a fixed pattern of pronunciation which can be described by language-specific paradigms. In this work we explore how deep recurrent neural networks can be used to automatically learn and exploit this pattern to improve the pronunciation prediction quality of words related by morphological inflection. We propose two novel approaches for supplying morphological information, using the word's morphological class and its lemma, which are typically annotated in standard lexicons. We report improvements across a number of European languages with varying degrees of phonological and morphological complexity, and two language families, with greater improvements for languages where the pronunciation prediction task is inherently more challenging. We also observe that combining bidirectional LSTM networks with attention mechanisms is an effective neural approach for the computational problem considered, across languages. Our approach seems particularly beneficial in the low resource setting, both by itself and in conjunction with transfer learning.
References used
https://aclanthology.org/
Morphological tasks have gained decent popularity within the NLP community in the recent years, with large multi-lingual datasets providing morphological analysis of words, either in or out of context. However, the lack of a clear linguistic definiti
This paper describes ongoing work aiming at adding pronunciation information to lexical semantic resources, with a focus on open wordnets. Our goal is not only to add a new modality to those semantic networks, but also to mark heteronyms listed in th
Point-of-interest (POI) type prediction is the task of inferring the type of a place from where a social media post was shared. Inferring a POI's type is useful for studies in computational social science including sociolinguistics, geosemiotics, and
We discussed in this work some predictive methods for time series and it is decomposing time series to its component (trend, Seasonality, cycle, random), Exponential smoothing, ARIMA, then we discussed some combining methods, then we formed a new c
أهداف البحث:
-1 دراسة نظرية عن أهمية و أثر الدقة في التنبؤ بالمبيعات على خطط الإنتاج و التسويق و التوزيع.
-2 دراسة مرجعية عن التنقيب في البيانات و التنبؤ باستخدام السلاسل الزمنية و الشبكات العصبونية.
-3 استخدام الشبكات العصبية الصناعية في زيادة د