تصنيف النصوص هو واحد من المجالات الهامة في معالجة اللغة الطبيعية. تمت دراسة مشكلة التصنيف على نطاق واسع في استخراج البيانات ، التعلم الآلي ، وقاعدة البيانات ، و مجال استرجاع المعلومات مع التطبيقات في عدد من المجالات المتنوعة ، مثل التسويق المستهدف ، التشخيص الطبي ، تصفية مجموعة الأخبار ، وتنظيم الوثائق ، تحديد موضوع مقالة إخبارية ، تحليل المشاعر. ومن المعروف أنه من المستحيل تعريف أفضل مصنف نصي فمثلا في مجالات مثل الرؤية الحاسوبية Computer Vision ، هناك إجماع قوي حول طريقة عامة لتصميم النماذج والشبكات العصبونية وغيرها من المنهجيات المعتمدة . و بخلاف ذلك ، لا يزال تصنيف النص يفتقر إلى هذه الطريقة العامة في مجالات كثيرة . نهدف في هذا البحث إلى تقديم مسح شامل لمجموعة من المنهجيات والخوارزميات المستخدمة لتصنيف النصوص ، والتحسينات التي طرأت عليها . سنركز على المقاربات العامة الرئيسية لخوارزميات تصنيف النص وحالات الاستخدام الخاصة بها
Text classification is one of the important areas in natural language processing. The classification problem has been widely studied in data extraction, automated learning, database, and information retrieval with applications in many diverse fields, such as target marketing, medical diagnosis, newsgroup filtering, document organization, topic identification, . For example, in areas such as Computer Vision, there is a strong consensus on a general way of designing models, neural networks, and other approved methodologies. Otherwise, the classification of the text still lacks this general approach in many areas. In this paper, we aim to provide a comprehensive survey of a variety of methodologies and algorithms used to classify texts and their improvements. We will focus on the main general approaches to text classification algorithms and their usage cases.
References used
https://link.springer.com/chapter/10.1007%2F978-1-4614-3223-4_6
Recently, a class of tracking techniques called "tracking by detection" has been shown to give promising results at real-time speeds. These methods train a discriminative classifier in an online manner to separate the object from the background. This
The project aims primarily to employ the benefits of artificial intelligence, specifically the characteristics of programming a neuronal network where neuronal networks, in turn, are networks that are interested in trainin
With the increase in social networks, people have started to share information via different types of social media. Among themwere sites for exchanging people's opinions and others to exchange stories about real life and stories for children. In this
The word "massive data" spread in 2017 and became the most common in the industry of advanced technology, it uses automated learning that allows computers to analyze past data and predict future data widely in familiar places. Non-automated learning
يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التو