تصنيف النصوص هو واحد من المجالات الهامة في معالجة اللغة الطبيعية. تمت دراسة مشكلة التصنيف على نطاق واسع في استخراج البيانات ، التعلم الآلي ، وقاعدة البيانات ، و مجال استرجاع المعلومات مع التطبيقات في عدد من المجالات المتنوعة ، مثل التسويق المستهدف ، التشخيص الطبي ، تصفية مجموعة الأخبار ، وتنظيم الوثائق ، تحديد موضوع مقالة إخبارية ، تحليل المشاعر. ومن المعروف أنه من المستحيل تعريف أفضل مصنف نصي فمثلا في مجالات مثل الرؤية الحاسوبية Computer Vision ، هناك إجماع قوي حول طريقة عامة لتصميم النماذج والشبكات العصبونية وغيرها من المنهجيات المعتمدة . و بخلاف ذلك ، لا يزال تصنيف النص يفتقر إلى هذه الطريقة العامة في مجالات كثيرة . نهدف في هذا البحث إلى تقديم مسح شامل لمجموعة من المنهجيات والخوارزميات المستخدمة لتصنيف النصوص ، والتحسينات التي طرأت عليها . سنركز على المقاربات العامة الرئيسية لخوارزميات تصنيف النص وحالات الاستخدام الخاصة بها
Text classification is one of the important areas in natural language processing. The classification problem has been widely studied in data extraction, automated learning, database, and information retrieval with applications in many diverse fields, such as target marketing, medical diagnosis, newsgroup filtering, document organization, topic identification, . For example, in areas such as Computer Vision, there is a strong consensus on a general way of designing models, neural networks, and other approved methodologies. Otherwise, the classification of the text still lacks this general approach in many areas. In this paper, we aim to provide a comprehensive survey of a variety of methodologies and algorithms used to classify texts and their improvements. We will focus on the main general approaches to text classification algorithms and their usage cases.
المراجع المستخدمة
https://link.springer.com/chapter/10.1007%2F978-1-4614-3223-4_6
يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التو
انتشرت كلمة "البيانات الضخمة" في عام 2017 وأصبحت الأكثر شيوعًا في صناعة التكنولوجيا المتقدمة، حيث يستخدم التعلم الآلي الذي يسمح لأجهزة الكمبيوتر لتحليل البيانات السابقة والتنبؤ بالبيانات المستقبلية على نطاق واسع في الأماكن المألوفة. ويمكن لغير المتخص
مع زيادة الشبكات الاجتماعية ، بدأ الناس في مشاركة المعلومات عبر أنواع مختلفة من وسائل التواصل.
في هذا العمل قمنا بالاستفادة من قصص الأطفال وتوظيفها لتعليم الاطفال وذلك عن طريق قراءة قصة لهم وتحويلها إلى نص ومعالجة النص باستخدام اللغات الطبيعية
يهدف المشروع في المقام الأول إلى توظيف الذكاء الاصطناعي ، وتحديداً مهارات برمجة شبكة عصبية حيث الشبكات العصبية بدورها هي شبكات مهتمة بالتدريب والتعلم من الخطأ ، وتوظيف هذا الخطأ لتحقيق أفضل النتائج.
(CNN) على وجه الخصوص هي واحدة من أهم الشبكات العص
في الآونة الأخيرة، تم عرض فئة من تقنيات التتبع تسمى "التتبع عن طريق الكشف" لإعطاء نتائج واعدة بسرعات في الوقت الحقيقي، تقوم هذه الطرق بتدريب المصنف التمييزي بطريقة عبر الانترنت لفصل الكائن عن الخلفية. يعمل المصنف على تمهيد نفسه باستخدام حالة التعقب