قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا
عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة
تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء
مثل الاعلانات و الروابط و عناوين البريد الالكتروني و وجود العديد من الكلمات التي لا
تؤثر على التوجه العام للنص، و بعد الحصول على كل المنشورات في صفحة الفيسبوك
و ما هي التعليقات الخاصة حول كل المنشور المراد معرفة النسبة المئوية للآراء الإيجابية
و الآراء السلبية له.
طبّقنا خوارزمية بايز في التصنيف و أجرينا عليها التدريب المناسب و بعد تمرير
بيانات التغريدات (الآراء) حصلنا على نتائج جيدة حول نسبة المؤيدين للمنشور و نسبة
المعارضين له.
We bring the data from the social networking site Twitter
pages, and then we have worked on cleaning and processing
operation to the text of for the classification process texts retrieved
contain a lot of noise and information is useful for the process of
analyzing the views, such as advertisements and links and e-mail
addresses and the presence of many words that do not affect the
general orientation of the text, and then get all the publications in
the Twitter page and what are the comments about each tweets is
intended to know the proportion of supporters and opponents of
this publication.
We apply Naïve Bayes algorithm in classification, we had the
appropriate training, and after passing Posts and comments data
(opinions), we got good results on the ratio of supporters of the
post and the percentage of his opponents.
المراجع المستخدمة
Data Mining Concepts and Techniques Second Edition Jiawei Han and MichelineKamber
H. Tang, S. Tan, X. Cheng, A survey on sentiment detection of reviews, Expert Systems with Applications 36 (7) (2009) 10760 10773
Wilson T, Wiebe J, Hoffman P. Recognizing contextual polarity in phrase-level sentiment analysis
تعتبر استطلاعات الرأي الجسر الواصل بين الرأي العام و السياسيين أثناء الانتخابات. بالرغم من ذلك , فإن مسألة استقصاء الرأي لمعرفة ردة فعل الشعب بخصوص المسائل الاقتصادية , تعتبر محدودة, مكلفة و مستهلكة للوقت. تطور وسائل التواصل الاجتماعي في السنوات الأ
أصبحت بيانات Twitter مثبتة كمصدر قيم للبيانات لمختلف سيناريوهات التطبيق في السنوات الماضية.بالنسبة للعديد من هذه التطبيقات، من الضروري معرفة المكان الذي تم إرسال مشاركات Twitter (تغريدات) من أو الموقع الذي يشير إليه.كثيرا ما استخدم الباحثون الإحداثيا
جذبت الكشف عن المشاعر من وظائف وسائل التواصل الاجتماعي اهتماما ملحوظا من مجتمع معالجة اللغة الطبيعية (NLP) في السنوات الأخيرة.تختلف طرق الحصول على ملصقات ذهبية لتدريب واختبار أنظمة الكشف عن المشاعر التلقائية بشكل كبير من دراسة واحدة إلى أخرى، وتشكل م
توفر منصات الوسائط الاجتماعية (SM) مثل Twitter كميات كبيرة من البيانات في الوقت الفعلي والتي يمكن الاستفادة منها أثناء حالات الطوارئ الجماعية. تتطلب تطوير أدوات لدعم المجتمعات المتأثرة بالأزمات مجموعات البيانات المتاحة، والتي غالبا ما تكون موجودة لغا
أدت مرونة عملية الاستدلال في السيارات الآلية التلقائية (VAES) مؤخرا إلى مراجعة نماذج الموضوعات الاحتمالية التقليدية مما يؤدي إلى نماذج موضوع عصبي (NTM). على الرغم من أن هذه الأساليب حققت نتائج مهمة، فقد تم فعل القليل من العمل بشكل مدهش حول كيفية تفكي