ترغب بنشر مسار تعليمي؟ اضغط هنا

تحليل الآراء في تويتر

Opinions Mining in Twitter

2492   4   99   0 ( 0 )
 تاريخ النشر 2016
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء مثل الاعلانات و الروابط و عناوين البريد الالكتروني و وجود العديد من الكلمات التي لا تؤثر على التوجه العام للنص، و بعد الحصول على كل المنشورات في صفحة الفيسبوك و ما هي التعليقات الخاصة حول كل المنشور المراد معرفة النسبة المئوية للآراء الإيجابية و الآراء السلبية له. طبّقنا خوارزمية بايز في التصنيف و أجرينا عليها التدريب المناسب و بعد تمرير بيانات التغريدات (الآراء) حصلنا على نتائج جيدة حول نسبة المؤيدين للمنشور و نسبة المعارضين له.


ملخص البحث
تناول البحث تحليل الآراء في تويتر باستخدام تقنيات التنقيب في البيانات، حيث تم استخدام خوارزمية بايز لتصنيف التغريدات إلى آراء إيجابية وسلبية. بدأ البحث بجمع البيانات من تويتر، ثم تم تنظيف النصوص من الضجيج والمعلومات غير المفيدة مثل الإعلانات والروابط. بعد ذلك، تم تطبيق خوارزمية بايز على النصوص المصنفة مسبقاً للحصول على نسبة المؤيدين والمعارضين لكل تغريدة. أظهرت النتائج دقة تصل إلى 97% في تصنيف الآراء، مما يعكس فعالية الخوارزمية المستخدمة. كما اقترح الباحث تطوير التطبيق ليشمل لغات أخرى مثل العربية وتحليل الآراء في مواقع تواصل اجتماعي أخرى مثل فيسبوك ويوتيوب.
قراءة نقدية
دراسة نقدية: يعتبر البحث خطوة هامة في مجال تحليل الآراء باستخدام تقنيات التنقيب في البيانات، إلا أنه يفتقر إلى التعامل مع النصوص المكتوبة باللغة العربية، وهي لغة مهمة لملايين المستخدمين. كما أن الاعتماد على خوارزمية بايز فقط قد يكون محدوداً في التعامل مع النصوص التي تحتوي على مشاعر متناقضة. كان من الأفضل تضمين خوارزميات أخرى مثل الشبكات العصبية لتحسين دقة التصنيف. بالإضافة إلى ذلك، يمكن تحسين البحث بتوسيع نطاقه ليشمل مواقع تواصل اجتماعي أخرى لتقديم صورة أشمل عن الآراء.
أسئلة حول البحث
  1. ما هي الخوارزمية المستخدمة في البحث لتحليل الآراء؟

    تم استخدام خوارزمية بايز لتحليل وتصنيف الآراء في التغريدات.

  2. ما هي نسبة دقة النتائج التي توصل إليها البحث؟

    توصل البحث إلى نسبة دقة تصل إلى 97% في تصنيف الآراء.

  3. ما هي الخطوات التي تم اتباعها في تنظيف النصوص قبل التصنيف؟

    تم تنظيف النصوص من الضجيج والمعلومات غير المفيدة مثل الإعلانات والروابط وعناوين البريد الإلكتروني.

  4. ما هي التوصيات المستقبلية التي اقترحها الباحث لتطوير البحث؟

    اقترح الباحث تطوير التطبيق ليشمل لغات أخرى مثل العربية وتحليل الآراء في مواقع تواصل اجتماعي أخرى مثل فيسبوك ويوتيوب.


المراجع المستخدمة
Data Mining Concepts and Techniques Second Edition Jiawei Han and MichelineKamber
H. Tang, S. Tan, X. Cheng, A survey on sentiment detection of reviews, Expert Systems with Applications 36 (7) (2009) 10760 10773
Wilson T, Wiebe J, Hoffman P. Recognizing contextual polarity in phrase-level sentiment analysis
قيم البحث

اقرأ أيضاً

تعتبر استطلاعات الرأي الجسر الواصل بين الرأي العام و السياسيين أثناء الانتخابات. بالرغم من ذلك , فإن مسألة استقصاء الرأي لمعرفة ردة فعل الشعب بخصوص المسائل الاقتصادية , تعتبر محدودة, مكلفة و مستهلكة للوقت. تطور وسائل التواصل الاجتماعي في السنوات الأ خيرة مثل تويتر (Twitter) , جعل من السهل على الأفراد مشاركة آرائهم الشخصية على نطاق واسع في مواضيع عديدة مثل الانتخابات. كما وفرت هذه الشبكات الاجتماعية منصة ضخمة لجمع المعطيات و البيانات المختلفة. تقترح هذه الورقة البحثية طريقة لاستكشاف الرأي العام و فهم النقاشات التي تدار في تويتر بخصوص المسائل الاقتصادية أثناء الانتخابات الرئاسية. تستخدم الطرق الحالية التي تتعلق بهذا البحث طرق متعددة لتعدين النصوص (Text mining) بشكل مستقل لتحليل الانتخابات و توقع الانتخابات ; في هذه الورقة البحثية سنقوم بدمج طريقتين لتعدين النصوص : تحليل المشاعر و نمذجة المواضيع. تم تطبيق الطريقة المقترحة بشكل فعال على ملايين التغريدات من تويتر لتحليل التخوفات الاقتصادية للشعب أثناء الانتخابات الرئاسية الأمريكية في عام 2012.
أصبحت بيانات Twitter مثبتة كمصدر قيم للبيانات لمختلف سيناريوهات التطبيق في السنوات الماضية.بالنسبة للعديد من هذه التطبيقات، من الضروري معرفة المكان الذي تم إرسال مشاركات Twitter (تغريدات) من أو الموقع الذي يشير إليه.كثيرا ما استخدم الباحثون الإحداثيا ت الدقيقة المقدمة في نسبة مئوية صغيرة من التغريدات، لكن Twitter أزال الخيار لمشاركة هذه الإحداثيات في منتصف عام 2019.علاوة على ذلك، هناك سبب للشك في أن حصة كبيرة من الإحداثيات المقدمة لم تتوافق مع إحداثيات GPS للمستخدم حتى قبل ذلك.في هذه الورقة، نوضح الوضع وتغيير السياسة لعام 2019 وإلقاء الضوء على الخيارات المختلفة التي لا تزال تحصل على معلومات الموقع من التغريدات.نحن نقدم إحصاءات الاستخدام بما في ذلك التغييرات مع مرور الوقت، وتحليل ما إن إزالة الإحداثيات الدقيقة يعني لمختلف مهام البحث الشائعة التي يتم تنفيذها مع بيانات Twitter.أخيرا، نقدم اقتراحات للأبحاث المستقبلية التي تتطلب التغريدات الجغرافية.
جذبت الكشف عن المشاعر من وظائف وسائل التواصل الاجتماعي اهتماما ملحوظا من مجتمع معالجة اللغة الطبيعية (NLP) في السنوات الأخيرة.تختلف طرق الحصول على ملصقات ذهبية لتدريب واختبار أنظمة الكشف عن المشاعر التلقائية بشكل كبير من دراسة واحدة إلى أخرى، وتشكل م سألة موثوقية الملصقات الذهبية وتحصل على نتائج التصنيف.تستكشف هذه الدراسة بشكل منهجي عدة طرق للحصول على ملصقات ذهبية لنموذج EKMAN الخاص ببيانات Twitter وتأثير الاستراتيجية المختارة في نتائج التصنيف اليدوي.
توفر منصات الوسائط الاجتماعية (SM) مثل Twitter كميات كبيرة من البيانات في الوقت الفعلي والتي يمكن الاستفادة منها أثناء حالات الطوارئ الجماعية. تتطلب تطوير أدوات لدعم المجتمعات المتأثرة بالأزمات مجموعات البيانات المتاحة، والتي غالبا ما تكون موجودة لغا ت الموارد المنخفضة. تقدم هذه الورقة Kawarith A Corpus عربي لهي تيتر من أجل أحداث الأزمات، تضم أكثر من مليون تغريدات عربية تم جمعها خلال 22 أزمات حدثت بين عامي 2018 و 2020 وشمل عدة أنواع من الخطر. كشف استكشاف هذا المحتوى عن أهم المواضيع وأنواع المعلومات، وتقدم الورقة مجموعة بيانات معدنية من سبعة أحداث طارئة تعمل كمعيار ذهبي للعديد من المهام في أبحاث المعلوماتية للأزمات. استخدام البيانات المشروحة من نفس الحدث، يكون نموذج BERT يتم ضبطه جيدا لتصنيف تغريدات إلى فئات مختلفة في الإعداد متعدد الملصقات. تظهر النتائج أن النماذج القائمة على بيرت تسفر عن أداء جيد في هذه المهمة حتى مع كميات صغيرة من بيانات التدريب الخاصة بمهام المهام.
أدت مرونة عملية الاستدلال في السيارات الآلية التلقائية (VAES) مؤخرا إلى مراجعة نماذج الموضوعات الاحتمالية التقليدية مما يؤدي إلى نماذج موضوع عصبي (NTM). على الرغم من أن هذه الأساليب حققت نتائج مهمة، فقد تم فعل القليل من العمل بشكل مدهش حول كيفية تفكي ك المواضيع الكامنة. قد يؤدي نماذج الموضوعات الموجودة عند تطبيقها إلى المراجعات إلى استخراج الموضوعات المرتبطة بآراء الكتاب الذاتية المختلطة مع تلك المتعلقة بأوصاف واقعية مثل ملخصات المؤامرة في مراجعات الأفلام والحجز. وبالتالي، من المستحسن فصل مواضيع الرأي تلقائيا من المؤامرة / تلك المحايدة مما يتيح إمكانية الترجمة الترجمة الترجمة في هذه الورقة، نقترح نموذج موضوع عصبي جنبا إلى جنب مع التدريب الخصم لتخفيف موضوعات الرأي من المؤامرة والمحايدين. نقوم بإجراء تقييم تجريبي شامل يقدم مجموعة جديدة من مراجعات الأفلام والحجز المقترفة بأقطارها، وهي بيانات موبو، التي تظهر تماسك محسنة ومجموعة متنوعة من الموضوعات، وهو معدل تحسس متسق، وأداء تصنيف المعنويات متفوقة على نماذج موضوع أخرى تحت إشراف.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا