بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

تحليل المشاعر في اللغة العربية على مستوى الجملة

Sentence-Level Arabic Sentiment Analysis

2702 3 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل الجامعة الأميركية في القاهرة ورقة بحثية

تاريخ النشر 2012

مجال البحث الهندسة المعلوماتية

والبحث باللغة العربية

تأليف أميرة شكري( باحث )

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

البحوث العلمية حول تحليل المشاعر في اللغة العربية محدودة جدا في الوقت الحالي. بينما يوجد العديد من تطبيقات تحليل المشاعر في اللغة الانكليزية, اللغة العربية مازالت تخطو خطى بطيئة في هذا المجال. في هذا البحث، نقوم بعرض تطبيق حول تحليل المشاعر في اللغة العربية عبر تطبيق مصنف مشاعر لتغريدات عربية. التغريدات تم تحليلها لكي نحصل على قطبية مشاعر (ايجابية او سلبية)، بما أن البيانات تم جمعها من شبكة التواصل الاجتماعي تويتر, فهذا يعكس أهميتها الكبيرة في الشرق الأوسط، حيث اللغة العربية هي اللغة المحكية.

مراجعة الذكاء الصنعي:

قُم بترقية الحساب لمشاهدة المحتوى

ملخص البحث

تتناول هذه الورقة البحثية تحليل المشاعر في اللغة العربية على مستوى الجملة، مع التركيز على التغريدات العربية على تويتر. يهدف البحث إلى تصنيف التغريدات إلى مشاعر إيجابية أو سلبية باستخدام تقنيات التعلم الآلي، وتحديدًا مصنفات Naive Bayes وSupport Vector Machines. تم جمع 1000 تغريدة (500 إيجابية و500 سلبية) لتدريب المصنفات. تتناول الورقة أيضًا التحديات المرتبطة بتحليل المشاعر في اللغة العربية، مثل قلة الأدوات المتاحة وتعقيد اللغة من حيث البنية والصرف. تم استخدام برنامج Weka Suite لإجراء عمليات التصنيف، وأظهرت النتائج أن مصنف SVM يتفوق على مصنف NB في دقة التصنيف. تناقش الورقة أيضًا تأثير إزالة الكلمات التوقفية على دقة التصنيف وتوصي بمزيد من العمل لتطوير قائمة موثوقة من الكلمات التوقفية لتحسين الأداء.

قراءة نقدية

دراسة نقدية: تقدم هذه الورقة مساهمة قيمة في مجال تحليل المشاعر في اللغة العربية، وهو مجال لا يزال في مراحله الأولى مقارنة باللغات الأخرى مثل الإنجليزية. ومع ذلك، هناك بعض النقاط التي يمكن تحسينها. أولاً، حجم العينة المستخدمة في التدريب (1000 تغريدة) قد يكون غير كافٍ للحصول على نتائج دقيقة وقابلة للتعميم. ثانيًا، لم يتم تناول تأثير اللهجات المختلفة في اللغة العربية بشكل كافٍ، حيث أن اللهجات قد تؤثر بشكل كبير على دقة التصنيف. ثالثًا، كان من المفيد تضمين مقارنة مع تقنيات أخرى غير التعلم الآلي، مثل التحليل الدلالي، لتقديم صورة أكثر شمولية. وأخيرًا، كان من الممكن تحسين الورقة بإضافة مزيد من التفاصيل حول كيفية اختيار وتطوير قائمة الكلمات التوقفية المستخدمة.

أسئلة حول البحث

ما هو الهدف الرئيسي من هذه الورقة البحثية؟

الهدف الرئيسي هو تصنيف التغريدات العربية على تويتر إلى مشاعر إيجابية أو سلبية باستخدام تقنيات التعلم الآلي.
ما هي المصنفات المستخدمة في هذه الدراسة؟

تم استخدام مصنفات Naive Bayes وSupport Vector Machines.
ما هي التحديات الرئيسية التي تواجه تحليل المشاعر في اللغة العربية؟

التحديات تشمل قلة الأدوات المتاحة وتعقيد اللغة من حيث البنية والصرف.
ما هي النتائج الرئيسية التي توصلت إليها الدراسة؟

أظهرت النتائج أن مصنف SVM يتفوق على مصنف NB في دقة التصنيف.

كلمات مفتاحية

تحليل المشاعر التغريدات العربية التعلم الآلي Naive Bayes Support Vector Machines الكلمات التوقفية

المراجع المستخدمة

K. Yessenov, and S. Misailovic, “Sentiment Analysis of Movie Review Comments”, Graduation project. 17th, May, 2009

A. Abbasi, H. Chen, and A. Salem, “Sentiment analysis in multiple languages: Feature selection for opinion classification in web forums” ACM Transactions on Information Systems (TOIS), Vol 26, Issue 3, June 2008

قيم البحث

761 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تجزئة خطاب وقطع الخطاب على مستوى الجملة تلعب أدوارا مهمة لمختلف مهام NLP للنظر في التماسك النصي.على الرغم من الإنجازات الأخيرة في كلا المهام، لا يزال هناك مجال للتحسين بسبب ندرة البيانات المسمى.لحل المشكلة، نقترح مصنف إنتاج نموذجي في اللغة (LMGC) لاس تخدام مزيد من المعلومات من الملصقات عن طريق معالجة الملصقات كمدخلات أثناء تعزيز تمثيلات التسمية من خلال تضمين أوصاف لكل ملصق.علاوة على ذلك، نظرا لأن هذا يتيح LMGC من إعداد تمثيلات الملصقات، غير المرئي في خطوة ما قبل التدريب، يمكننا استخدام نموذج لغة مدرب مسبقا في LMGC.تظهر النتائج التجريبية على DTSET RST-DT أن LMGC حققت النتيجة F1 من أصل 96.72 في تجزئة الخطاب.وقد حقق المزيد من درجات الولاية F1 عشرات من 84.69 مع حدود الذهب EDU و 81.18 مع حدود مجزأة تلقائيا، على التوالي، في تحليل خطاب على مستوى الجملة.

sentence-level discourse parsing model-based generative classifier language model-based generative تحليل خطاب مستوى الجملة مصنف المولد النموذجي لغة اللغة القائمة على نموذج صناعة حمض الفوسفور المزيد..

المورفولوجيا المحددة جيدا هو التورفولوجيا على مستوى الجملة

762 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

اكتسبت المهام المورفولوجية شعبية لائقة داخل مجتمع NLP في السنوات الأخيرة، حيث توفر مجموعات بيانات كبيرة متعددة اللغات تحليلا مورفولوجي للكلمات، إما في أو خارج السياق. ومع ذلك، فإن الافتقار إلى تعريف لغوي واضح للكلمات ديطات العمل التلقيح غير مكتمل واج ب في التناقضات، لا سيما عبر اللغوية. في هذا العمل، نقوم بتوسيع الانعكاسات المورفولوجية للكلمات لإنقاذ الجمل لتوفير عالمية حقيقية منفصلة عن تقاليد هربيا لاستخدام المساحة البيضاء. للسماح بإلقاء التوضيح عن انعطاف الجملة، نحدد مخططا شرحا مورفولوجي بواسطة مجموعة ثابتة من ميزات الانهيار. نقدم مجموعة بيانات صغيرة عبر اللغوية بما في ذلك جمل بسيطة نصف تم إنشاؤها بشكل دائم في 4 لغات متنوعة من الناحية النموذجية المشروح وفقا لمخططنا المقترح، وإظهار أن مهمة إعادة انتقالة يصعب بشكل كبير ولكن تغيير النطاق من الكلمات إلى محددة بشكل جيد الجمل تسمح الواجهة مع نماذج اللغة السياقية.

sentence-level morphology morphology is sentence-level well-defined morphology التشكل على مستوى الجملة التشكل هو الجملة على مستوى مورفولوجيا محددة جيدا صناعة حمض الفوسفور المزيد..

السخرية والكشف عن المعنويات باللغة العربية: التحقيق في مصلحة الميزات على مستوى الشخصية

806 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم ثلاث طرق تم تطويرها للمهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية.نقدم خط الأساس الذي يستخدم ميزات شخصية N-Gram.نقترح أيضا طريقتين أكثر تطورا: شبكة عصبية متكررة مع تمثيل مستوى الكلمة وتصنيف الفرقة تعتمد على ميزات Word ومستوى ال أحرف.لقد اخترنا تقديم نتائج من مصنف الفرقة، لكن لم يكن ناجحا للغاية مقارنة بأفضل النظم: 22/37 بشأن اكتشاف السخرية و 15/22 على اكتشاف المعنويات.لقد بدا أخيرا أن خط الأساس لدينا قد تم تحسينه وتغلب على تلك النتائج.

كلمة satic word embeddings. detection in arabic investigating the interest الكشف باللغة العربية التحقيق في الفائدة صناعة حمض الفوسفور

استكشاف مجتمع الجملة لاستخراج الأحداث على مستوى المستند

757 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

استخراج الأحداث على مستوى المستند أمر بالغ الأهمية لمختلف مهام معالجة اللغة الطبيعية لتوفير معلومات منظمة.النهج الحالية عن طريق النمذجة المتسلسلة إهمال الهياكل المنطقية المعقدة للنصوص الطويلة.في هذه الورقة، نستفيد بين تفاعلات الكيان وتفاعلات الجملة خ لال المستندات الطويلة وتحويل كل وثيقة إلى رسم بياني غير مرمى غير مسبهب من خلال استغلال العلاقة بين الجمل.نقدم مجتمع الجملة لتمثيل كل حدث كشركة فرعية.علاوة على ذلك.توضح التجارب أن إطارنا يحقق نتائج تنافسية على الأساليب الحديثة على مجموعة بيانات استخراج الأحداث على مستوى الوثيقة على نطاق واسع.

الرسم البياني تعلم exploring sentence community استكشاف مجتمع الجملة صناعة حمض الفوسفور

تسيطر الجملة العصبية على مستوى إعادة تصنيع المواد الأخبار

793 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إن تأطير مقالة إخبارية تعني تصوير الحدث المبلغ عنها من منظور محدد، على سبيل المثال، من منظور اقتصادي أو صحي. Reframing وسائل لتغيير هذا المنظور. اعتمادا على الجمهور أو الحضور، يمكن أن تصادف REFRIMING ضرورية لتحقيق التأثير المرغوب على القراء. يرتبط Re framing بتكييف الأسلوب والشاعر، والتي يمكن معالجة تقنيات توليد النص العصبي. ومع ذلك، فإن الأمر أكثر تحديا لأن تغيير الإطار يتطلب إعادة كتابة الجمل بأكملها بدلا من عبارات واحدة. في هذه الورقة، ندرس كيفية إعادة صياغة الجمل في مقالات إخبارية مع الحفاظ على تماسكها إلى السياق. نتعامل مع REMREMING كمركز ملء على مستوى الجملة الذي نربط النماذج العصبية على كوربوس موجود للإطار الوسائط. لتوجيه التدريب، نقترح ثلاث استراتيجيات: محاكمة اللغة المؤطرة، والحفاظ على الكيانات المسماة، والتعلم الخصم. نقوم بتقييم النماذج المعنية تلقائيا وتدويا من أجل اتساق الموضوع والتماسك والتعداد الناجح. تشير نتائجنا إلى أن إنشاء نص مؤطر بشكل صحيح يعمل بشكل جيد ولكن مع المفاضلات.

controlled neural sentence-level reframing controlled neural السمة العصبية التي تسيطر عليها المستوى Reframing. الخيانة العصبية صناعة حمض الفوسفور المزيد..

الأسئلة المقترحة

ماذا يعني التنقيب عن البيانات؟

2362 - 0 - - تم طرحه بمساحة (الهندسة المعلوماتية)

التنقيب عن البيانات Data Mining التنقيب عن البيانات

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة تشرين

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

تحليل المشاعر في اللغة العربية على مستوى الجملة

Sentence-Level Arabic Sentiment Analysis

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة