ترغب بنشر مسار تعليمي؟ اضغط هنا

حقق نهج تكبير البيانات والضيقات الخصم مؤخرا نتائج واعدة في حل المشكلة المفرطة في العديد من مهام معالجة اللغة الطبيعية (NLP) بما في ذلك تصنيف المعنويات. ومع ذلك، فإن الدراسات الحالية التي تهدف إلى تحسين قدرة التعميم من خلال زيادة البيانات التدريبية مع أمثلة مرادفة أو إضافة ضوضاء عشوائية إلى Adgeddings Word، والتي لا يمكنها معالجة مشكلة الرابطة الزائفة. في هذا العمل، نقترح إطارا لتعزيز التعزيز نهاية إلى نهاية، والذي ينفذ بشكل مشترك توليد بيانات مضادة وتصنيف المعنويات المزدوجة. نهجنا لديه ثلاث خصائص: 1) يولد المولد تلقائيا جمل هائلة ومتنوعة؛ 2) يحتوي التمييز على مؤشر للمشاعر الجانبية الأصلية ومؤشر المعنويات الجانبية الناضجة، والذي يقوم بتقييم جودة العينة الناتجة بشكل مشترك ومساعدة المولد على توليد عينات مجفوف عالية الجودة أعلى جودة؛ 3) يتم استخدام التمييز مباشرة كقسم المعنويات النهائية دون الحاجة إلى بناء واحد إضافي. تظهر تجارب واسعة أن نهجنا يتفوق على خطوط خطوط خطوط تكبير البيانات قوية على العديد من مجموعات بيانات تصنيف المعفاة القياسية. يؤكد إجراء مزيد من التحليل بمزايا نهجنا في توليد عينات تدريب أكثر تنوعا وحل مشكلة الرابطة الزائفة في تصنيف المعنويات.
توفر منصة خدمة البث مثل YouTube وظيفة مناقشة للجماهير في جميع أنحاء العالم لمشاركة التعليقات. YouTubers الذين يقومون بتحميل مقاطع الفيديو على منصة YouTube ترغب في تتبع أداء مقاطع الفيديو التي تم تحميلها. ومع ذلك، فإن مهام التحليل الحالية من YouTube ت وفر فقط بعض مؤشرات الأداء مثل متوسط ​​مدة العرض، سجل التصفح، والتباين في التركيبة السكانية للجمهور، وما إلى ذلك، ونقص تحليل المعنويات بشأن تعليقات الجمهور. لذلك، تقترح الورقة مؤشرات المعنويات متعددة الأبعاد مثل تفضيلات YouTuber وتفضيلات الفيديو ومستوى الإثارة لالتقاط مشاعر شاملة بشأن تعليقات الجمهور لمقاطع الفيديو ويوتيوغتر. لتقييم أداء الطبقات المختلفة، نقوم بتجربة معصوص قائما على التعلم والتعلم ومقرها في التعلم، ويكتشف تلقائيا ثلاثة مؤشرات معنويات لتصريحات الجمهور. تشير النتائج التجريبية إلى أن المصنف المستند إلى BERT يعد نموذج تصنيف أفضل من الطبقات الأخرى وفقا لنتيجة F1، ومؤشر المعنويات على مستوى الإثارة هو تحسن تماما. لذلك، يمكن حل مهام الكشف عن المعنويات المتعددة على منصة خدمة تدفق الفيديو من خلال مؤشرات المعنويات متعددة الأبعاد المقترحة مصحوبة مع مصنف Bert للحصول على أفضل نتيجة.
تدرس هذه الورقة التعلم المستمر (CL) بتسلسل مهام تصنيف معنويات الجانب (ASC).على الرغم من اقتراح بعض تقنيات CL لتصنيف معنويات المستندات، إلا أننا لسنا على علم بأي عمل CL على ASC.يجب أن يتعلم نظام CL الذي يتعلم تدريجيا سلسلة من مهام ASC المشكلتين التالي ين: (1) نقل المعرفة المستفادة من المهام السابقة إلى المهمة الجديدة للمساعدة في تعلم نموذج أفضل، و (2) الحفاظ على أداء النماذجالمهام السابقة بحيث لا تنسى.تقترح هذه الورقة نموذجا قائم على شبكة كبسولة رواية يسمى B-CL لمعالجة هذه المشكلات.ب-CL يحسن بشكل ملحوظ أداء ASC على كل من المهمة الجديدة والمهام القديمة عبر نقل المعرفة للأمام والخلف.يتم إثبات فعالية B-CL من خلال تجارب واسعة.
يعمل العمل الحديث على تصنيف المعنويات على مستوى جانب الجساب شبكات اتصالا بيانيا (GCN) على أشجار التبعية لتعلم التفاعلات بين شروط الارتفاع وكلمات الرأي. في بعض الحالات، لا يمكن الوصول إلى كلمات الرأي المقابلة لمصطلح الجانب داخل القفزتين على أشجار التب عية، والتي تتطلب المزيد من طبقات GCN إلى النموذج. ومع ذلك، غالبا ما تحقق GCNS أفضل أداء بطبقتين، ولا تحقق GCNs أعمق أي مكسب إضافي. لذلك، نقوم بتصميم نماذج GCN الانتباه الانتقائية الجديدة. من ناحية، يتيح النموذج المقترح التفاعل المباشر بين شروط الجانب وكلمات السياق عن طريق عملية الانتباه الذاتي دون تحديد المسافة على أشجار التبعية. من ناحية أخرى، تم تصميم إجراء اختيار Top-K لتحديد كلمات الرأي عن طريق تحديد كلمات سياق K مع أعلى درجات الاهتمام. نقوم بإجراء تجارب على عدة مجموعات بيانات معيار شائعة الاستخدام وتظهرت النتائج أن SA-GL-GCN المقترح تفوق نماذج أساسية قوية.
قمنا بإحضار البيانات من صفحات مواقع التواصل الاجتماعي تويتر، ثم عملنا عليها عملية تنظيف و تجهيز للنص من أجل عملية التصنيف فالنصوص المسترجعة تحتوي على الكثير من الضجيج و المعلومات غير المفيدة المتعلقة بعملية تحليل الآراء مثل الاعلانات و الروابط و ع ناوين البريد الالكتروني و وجود العديد من الكلمات التي لا تؤثر على التوجه العام للنص، و بعد الحصول على كل المنشورات في صفحة الفيسبوك و ما هي التعليقات الخاصة حول كل المنشور المراد معرفة النسبة المئوية للآراء الإيجابية و الآراء السلبية له. طبّقنا خوارزمية بايز في التصنيف و أجرينا عليها التدريب المناسب و بعد تمرير بيانات التغريدات (الآراء) حصلنا على نتائج جيدة حول نسبة المؤيدين للمنشور و نسبة المعارضين له.
البحوث العلمية حول تحليل المشاعر في اللغة العربية محدودة جدا في الوقت الحالي. بينما يوجد العديد من تطبيقات تحليل المشاعر في اللغة الانكليزية, اللغة العربية مازالت تخطو خطى بطيئة في هذا المجال. في هذا البحث، نقوم بعرض تطبيق حول تحليل المشاعر في اللغ ة العربية عبر تطبيق مصنف مشاعر لتغريدات عربية. التغريدات تم تحليلها لكي نحصل على قطبية مشاعر (ايجابية او سلبية)، بما أن البيانات تم جمعها من شبكة التواصل الاجتماعي تويتر, فهذا يعكس أهميتها الكبيرة في الشرق الأوسط، حيث اللغة العربية هي اللغة المحكية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا