ترغب بنشر مسار تعليمي؟ اضغط هنا

كوربوس لتصنيف المعنويات الأبعاد على خدمة تدفق يوتيوب

A Corpus for Dimensional Sentiment Classification on YouTube Streaming Service

611   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توفر منصة خدمة البث مثل YouTube وظيفة مناقشة للجماهير في جميع أنحاء العالم لمشاركة التعليقات. YouTubers الذين يقومون بتحميل مقاطع الفيديو على منصة YouTube ترغب في تتبع أداء مقاطع الفيديو التي تم تحميلها. ومع ذلك، فإن مهام التحليل الحالية من YouTube توفر فقط بعض مؤشرات الأداء مثل متوسط ​​مدة العرض، سجل التصفح، والتباين في التركيبة السكانية للجمهور، وما إلى ذلك، ونقص تحليل المعنويات بشأن تعليقات الجمهور. لذلك، تقترح الورقة مؤشرات المعنويات متعددة الأبعاد مثل تفضيلات YouTuber وتفضيلات الفيديو ومستوى الإثارة لالتقاط مشاعر شاملة بشأن تعليقات الجمهور لمقاطع الفيديو ويوتيوغتر. لتقييم أداء الطبقات المختلفة، نقوم بتجربة معصوص قائما على التعلم والتعلم ومقرها في التعلم، ويكتشف تلقائيا ثلاثة مؤشرات معنويات لتصريحات الجمهور. تشير النتائج التجريبية إلى أن المصنف المستند إلى BERT يعد نموذج تصنيف أفضل من الطبقات الأخرى وفقا لنتيجة F1، ومؤشر المعنويات على مستوى الإثارة هو تحسن تماما. لذلك، يمكن حل مهام الكشف عن المعنويات المتعددة على منصة خدمة تدفق الفيديو من خلال مؤشرات المعنويات متعددة الأبعاد المقترحة مصحوبة مع مصنف Bert للحصول على أفضل نتيجة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يهدف تصنيف المعنويات على مستوى الجانب (ALSC) إلى تحديد قطبية المعنويات من جانب محدد في جملة. ESSC عبارة عن إعداد عملي في تحليل المعنويات المستندة إلى جانب الجسيم بسبب عدم وجود مصطلح الرأي اللازم، لكنه فشل في تفسير سبب اشتقاق قطبية المعنويات للجانب. ل معالجة هذه المشكلة، تعمل الأعمال الحديثة من تشفير المحولات التي تم تدريبها مسبقا على ELSC لاستخراج شجرة التبعية التي تركز على جانب جانب الجوانب التي يمكن أن تحدد كلمات الرأي. ومع ذلك، فإن كلمات الرأي المستحثة توفر فقط جديلة بديهية أقل بكثير من الترجمة الترجمة الشاملة على مستوى الإنسان. بالإضافة إلى ذلك، يميل التشفير المدرب مسبقا إلى استيعاب المشاعر الجوهرية في الجانب، مما تسبب في تحيز المعنويات وبالتالي يؤثر على أداء النموذج. في هذه الورقة، نقترح إطارا لتعليم تمثيل جانبي لمكافحة التحيز. يزيل أولا تحيز المعنويات في الجانب التضمين من خلال التعلم الخصم ضد المعنويات السابقة للجوانب. بعد ذلك، تقوم بمحاطة مرشحي الرأي المقطرين بالجانب من خلال نمذجة التبعية المستندة إلى SPAN لتسليط الضوء على شروط الرأي القابلة للتفسير. إن طريقتنا تحقق أداء جديد لحساب الفن في خمسة معايير، مع إمكانية استخراج الرأي غير المزعوم.
تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.
حقق نهج تكبير البيانات والضيقات الخصم مؤخرا نتائج واعدة في حل المشكلة المفرطة في العديد من مهام معالجة اللغة الطبيعية (NLP) بما في ذلك تصنيف المعنويات. ومع ذلك، فإن الدراسات الحالية التي تهدف إلى تحسين قدرة التعميم من خلال زيادة البيانات التدريبية مع أمثلة مرادفة أو إضافة ضوضاء عشوائية إلى Adgeddings Word، والتي لا يمكنها معالجة مشكلة الرابطة الزائفة. في هذا العمل، نقترح إطارا لتعزيز التعزيز نهاية إلى نهاية، والذي ينفذ بشكل مشترك توليد بيانات مضادة وتصنيف المعنويات المزدوجة. نهجنا لديه ثلاث خصائص: 1) يولد المولد تلقائيا جمل هائلة ومتنوعة؛ 2) يحتوي التمييز على مؤشر للمشاعر الجانبية الأصلية ومؤشر المعنويات الجانبية الناضجة، والذي يقوم بتقييم جودة العينة الناتجة بشكل مشترك ومساعدة المولد على توليد عينات مجفوف عالية الجودة أعلى جودة؛ 3) يتم استخدام التمييز مباشرة كقسم المعنويات النهائية دون الحاجة إلى بناء واحد إضافي. تظهر تجارب واسعة أن نهجنا يتفوق على خطوط خطوط خطوط تكبير البيانات قوية على العديد من مجموعات بيانات تصنيف المعفاة القياسية. يؤكد إجراء مزيد من التحليل بمزايا نهجنا في توليد عينات تدريب أكثر تنوعا وحل مشكلة الرابطة الزائفة في تصنيف المعنويات.
يعمل العمل الحديث على تصنيف المعنويات على مستوى جانب الجساب شبكات اتصالا بيانيا (GCN) على أشجار التبعية لتعلم التفاعلات بين شروط الارتفاع وكلمات الرأي. في بعض الحالات، لا يمكن الوصول إلى كلمات الرأي المقابلة لمصطلح الجانب داخل القفزتين على أشجار التب عية، والتي تتطلب المزيد من طبقات GCN إلى النموذج. ومع ذلك، غالبا ما تحقق GCNS أفضل أداء بطبقتين، ولا تحقق GCNs أعمق أي مكسب إضافي. لذلك، نقوم بتصميم نماذج GCN الانتباه الانتقائية الجديدة. من ناحية، يتيح النموذج المقترح التفاعل المباشر بين شروط الجانب وكلمات السياق عن طريق عملية الانتباه الذاتي دون تحديد المسافة على أشجار التبعية. من ناحية أخرى، تم تصميم إجراء اختيار Top-K لتحديد كلمات الرأي عن طريق تحديد كلمات سياق K مع أعلى درجات الاهتمام. نقوم بإجراء تجارب على عدة مجموعات بيانات معيار شائعة الاستخدام وتظهرت النتائج أن SA-GL-GCN المقترح تفوق نماذج أساسية قوية.
أظهر العمل الأخير على تصنيف المعنويات على مستوى جانب جانب الجسبي فعالية دمج الهياكل النحوية مثل أشجار الاعتمادية مع شبكات عصبية رسم بيانية (GNN)، ولكن هذه الأساليب عادة ما تكون عرضة للخطأ في التحليل. لتحسين الاستفادة من المعلومات الأساسية في مواجهة ا لأخطاء التي لا مفر منها، نقترح تقنية رسم بياني بسيطة ولكنها فعالة، Grapmerge، للاستفادة من التنبؤات من المحللين المختلفين. بدلا من تعيين مجموعة واحدة من المعلمات النموذجية إلى كل شجرة التبعية، نقدم أولا علاقات التبعية من يوزعات مختلفة قبل تطبيق GNNS على الرسم البياني الناتج. يسمح هذا نماذج GNN قوية بتحليل الأخطاء دون أي تكلفة حسابية إضافية، ويساعد على تجنب التغلب على التغلب والتجول من تكديس طبقة GNN عن طريق إدخال المزيد من التوصيلية في الرسم البياني للفرقة. تظهر تجاربنا في مهمة Semeval 2014 Task 4 و ACL 14 Twitter أن نموذج Graphmerge الخاص بنا ليس فقط تفوق النماذج مع شجرة الاعتماد الفردي، ولكن أيضا يدق نماذج فرقة أخرى دون إضافة معلمات النموذج.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا