في النشر، يجب أن تستخدم النظم التي تستخدم الكلام كمدخلات من النسخ الآلي.ومع ذلك، عادة عندما يتم تقييم هذه الأنظمة، يفترض أن نسخ الذهب.نحن ندرس صراحة تأثير أخطاء النسخ على الأداء المصاب لنظام متعدد الوسائط على ثلاثة مهام ذات صلة من ثلاث مجموعات بيانات: المشاعر والتهكية والكشف عن الشخصية.نضم ثلاثة أدوات نسخ منفصلة وإظهار أنه في حين أن جميع عمليات النسخ الآلية تنتشر أخطاء تؤثر بشكل كبير على أداء المصب، فإن أدوات المصدر المفتوح هي أسوأ من الأداة المدفوعة، على الرغم من أنها ليست دائما بشكل مباشر، ومعدلات خطأ Word لا ترتبط بشكل جيد مع أداء المصب.نجد كذلك أن إدراج ميزات الصوت يخفف جزئيا أخطاء النسخ، ولكن أن الاستخدام السذاجة لإعداد متعددة المهام لا.
In deployment, systems that use speech as input must make use of automated transcriptions. Yet, typically when these systems are evaluated, gold transcriptions are assumed. We explicitly examine the impact of transcription errors on the downstream performance of a multi-modal system on three related tasks from three datasets: emotion, sarcasm, and personality detection. We include three separate transcription tools and show that while all automated transcriptions propagate errors that substantially impact downstream performance, the open-source tools fair worse than the paid tool, though not always straightforwardly, and word error rates do not correlate well with downstream performance. We further find that the inclusion of audio features partially mitigates transcription errors, but that a naive usage of a multi-task setup does not.
المراجع المستخدمة
https://aclanthology.org/
نقدم ثلاث طرق تم تطويرها للمهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية.نقدم خط الأساس الذي يستخدم ميزات شخصية N-Gram.نقترح أيضا طريقتين أكثر تطورا: شبكة عصبية متكررة مع تمثيل مستوى الكلمة وتصنيف الفرقة تعتمد على ميزات Word ومستوى ال
نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط
خلال السنوات القليلة الماضية، يكون عدد مستخدمي الإنترنت العربي والمحتوى العربي عبر الإنترنت في النمو الأسي.تعتبر التعامل مع مجموعات البيانات العربية واستخدام الجمل غير الصريحة للتعبير عن الرأي هي التحديات الرئيسية في مجال معالجة اللغات الطبيعية.وبالت
توضح نظريات التقييم كيف يؤدي التقييم المعرفي للحدث إلى عاطفة معينة. على النقيض من نظريات المشاعر الأساسية أو التأثير (التكافؤ / الإثارة)، لم تتلق هذه النظرية الكثير من الاهتمام في معالجة اللغة الطبيعية. ومع ذلك، في علم النفس، ثبت أن سميث وإلسنثورث (1
تم إدخال نماذج اللغة القائمة على المحولات خطوة ثورية لأبحاث معالجة اللغة الطبيعية (NLP). أدت هذه النماذج، مثل Bert، GPT و Electra، إلى أداء أحدث في العديد من مهام NLP. تم تطوير معظم هذه النماذج في البداية للغة الإنجليزية ولغات أخرى تبعها لاحقا. في ال