ترغب بنشر مسار تعليمي؟ اضغط هنا

لي، أنا، وأنا IRE: آثار جودة النسخ التلقائي على العاطفة والسخرية والكشف عن الشخصية

Me, myself, and ire: Effects of automatic transcription quality on emotion, sarcasm, and personality detection

273   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في النشر، يجب أن تستخدم النظم التي تستخدم الكلام كمدخلات من النسخ الآلي.ومع ذلك، عادة عندما يتم تقييم هذه الأنظمة، يفترض أن نسخ الذهب.نحن ندرس صراحة تأثير أخطاء النسخ على الأداء المصاب لنظام متعدد الوسائط على ثلاثة مهام ذات صلة من ثلاث مجموعات بيانات: المشاعر والتهكية والكشف عن الشخصية.نضم ثلاثة أدوات نسخ منفصلة وإظهار أنه في حين أن جميع عمليات النسخ الآلية تنتشر أخطاء تؤثر بشكل كبير على أداء المصب، فإن أدوات المصدر المفتوح هي أسوأ من الأداة المدفوعة، على الرغم من أنها ليست دائما بشكل مباشر، ومعدلات خطأ Word لا ترتبط بشكل جيد مع أداء المصب.نجد كذلك أن إدراج ميزات الصوت يخفف جزئيا أخطاء النسخ، ولكن أن الاستخدام السذاجة لإعداد متعددة المهام لا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم ثلاث طرق تم تطويرها للمهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية.نقدم خط الأساس الذي يستخدم ميزات شخصية N-Gram.نقترح أيضا طريقتين أكثر تطورا: شبكة عصبية متكررة مع تمثيل مستوى الكلمة وتصنيف الفرقة تعتمد على ميزات Word ومستوى ال أحرف.لقد اخترنا تقديم نتائج من مصنف الفرقة، لكن لم يكن ناجحا للغاية مقارنة بأفضل النظم: 22/37 بشأن اكتشاف السخرية و 15/22 على اكتشاف المعنويات.لقد بدا أخيرا أن خط الأساس لدينا قد تم تحسينه وتغلب على تلك النتائج.
نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط ول VAD، ويمكن أن تصنف في وقت واحد فئات العاطفة وتتنبؤ بعشرات VAD للحصول على عقوبة معينة. نحن نستخدم Roberta-Large Roberta المدربة مسبقا على ثلاثة كوربورا مختلفة مع ملصقات واضحة وتقييم على Emobank Corpus مع درجات VAD. نظهر أن نهجنا يصل إلى أداء قابلا للمقارنة مع وجود أحدث من المصنفات في تصنيف العاطفة الفئوية ويظهر ارتباطا إيجابيا كبيرا مع درجات فاد للحقيقة الأرضية. أيضا، يؤدي المزيد من التدريب مع الإشراف على تسميات VAD إلى تحسين الأداء خاصة عندما تكون مجموعة البيانات الصغيرة. نقدم أيضا أمثلة على تنبؤات كلمات العاطفة المناسبة التي ليست جزءا من التعليقات التوضيحية الأصلية.
خلال السنوات القليلة الماضية، يكون عدد مستخدمي الإنترنت العربي والمحتوى العربي عبر الإنترنت في النمو الأسي.تعتبر التعامل مع مجموعات البيانات العربية واستخدام الجمل غير الصريحة للتعبير عن الرأي هي التحديات الرئيسية في مجال معالجة اللغات الطبيعية.وبالت الي، اكتسبت السخرية وتحليل المعنويات اهتماما كبيرا من مجتمع البحث، وخاصة في هذه اللغة.يمكن تطبيق الكشف التلقائي للاستخراج وتحليل المعنويات باستخدام ثلاث نهج، وهي نهج إشراف على الإشراف وغير الخاضع للإشراف والجاذبية.في هذه الورقة، تم استخدام نموذج يعتمد على خوارزمية لتعلم الآلة الإشراف يسمى آلة ناقلات الدعم (SVM) بهذه العملية.تم تقييم النموذج المقترح باستخدام DataSet Arsarcasm-V2.تمت مقارنة أداء النموذج المقترح مع النماذج الأخرى المقدمة إلى تحليل المعنويات والكشف عن السخرية المهمة المشتركة.
توضح نظريات التقييم كيف يؤدي التقييم المعرفي للحدث إلى عاطفة معينة. على النقيض من نظريات المشاعر الأساسية أو التأثير (التكافؤ / الإثارة)، لم تتلق هذه النظرية الكثير من الاهتمام في معالجة اللغة الطبيعية. ومع ذلك، في علم النفس، ثبت أن سميث وإلسنثورث (1 985) أظهر أن أبعاد التقييم الاهتمام، اليقين، الجهد المتوقع، والمسؤولية، والمسؤولية السيطرة والتحكم الظرفي تميز بين (على الأقل) 15 فصول العاطفة. ندرس استراتيجيات توضيحية مختلفة لهذه الأبعاد، استنادا إلى كوربوس الفنية التي تركز على الأحداث (Troiano et al.، 2019). نقوم بتحليل اثنين من إعدادات التوضيحية اليدوية: (1) إظهار النص للتعليق أثناء إخفاء ملصق العاطفة ذوي الخبرة؛ (2) الكشف عن العاطفة المرتبطة بالنص. يتيح الإعداد 2 أن يقوم المعلقون بتطوير حدس أكثر واقعية لهذا الحدث الموصوفين، في حين أن الإعداد 1 هو إجراء شروح مزيد من التعريفي، والاعتماد بحت على النص. نقوم بتقييم هذه الاستراتيجيات بطريقتين: من خلال قياس اتفاقية Insine-Annotator وضبط روبرتا للتنبؤ بمتغيرات التقييم. تظهر نتائجنا أن معرفة العاطفة تزيد من موثوقية المعلقين. علاوة على ذلك، نقوم بتقييم استراتيجية وضع العلامات المستندة إلى القواعد التلقائية بحتة (تقييم الاستنتاج من فصول العاطفة المشروحة). يؤدي التدريب على الملصقات المعينة تلقائيا إلى أداء تنافسي من المصنف لدينا، حتى عند اختباره في التوضيحية اليدوية. هذا مؤشر أنه قد يكون من الممكن إنشاء Corpa Corpora تلقائيا لكل مجال موجودا للعاطفة الموجودة بالفعل.
تم إدخال نماذج اللغة القائمة على المحولات خطوة ثورية لأبحاث معالجة اللغة الطبيعية (NLP). أدت هذه النماذج، مثل Bert، GPT و Electra، إلى أداء أحدث في العديد من مهام NLP. تم تطوير معظم هذه النماذج في البداية للغة الإنجليزية ولغات أخرى تبعها لاحقا. في ال آونة الأخيرة، بدأت عدة نماذج عربية خاصة الناشئة. ومع ذلك، هناك مقارنات محدودة مباشرة بين هذه النماذج. في هذه الورقة، نقيم أداء 24 من هذه النماذج على المعنويات العربية والكشف عن السخرية. تظهر نتائجنا أن النماذج التي تحققت أفضل أداء هي تلك التي يتم تدريبها على البيانات العربية فقط، بما في ذلك اللغة العربية ذاتي، واستخدام عدد أكبر من المعلمات، مثل Marbert صدر مؤخرا. ومع ذلك، لاحظنا أن ARAELECTRA هي واحدة من أفضل النماذج الأدائية بينما تكون أكثر كفاءة في تكلفتها الحسابية. أخيرا، أظهرت التجارب على المتغيرات Aragpt2 أداء منخفضة مقارنة بنماذج Bert، مما يشير إلى أنه قد لا يكون مناسبا لمهام التصنيف.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا