ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتشاف السخرية المتصورة والمقصودة مع شبكات انتباه الرسوم البيانية

Perceived and Intended Sarcasm Detection with Graph Attention Networks

95   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تركز أنظمة الكشف عن الساركاز الموجودة على استغلال العلامات اللغوية أو السياق أو البثور على مستوى المستخدم. ومع ذلك، تشير الدراسات الاجتماعية إلى أن العلاقة بين المؤلف والجمهور يمكن أن تكون ذات صلة بنفس القدر لاستخدام السخرية وتفسيرها. في هذا العمل، نقترح إطارا بالاستفادة المشتركة (1) سياق مستخدم من تغريداتهم التاريخية مع (2) المعلومات الاجتماعية من حي المستخدم في رسم بياني تفاعل، إلى السياق تفسير المنشور. نحن نميز بين الهوية المتصورة والمبلغ عنها الذاتي. نستخدم شبكات انتباه الرسوم البيانية (GAT) عبر المستخدمين والتويت في مؤشر ترابط محادثة، جنبا إلى جنب مع العديد من تمثيلات سجل المستخدم كثيفة. بصرف النظر عن تحقيق نتائج حديثة على مجموعة البيانات التي تم نشرها مؤخرا من مستخدمي Twitter مؤخرا مع تغريدات ثلاثية العدد 30K، قم بإضافة تغريدات 10M Unabeled كسياق، تشير تجاربنا إلى أن شبكة الرسم البياني تساهم في تفسير النوايا الساخرة للمؤلف أكثر من للتنبؤ بتصور السخرية من قبل الآخرين.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تلقى الكشف عن اللغة الهجومية (القديم) اهتماما متزايدا بسبب تأثيرها المجتمعي.يوضح العمل الحديث أن الأساليب القائمة على المحولات ثنائية الاتجاه تحصل على أداء مثير للإعجاب في القديم.ومع ذلك، فإن هذه الأساليب تعتمد عادة على مجموعات البيانات القديمة ذات ا لمسمى على نطاق واسع لتدريب النماذج.لمعالجة مسألة ندرة البيانات / التسمية في القديم، في هذه الورقة، نقترح نهج بسيط في مجال تكيف مجال بسيط ولكنه فعال لتدريب المحولات ثنائية الاتجاه.تقدم نهجنا إجراءات التدريب على التكيف (DA) إلى ألبرت، بحيث يمكنها استغلال البيانات المساعدة الفعالة من مجالات المصدر لتحسين الأداء القديم في مجال مستهدف.تظهر النتائج التجريبية على مجموعات البيانات القياسية أن نهجنا، ألبرت (دا)، يحصل على الأداء الحديثة في معظم الحالات.على وجه الخصوص، فإن نهجنا يستفيد بشكل كبير من الدروس الممثلة بشكل كبير وغير مصنوع من الأداء، مع تحسن كبير على ألبرت.
تعاني الكشف عن الكلام والكشف عن الألفاظ النبأ من البيانات الخاصة بالبيانات، وخاصة لغات أخرى غير الإنجليزية، بسبب الطبيعة الذاتية للمهام وتوافق التعليق التوضيحي الناتج عن الشركة الحالية.في هذه الدراسة، نقوم بتحديد الفئات الفرعية الملتزمة في وظائف Word وتمثيلات الجملة واستكشاف قدرة تعميمها على مجموعة متنوعة من المهام المستهدفة المماثلة والبعيدة في إعداد صفرية.تم إجراء هذا أحادي (ألماني) ويعرضا على المهام (الإنجليزية) ذات الصلة (باللغة الإنجليزية) عن كثب (باللغة الفرنسية) وغير ذات الصلة (العربية).نلاحظ أنه، في كل من المهام المستهدفة المماثلة والبعيدة وعلى جميع اللغات، فإن التمثيلات الفرعية القائمة على الفضاء الفرعي نقل أكثر فعالية من تمثيلات بيرت القياسية في إعداد الطلقة الصفرية، مع تحسينات بين F1 +10.9 و F1 +42.9 على خطوط الأساس عبر الكلاختبرت السيناريوهات أحادية الألوان واللغة اللغوية.
نقدم HATEBERT، نموذج BERT الذي تم تدريبه على إعادة تدريب للكشف عن اللغة المسيئة باللغة الإنجليزية.تم تدريب النموذج على RAL-E، وهي مجموعة بيانات واسعة النطاق من تعليقات Reddit باللغة الإنجليزية من المجتمعات المحظورة لكونها مسيئة أو بغيضة حيث قمنا بإتا حتها للجمهور.نقدم نتائج مقارنة مفصلة بين نموذج اللغة المدرب مسبقا والنسخة المستقلة على ثلاث مجموعات بيانات باللغة الإنجليزية لمهام الهجومية والمسيئة ومهام الكشف عن الكلام.في جميع مجموعات البيانات، تتفوق HateBERT على نموذج بيرت العام.ونناقش أيضا مجموعة تجارب تقارن إمكانية نقل النماذج الصعبة في مجموعات البيانات، مما يشير إلى أن القدرة على التأثر بالتوافق مع الظواهر المشروحة.
تشكل الميمات البغيضة تحديا فريدا لأنظمة تعلم الآلات الحالية لأن رسالتهم مشتقة من كل من الطرائق النصية والمرئية.لهذا الغرض، أصدر Facebook تحدي الميمات البغيض، مجموعة بيانات من الميمات ذات التسميات التوضيحية النصية المستخلصة مسبقا، لكن من غير الواضح ما إذا كانت هذه الأمثلة الاصطناعية تعزز إلى الميمات في البرية ".في هذه الورقة، نقوم بجمع الميمات البغيضة وغير البغيضة من Pinterest لتقييم الأداء الخارجي على النماذج المدربة مسبقا على مجموعة بيانات Facebook.نجد أن الميمات في البرية "تختلف في جوانبين رئيسيين: 1) يجب استخراج التسميات التوضيحية عبر OCR، ضجيج حقن وتقليل الأداء من النماذج متعددة الوسائط، و 2) الميمات أكثر تنوعا من الميمات التقليدية، بما في ذلك لقطات من المحادثات أو النصفي خلفية عادية.هذه الورقة هكذا بمثابة التحقق من الواقع للمعيار الحالي للكشف عن الكراهية ومستقليها على الكشف عن الكراهية في العالم الحقيقي.
تمت دراسة AcoNecoders Varitional كهدوء واعد لنموذج تعيينات واحدة إلى العديد من السياق للاستجابة في توليد استجابة الدردشة.ومع ذلك، غالبا ما تفشل في تعلم التعيينات المناسبة.أحد أسباب هذا الفشل هو التناقض بين الاستجابة وأخذ عينات متغير كامنة من توزيع تق ريبي في التدريب.أخذ عينات من غير لائق للمتغيرات الكامنة عليق النماذج من بناء مساحة كامنة بتعديل.نتيجة لذلك، تتوقف النماذج عن التعامل مع عدم اليقين في المحادثات.لحل ذلك، نقترح أخذ العينات المضاربة للمتغيرات الكامنة.تختار طريقتنا الأكثر احتمالا من متغيرات كامنة العينات بشكل زمني لربط المتغير مع استجابة معينة.نحن نؤكد فعالية طريقتنا في توليد الاستجابة مع بيانات حوار هائلة مصنوعة من مشاركات تويتر.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا