ترغب بنشر مسار تعليمي؟ اضغط هنا

الكشف عن السخري مهم بالنسبة للعديد من مهام NLP مثل تحديد المعنويات في مراجعات المنتج وملاحظات المستخدم والمنتديات عبر الإنترنت.إنها مهمة صعبة تتطلب فهم عميق للغة والسياق والمعرفة العالمية.في هذه الورقة، نحقق ما إذا كانت دمج المعرفة المنطقية تساعد في الكشف عن السخرية.بالنسبة لهذا، فإننا ندمج معارف المنطقية في عملية التنبؤ باستخدام شبكة استئصال الرسم البياني مع تضيير نموذج اللغة المدرب مسبقا كمدخلات.تشير تجاربنا المزودة بثلاث مجموعات بيانات للكشف عن السخرية إلى أن النهج لا يتفوق على النموذج الأساسي.نحن نقوم بإجراء مجموعة شاملة من التجارب لتحليل المكان الذي يضيف فيه دعم المنطقي قيمة وأين يضر التصنيف.ينطبق تنفيذنا علنا على: https://github.com/brcsomnath/commonseense-sarasmasr.
في العمل السابق، فقد تبين أن بيرت يمكنه محاذاة الجمل المتبادلة بشكل كاف على مستوى الكلمة.نحن هنا التحقيق فيما إذا كان بإمكان بيرت أيضا أن تعمل أيضا كحاذاة على مستوى Char.اللغات التي تم فحصها هي اللغة الإنجليزية والإنجليزية المزيفة والألمانية واليونان ية.نظهر أن اللغتين الوثيقة هي، فإن بيرت أفضل يمكن أن يحاذيها على مستوى الشخصية.يعمل BERT بالفعل بشكل جيد باللغة الإنجليزية إلى محاذاة اللغة الإنجليزية المزيفة، ولكن هذا لا يعمم اللغات الطبيعية إلى نفس المدى.ومع ذلك، يبدو أن قرب لغتين عامين عاملا.اللغة الإنجليزية ترتبط بالألمانية أكثر من اليونانية وينعكس ذلك في مدى تحريزه جيدا؛اللغة الإنجليزية إلى الألمانية أفضل من الإنجليزية إلى اليونانية.ندرس إجراءات متعددة وإظهار أن مصفوفات التشابه اللغات الطبيعية تظهر العلاقات الأضعفين بصرف النظر عن لغتين.
تركز أنظمة الكشف عن الساركاز الموجودة على استغلال العلامات اللغوية أو السياق أو البثور على مستوى المستخدم. ومع ذلك، تشير الدراسات الاجتماعية إلى أن العلاقة بين المؤلف والجمهور يمكن أن تكون ذات صلة بنفس القدر لاستخدام السخرية وتفسيرها. في هذا العمل، ن قترح إطارا بالاستفادة المشتركة (1) سياق مستخدم من تغريداتهم التاريخية مع (2) المعلومات الاجتماعية من حي المستخدم في رسم بياني تفاعل، إلى السياق تفسير المنشور. نحن نميز بين الهوية المتصورة والمبلغ عنها الذاتي. نستخدم شبكات انتباه الرسوم البيانية (GAT) عبر المستخدمين والتويت في مؤشر ترابط محادثة، جنبا إلى جنب مع العديد من تمثيلات سجل المستخدم كثيفة. بصرف النظر عن تحقيق نتائج حديثة على مجموعة البيانات التي تم نشرها مؤخرا من مستخدمي Twitter مؤخرا مع تغريدات ثلاثية العدد 30K، قم بإضافة تغريدات 10M Unabeled كسياق، تشير تجاربنا إلى أن شبكة الرسم البياني تساهم في تفسير النوايا الساخرة للمؤلف أكثر من للتنبؤ بتصور السخرية من قبل الآخرين.
تركز أنظمة الكشف عن الساركاز الموجودة على استغلال العلامات اللغوية أو السياق أو البثور على مستوى المستخدم.ومع ذلك، تشير الدراسات الاجتماعية إلى أن العلاقة بين المؤلف والجمهور يمكن أن تكون ذات صلة بنفس القدر لاستخدام السخرية وتفسيرها.في هذا العمل، نقت رح إطارا بالاستفادة المشتركة (1) سياق مستخدم من تغريداتهم التاريخية مع (2) المعلومات الاجتماعية من الحي المحادثة للمستخدم في رسم بياني تفاعل، إلى السياق تفسير المنشور.نحن نستخدم شبكات انتباه الرسوم البيانية (GAT) عبر المستخدمين والتويت في مؤشر ترابط محادثة، جنبا إلى جنب مع تمثيلات سجل المستخدم الكثيفة.بصرف النظر عن تحقيق نتائج حديثة على مجموعة البيانات التي تم نشرها مؤخرا من مستخدمي Twitter الذي تم نشره مؤخرا مع تغريدات تسمية 30 ألفا، قم بإضافة تغريدات 10M Unabeled كسياق، تشير نتائجنا إلى أن النموذج يساهم في تفسير النوايا الساخرة للمؤلف أكثر منالتنبؤ بتصور السخرية من قبل الآخرين.
تجسد السخرية والشعور من عدم اليقين الجوهري للإدراك الإنساني، مما يجعل الكشف المشترك عن السخرية متعددة الوسائط ومشاعر مهمة صعبة. في ضوء مزايا الاحتمالات الكمومية (QP) في نمذجة هذا الشكوك، تستكشف هذه الورقة إمكانات QP كإطار رياضي وتقترح إطارا للتعليم م تعدد المهام المدفوعة من QP (QPM). ينطوي إطار QPM على تشفير تمثيل متعدد الوسائط متعدد الأوضاع، وهي فرعية فرعية تشبه الاصطدام الكمومية وآلية قياس الكم. يتم ترميز كل الكلام متعدد الوسائط (على سبيل المثال، النصي، المرئي البصري) لأول مرة كتراكبة كمية لمجموعة من المصطلحات الأساس باستخدام تمثيل ذو قيمة معقدة. بعد ذلك، يرفع الشبكة الفرعية التي تشبه الكتابة الكمومية تكوين الدولة الكم وتدخل الكم لنموذج التفاعل السياقي بين الكلام المجاورة والارتباطات عبر الطرائق على التوالي. أخيرا، يتم إجراء القياسات الكمية غير المتوافقة على التمثيل المتعدد الوسائط لكل كلام لإحداث النتائج الاحتمالية من السخرية والاعتراف بالمشاعر. تظهر النتائج التجريبية أن نموذجنا يحصل على أداء حديثة.
وصفنا نظامنا المقدم لهذه المهمة المشتركة 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية (أبو فرحة وآخرون، 2021).لقد تناولنا كل من المجموعات الفرعية، وهما اكتشاف السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).استخدمنا نماذج تمثيل نصية محكومة لل حالة من بين الفنون وتصنفها بشكل جيد وفقا لمهمة المصب في متناول اليد.كهدودي أول، استخدمنا بيرت متعددة اللغات من Google ثم المتغيرات العربية الأخرى: أرابيرت وأشرر وماربيرت.وجدت النتائج تظهر أن Marbert تفوقت على جميع النماذج المذكورة مسبقا بشكل عام، إما على التراكب الفرعي 1 أو Subtask 2.
تقدم هذه الورقة واحدة من أفضل خمس حلول الفوز للمهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية (الكشف عن السخرية SubTask-1).الهدف من المهمة هو تحديد ما إذا كانت سقسقة الساخرة أم لا.تم تطوير حلنا باستخدام تقنية فرقة مع نموذج أرابت المدرب مسبقا.نحن نصف الهندسة المعمارية للحل المقدم في المهمة المشتركة.نحن نقدم أيضا التجارب وضبط فرط الحرارة الذي يؤدي إلى هذه النتيجة.بالإضافة إلى ذلك، نناقش النتائج وتحليلها من خلال مقارنة جميع النماذج التي تدربناها أو اختبارها لتحقيق درجة أفضل في تصميم الطاولة.يحتل نموذجنا في المرتبة الخامسة من 27 فريقا مع درجة F1 من 0.5985.تجدر الإشارة إلى أن نموذجنا حقق أعلى درجة من الدقة 0.7830
توفر هذه الورقة نظرة عامة على المهمة المشتركة WANLP 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية.المهمة المشتركة لها مفتاحان فرعي: الكشف عن السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).تهدف هذه المهمة المشتركة إلى الترويج والاهتمام بالكشف عن السخرية العربية، وهو أمر بالغ الأهمية لتحسين الأداء في مهام أخرى مثل تحليل المعرفات.تتكون DataSet المستخدمة في هذه المهمة المشتركة، وهي Arsarcasm-V2، من 15،548 تغريدات تسمى السخرية والشعور واللهجة.تلقينا 27 و 22 عروضا للمجموعات الفرعية 1 و 2 على التوالي.تعتمد معظم النهج على استخدام النماذج اللغوية المدربة مسبقا وضبطها جيدا مثل أرابيرت وماربرت.وكانت أفضل النتائج التي تحققت في مهام تحليل السخرية وتحليل المعنويات 0.6225 F1 و 0.748 F1-PN على التوالي.
الاكتشاف الساخرة ذات أهمية كبيرة في فهم المشاعر والآراء الحقيقية للناس.العديد من التقيمات عبر الإنترنت، مراجعات، تعليقات وسائل التواصل الاجتماعي، إلخ.لقد تم بالفعل إجراء العديد من الأبحاث بالفعل في هذا المجال، لكن معظم الباحثين درس تحليل الساركاز الإ نجليزي مقارنة بالبحثية تتم في تحليل السخرية العربية بسبب تحديات اللغة العربية.في هذه الورقة، نقترح نهجا جديدا لتحسين اكتشاف السخرية العربية.يتم استخدام نهجنا تكبير البيانات، وكلمة السياق، ونموذج الغابات العشوائية للحصول على أفضل النتائج.كانت دقةنا في المهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية 0.5189 ل F1-Saarcastic مثل المقياس الرسمي باستخدام DataSet Arsarcasmv2 المشترك (أبو فرحة، وآخرون، 2021).
السخرية عبارة عن تعبير لغوي يستخدم في كثير من الأحيان للتواصل مع عكس ما يقال، وعادة ما يكون شيئا غير سار للغاية بقصد الإهانة أو السخرية.الغموض الكامنة في التعبيرات الساخرة يجعل اكتشاف السخرية صعبة للغاية.في هذا العمل، نركز على الكشف عن السخرية في محا دثات نصية، مكتوبة باللغة الإنجليزية، من منصات الشبكات الاجتماعية المختلفة وسائط الإعلام عبر الإنترنت.تحقيقا لهذه الغاية، نقوم بتطوير نموذج لتعلم عميق قابل للتفسير باستخدام وحدات انتباه ذاتيا متعددة الرأس والوحدات المتكررة.نظهر فعالية وتفسير نهجنا من خلال تحقيق نتائج أحدث النتائج في مجموعات البيانات من منصات الشبكات الاجتماعية ومنتديات المناقشة عبر الإنترنت والحوارات السياسية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا