بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

LT3 في مهمة Semeval-2021 6: استخدام تجمع Bilinear المدمج متعدد الوسائط للجمع بين الفهم البصري والنصوص في الميمات

LT3 at SemEval-2021 Task 6: Using Multi-Modal Compact Bilinear Pooling to Combine Visual and Textual Understanding in Memes

398 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

combine visual visual and textual textual understanding الجمع بين البصرية مرئي ونص فهم نصي صناعة حمض الفوسفور

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

أصبحت ميمات الإنترنت في كل مكان في شبكات وسائل التواصل الاجتماعي اليوم.نظرا لشعبيةهم، فهي أيضا وضع التعبير المستخدم على نطاق واسع لنشر التضليل عبر الإنترنت.نظرا لأن الميمات تتكون من مزيج من النص والصورة، فإنها تتطلب نهجا متعدد الوسائط للتحليل التلقائي.في هذه الورقة، نصف مساهمتنا في اكتشاف Semeval-2021 من تقنيات الاقتران في النصوص والصور المهمة.نقترح نظام تعليمي متعدد الوسائط، مما يشتمل على membeddings ''، viz.ميزات النص المشتركة والرؤية من خلال الجمع بينها مع تجمع bilinear المدمجة، لتحديد تقنيات التهاضة الخطابية والنفسية تلقائيا.تظهر النتائج التجريبية أن النظام المقترح يتفوق باستمرار على خط الأساس في المسابقة، وتحقق أفضل درجة ماكرو F1 و 14 درجة 14 درجة مئوية من جميع المشاركين.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

982 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقدم هذه الورقة الحل المقترح من قبل فريق 1213LI ل Subtask 3 في مهمة Semeval-2021: تحديد تقنيات الإقناع المتعددة المستخدمة في المحتوى متعدد الوسائط للميمي.استكشفنا مناهج مختلفة في استخراج ميزة الكشف عن ملصقات الإقناع.توظف نموذجنا النهائي النماذج المدر بة مسبقا بما في ذلك روبرتا و RESNET-50 كمستخلص ميزة للنصوص والصور، على التوالي، ويعتمد طبقة تضمين الملصقات مع آلية اهتمام متعدد الوسائط لقياس تشابه الملصقات مع المعلومات متعددة الوسائطمميزات الصمامات للتوقعات التسمية.تتفوقت طريقة لدينا المقترحة على الطريقة الأساسية المقدمة وتحقق 3 من 16 مشاركا مع 0.54860 / 0.22830 لعشرات مايكرو / ماكرو F1.

detection of propaganda multi-modal attention propaganda with multi-modal اهتمام متعدد الوسائط دعاية مع متعددة مشروط صناعة حمض الفوسفور

Aimh في مهمة Semeval-2021 6: تصنيف متعدد الوسائط باستخدام مجموعة من نماذج المحولات

680 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تصف هذه الورقة النظام المستخدم من قبل فريق Aimh للتعامل مع المهمة السامية 6. نقترح نهج يعتمد على بنية بناء على نموذج المحول لمعالجة المحتوى متعدد الوسائط (النص والصور) في الميمات.بنية لدينا، تسمى DVTT (محول نصي مرئي مزدوج)، تقترب من المهام الفرعية 1 و 3 من المهمة 6 كمشاكل تصنيف متعددة التسميات، حيث تتم معالجة نص و / أو صور ميمي، واحتمالات وجود كل إقناع محتمليتم إرجاع التقنية نتيجة لذلك.يستخدم DVTT شبكتان كاملا من المحولات التي تعمل على النص والصور مشروطة بشكل متبادل.يعمل أحد الطرائقين كأداة رئيسية والثانية التدخل في إثراء أول واحد، وبالتالي الحصول على طريقتين مميزين للعمل.يتم دمج مخرجات المحولاتين عن طريق حساب احتمالات الاستفادة من كل ملصق ممكن، ويتم تدريب الشبكة الشاملة على نهاية إلى نهاية مع فقدان انتروبيا ثنائي.

aimh team visual textual transformer double visual textual فريق Aimh محول البصرية النصية ضعف المرئي النصية صناعة حمض الفوسفور المزيد..

فولتا في مهمة Semeval-2021 6: نحو الكشف عن النصوص والصور المقنعة باستخدام فرقة نصية متعددة الوسائط

578 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

الميمات هي واحدة من الأنواع الأكثر شعبية من المحتوى المستخدمة لنشر المعلومات عبر الإنترنت.يمكنهم التأثير على عدد كبير من الناس من خلال التقنيات الخطابية والنفسية.تتمثل المهمة والكشف عن تقنيات الإقناع في النصوص والصور، والكشف عن هذه التقنيات المقنعة ف ي الميمات.يتكون من ثلاثة أجهزة فرعية: (أ) تصنيف متعدد التسميات باستخدام المحتوى النصي، (ب) تصنيف التسميات المتعددة والتحديد SPAN باستخدام المحتوى النصي، و (ج) تصنيف متعدد التسميات باستخدام المحتوى المرئي والنصوص.في هذه الورقة، نقترح نهجا للتعلم نقل النماذج القائمة على Brote-Tune-Tune في طرائق مختلفة.نحن نستكشف أيضا فعالية مجموعات النماذج المدربة في طرائق مختلفة.نحقق درجة F1 57.0 و 48.2 و 52.1 في المهام الفرعية المقابلة.

detecting persuasive texts detecting persuasive الكشف عن النصوص المقنعة الكشف عن إقناع صناعة حمض الفوسفور

YNU-HPCC في مهمة Semeval-2021 6: الجمع بين ألبرت والنصوص CNN للكشف عن الإقناع في النصوص والصور

607 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في السنوات الأخيرة، تم استخدام ميم يجمع بين الصورة والنص على نطاق واسع في وسائل التواصل الاجتماعي، والميمات هي واحدة من أكثر أنواع المحتوى شعبية المستخدمة في حملات التضاعف عبر الإنترنت.في هذه الورقة، يتم تلخيص دراستنا حول اكتشاف تقنيات الإقناع في الن صوص والصور في مهمة Semeval-2021.بالنسبة للكشف عن تكنولوجيا الدعاية في النص، نقترح نموذج مزيج من كل من ألبرت ونص سي إن إن تصنيف النص، بالإضافة إلى نموذج وضع تسلسل متعدد المهام متعدد المهام لاستغلال التغطية التكنولوجية للدعاية.بالنسبة لمهمة تصنيف Meme المشاركة في فهم النص واستخراج الميزة البصرية، قمنا بتصميم نموذج قناة متوازية مقسمة إلى قنوات نصية وصورة.حققت طريقتنا أداء جيدا بشأن المجموع الفرعي 1 و 3. درجات مايكرو F1 من 0.492، 0.091، و 0.446 التي تحققت في مجموعات الاختبار من المهارات الفرعية الثلاثة المرتبة الثانية عشرة، 7، وحتى 11، على التوالي، وكلها أعلى من الأساسنموذج.

memes combining image combining albert الميم يجمع بين الصورة الجمع بين ألبرت صناعة حمض الفوسفور

WVOQ في مهمة Semeval-2021 6: بارت لكشف وتصنيف

1139 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

الكشف والتصنيف في وقت واحد هو مهمة غير موجهة حاليا في أطر NLP القياسية.تصف هذه الورقة السبب وكيف تم استخدام نموذج الترفيح في الجمع بين الكشف عن الفحص والتصنيف لمعالجة SubTask 2 من مهمة Semeval-2021 6.

span detection detection and classification simultaneous span detection سبان الكشف الكشف والتصنيف اكتشاف سبان في وقت واحد. صناعة حمض الفوسفور المزيد..

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2107 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة دمشق

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

LT3 في مهمة Semeval-2021 6: استخدام تجمع Bilinear المدمج متعدد الوسائط للجمع بين الفهم البصري والنصوص في الميمات

LT3 at SemEval-2021 Task 6: Using Multi-Modal Compact Bilinear Pooling to Combine Visual and Textual Understanding in Memes

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة