ترغب بنشر مسار تعليمي؟ اضغط هنا

Semeval-2021 المهمة 12: التعلم مع الخلافات

SemEval-2021 Task 12: Learning with Disagreements

223   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الخلاف بين المبرمجين هو في كل مكان في جميع مجموعات البيانات المشروحة بأحكام بشرية في كل من معالجة اللغة الطبيعية ورؤية الكمبيوتر.ومع ذلك، تفترض معظم أساليب تعلم الآلات الأكثر إشرافا أن التفسير المفضل الوحيد موجود لكل عنصر، وهو في أحسن الأحوال مثالية.كان الهدف من مهمة Semeval-2021 المشتركة بشأن التعلم مع الخلافات (LE-WI-I-DI) هو توفير إطار اختبار موحد لأساليب التعلم من البيانات التي تحتوي على شروح متعددة وربما متناقضة تغطي مجموعات البيانات الأكثر شهرة التي تحتوي على معلومات حول الخلافاتتفسير اللغة وتصنيف الصور.في هذه الورقة وصفنا المهمة المشتركة ونتائجها.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم استخدام Growdsourcing بشكل مجيئي لتعليق مجموعات هائلة من البيانات.ومع ذلك، فإن العقبات الرئيسية التي تحول دون استخدام ملصقات من مصادر الحموشة هي ضوضاء وأخطاء من التعليقات الشرحية غير الخبراء.في هذا العمل، يقترح مقارنتين تتعامل مع الضوضاء والأخطاء في ملصقات الحشد.يستخدم النهج الأول تقليل الحد الأدنى على علم الحدة (SAM)، وهي تقنية التحسين بقوة بالملصقات الصاخبة.ينفد النهج الآخر على أن طبقة شبكة عصبية تدعى SoftMax-Crowdlayer مصممة خصيصا للتعلم من التعليقات التوضيحية من الحشد.وفقا للنتائج، يمكن للنهج المقترحة تحسين أداء نموذج الشبكة المتبقية الواسعة ونموذج التصور متعدد الطبقات المطبقة على مجموعات بيانات المصادر في الحشد في مجال معالجة الصور.كما أنه يحتوي على نتائج مماثلة ومقارنة مع تقنية التصويت الأغلبية عند تطبيقها على مجال البيانات المتسلسل حيث يتم استخدام تمثيلات التشفير الثنائية من المحولات (Bert) كطراز أساسي في كلا الحالتين.
من بين المهام التي تحفزها انتشار المعلومات الخاطئة، فإن اكتشاف الدعاية تحديا بشكل خاص بسبب عجز التعليقات التوضيحية الدقيقة الدقيقة اللازمة لتدريب نماذج التعلم الآلي.هنا نظهر كيف يمكن الاستفادة من البيانات من المهام الأخرى ذات الصلة، بما في ذلك تقييم المصداقية، في إطار التعلم متعدد المهام (MTL) لتسريع عملية التدريب.وتحقيقا لهذه الغاية، نقوم بتصميم نموذج يستند إلى بيرت مع طبقات إخراج متعددة، وتدريبه في العديد من سيناريوهات MTL وأداء التقييم ضد معيار الذهب السائم.
يتم استخدام الجداول على نطاق واسع في أنواع مختلفة من المستندات لتقديم المعلومات بإيجاز. يعد فهم الجداول مشكلة صعبة تتطلب فهم لغة اللغة والجدول، إلى جانب التفكير العددي والمنطقي. في هذه الورقة، نقدم أنظمتنا لحل المهمة 9 من Semeval-2021: التحقق من البي ان وإصدار الأدلة مع الجداول (SEM-Tab-Facts). تتكون المهمة من اثنين من المهام: (أ) بالنظر إلى جدول وبيان، يتوقع ما إذا كان الجدول يدعم البيان و (ب) التنبؤ بالخلايا الموجودة في الجدول تقديم أدلة على / ضد البيان. نحن نايت Tune Tapas (نموذج يمتد بنية بيرت لالتقاط بنية جدولي) لكل من المهام الفرعية حيث أظهرت أداء حالة من بين الفن في مهام فهم الجدول المختلفة. في SubTask a، نقيم كيفية نقل التعلم وتوحيد الجداول للحصول على صف رأس واحد يحسن أداء Tapas. في SubTask B، نقيم مدى اختلاف استراتيجيات ضبط التوصيل المختلفة تحسين أداء Tapas. حقق أنظمتنا درجة F1 من 67.34 في التراكب الفرعي تصنيف ثلاثي الاتجاه، 72.89 في فرعية تصنيف ثنائية الاتجاه، و 62.95 في الفرعية B.
نحن نصف أنظمتنا من SubTask1 و SubTask3 لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في النصوص والصور.الغرض من SubTask1 هو تحديد تقنيات الدعاية المعطاة المحتوى النصي، وهدف الفرع SubTask3 هو اكتشافها بالنظر إلى كل من المحتوى النصي والبصرية.بالنسبة إل ى SubTask1، نقوم بالتحقيق في التعلم التحويل بناء على نماذج اللغة المدربة مسبقا (PLMS) مثل بيرت، روبرتا لحل مشاكل تدفق البيانات.بالنسبة إلى SubTask3، نستخرج التمثيلات البصرية غير المتجانسة (I.E.، وميزات الوجه، وميزات OCR، والتمثيلات متعددة الوسائط) واستكشف العديد من استراتيجيات الانصهار متعددة الوسائط المتعددة للجمع بين التمثيلات النصية والمرئية.يوضح التقييم الرسمي طراز الفرع الخاص بنا يحتل المرتبة الأولى ل SubTask1 و 2 ل SubTask3.
تقدم هذه الورقة نظام GX لمهمة الغموض المتعددة اللغات واللغة اللغوية في السياق (MCL-WIC).الغرض من المهمة MCL-WIC هو معالجة التحدي المتمثل في التقاط الطبيعة Polysemous للكلمات دون الاعتماد على مخزون ثابت ثابت في بيئة متعددة اللغات واللغة اللغوية.لحل ال مشكلات، نستخدم Adgeddings Word الخاص بالسياق من بيرت للقضاء على الغموض بين الكلمات في سياقات مختلفة.ولغات دون وجود كائن تدريب متاح، مثل الصينية، نستخدم نموذج الترجمة الآلي للخلايا العصبية لترجمة البيانات الإنجليزية الصادرة عن المنظمين للحصول على البيانات الزائفة المتاحة.في هذه الورقة، نطبق نظامنا على الإعداد الإنجليزي والصيني متعدد اللغات وإظهار النتائج التجريبية أن طريقتنا لها مزايا معينة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا