ترغب بنشر مسار تعليمي؟ اضغط هنا

كامبريدج في Semeval-2021 المهمة 2: النموذج WIC العصبي مع زيادة البيانات واستكشاف التمثيل

Cambridge at SemEval-2021 Task 2: Neural WiC-Model with Data Augmentation and Exploration of Representation

369   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة نظام فريق Cambridge المقدم إلى المهمة المشتركة SEMEVAL-2021 على الغموض المتعدد اللغات واللغة الاجتماعية في السياق.بناء فوق نموذج لغة ملثم مسبقا مدرب مسبقا، يتم تدريب نظامنا أولا مسبقا على بيانات خارج المجال، ثم ضبطها على بيانات داخل المجال.نوضح فعالية استراتيجية التدريب التي تتراوح خطوتين مقترح وفوائد تكبير البيانات من كل من الأمثلة القائمة والموارد الجديدة.نحن مزيد من التحقيق في التمثيلات المختلفة وإظهار أن إضافة الميزات المستندة إلى عن بعد مفيدة في مهمة الغموض للكلمة في السياق.ينتج نظامنا نتائج تنافسية للغاية في المسار المتبادل دون تدريب على أي بيانات عبر اللغات؛وتحقق نتائج أحدث النتائج في المسار متعدد اللغات، الترتيب الأول في لغتين (العربية والروسية) والثانية في الفرنسية من أصل 171 نظام مقدم.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه الورقة نظام GX لمهمة الغموض المتعددة اللغات واللغة اللغوية في السياق (MCL-WIC).الغرض من المهمة MCL-WIC هو معالجة التحدي المتمثل في التقاط الطبيعة Polysemous للكلمات دون الاعتماد على مخزون ثابت ثابت في بيئة متعددة اللغات واللغة اللغوية.لحل ال مشكلات، نستخدم Adgeddings Word الخاص بالسياق من بيرت للقضاء على الغموض بين الكلمات في سياقات مختلفة.ولغات دون وجود كائن تدريب متاح، مثل الصينية، نستخدم نموذج الترجمة الآلي للخلايا العصبية لترجمة البيانات الإنجليزية الصادرة عن المنظمين للحصول على البيانات الزائفة المتاحة.في هذه الورقة، نطبق نظامنا على الإعداد الإنجليزي والصيني متعدد اللغات وإظهار النتائج التجريبية أن طريقتنا لها مزايا معينة.
في هذه الورقة، نقدم المهمة السامية الأولى على الغموض المتعددة اللغات والبلاية في السياق (MCL-WIC). تتيح هذه المهمة القدرة الكامنة التي تم التحقيق بها إلى حد كبير من القدرة المتأصلة إلى حد كبير في التمييز بين حواس الكلمات داخل وبصور اللغات المراد تقيي مها، مما أدى إلى تقييم متطلبات جرد ذات معنى ثابت. مؤطرة كتصنيف ثنائي، مهمتنا مقسمة إلى جزأين. في المهمة الفرعية متعددة اللغات، يتعين على النظم المشاركة تحديد ما إذا كانت كلمتين مستهدفتين، كل منهما يحدث في سياق مختلف داخل نفس اللغة، معبرا عن نفس المعنى أم لا. بدلا من ذلك، في الجزء اللغوي، يطلب من النظم إجراء المهمة في سيناريو عبر اللغات، حيث يتم توفير الكلمات المستهدفة والسياقتين المقابلين بلغتين مختلفتين. نوضح مهمتنا، وكذلك بناء مجموعة بياناتنا التي أنشأنا يدويا بما في ذلك خمس لغات، وهي العربية والصينية والإنجليزية والفرنسية والروسية، ونتائج النظم المشاركة. مجموعات البيانات والنتائج متوفرة في: https://github.com/sapienzanlp/mcl-wic.
توضح هذه الورقة وتبحث في أنظمة مختلفة لمعالجة المهمة 6 من Semeval-2021: اكتشاف تقنيات الإقناع في النصوص والصور، والتعقب الفرعي 1. تهدف المهمة إلى بناء نموذج لتحديد التقنيات الطبية والنفسية (مثل التبسيط المفاجئ، الاسم-Cling، تشويه) في المحتوى النصي من ميمي يستخدم غالبا في حملة تضليل للتأثير على المستخدمين.توفر الورقة مقارنة واسعة النطاق بين مختلف أنظمة تعليم الآلات كحل للمهمة.نقوم بتوصيل المعالجة المسبقة للبيانات النصية لصالح المهمة وعدة طرق للتغلب على خلل الفصل.تظهر النتائج أن ضبط نموذج روبرتا يعطى أفضل النتائج مع نقاط F1-Micro من 0.51 على مجموعة التطوير.
وصفنا أنظمة جامعة ألبرتا لمهمة الغموض في السياق Semeval-2021 (WIC).نستكشف استخدام معلومات الترجمة لتحديد ما إذا كان هناك رموزان مختلفان من نفس الكلمة يتوافق مع نفس الشعور بالكلمة.يركز تركيزنا على تطوير النهج النظرية المبدئية التي ترتكز في الظواهر الل غوية، مما يؤدي إلى نماذج أكثر قابل للتفسير.نظهر أن الترجمات من لغات متعددة يمكن أن يتم الاستفادة منها لتحسين الدقة في مهمة WIC.
تصف هذه الورقة تقديمنا إلى المهمة المشتركة Semeval-2021 بشأن تنبؤ التعقيد المعجمي.اتصلنا بمثابة مشكلة في الانحدار وتقديم مجموعة فرقة تجمع بين أربعة أنظمة، واحدة مقرها ومميزة مقرها وثلاثة عصبي مع التعلم الدقيق والتردد المسبق والتعلم متعدد المهام، وتحق يق درجات بيرسون من 0.8264 و 0.7556 في مجموعات المحاكمة والاختبارعلى التوالي (المهمة الفرعية 1).ونحن نقدم أيضا تحليلنا للنتائج ومناقشة نتائجنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا