ترغب بنشر مسار تعليمي؟ اضغط هنا

GX في Semeval-2021 المهمة 2: بيرت مع معلومات Lemma لمهمة MCL-WIC

GX at SemEval-2021 Task 2: BERT with Lemma Information for MCL-WiC Task

487   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة نظام GX لمهمة الغموض المتعددة اللغات واللغة اللغوية في السياق (MCL-WIC).الغرض من المهمة MCL-WIC هو معالجة التحدي المتمثل في التقاط الطبيعة Polysemous للكلمات دون الاعتماد على مخزون ثابت ثابت في بيئة متعددة اللغات واللغة اللغوية.لحل المشكلات، نستخدم Adgeddings Word الخاص بالسياق من بيرت للقضاء على الغموض بين الكلمات في سياقات مختلفة.ولغات دون وجود كائن تدريب متاح، مثل الصينية، نستخدم نموذج الترجمة الآلي للخلايا العصبية لترجمة البيانات الإنجليزية الصادرة عن المنظمين للحصول على البيانات الزائفة المتاحة.في هذه الورقة، نطبق نظامنا على الإعداد الإنجليزي والصيني متعدد اللغات وإظهار النتائج التجريبية أن طريقتنا لها مزايا معينة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، نقدم المهمة السامية الأولى على الغموض المتعددة اللغات والبلاية في السياق (MCL-WIC). تتيح هذه المهمة القدرة الكامنة التي تم التحقيق بها إلى حد كبير من القدرة المتأصلة إلى حد كبير في التمييز بين حواس الكلمات داخل وبصور اللغات المراد تقيي مها، مما أدى إلى تقييم متطلبات جرد ذات معنى ثابت. مؤطرة كتصنيف ثنائي، مهمتنا مقسمة إلى جزأين. في المهمة الفرعية متعددة اللغات، يتعين على النظم المشاركة تحديد ما إذا كانت كلمتين مستهدفتين، كل منهما يحدث في سياق مختلف داخل نفس اللغة، معبرا عن نفس المعنى أم لا. بدلا من ذلك، في الجزء اللغوي، يطلب من النظم إجراء المهمة في سيناريو عبر اللغات، حيث يتم توفير الكلمات المستهدفة والسياقتين المقابلين بلغتين مختلفتين. نوضح مهمتنا، وكذلك بناء مجموعة بياناتنا التي أنشأنا يدويا بما في ذلك خمس لغات، وهي العربية والصينية والإنجليزية والفرنسية والروسية، ونتائج النظم المشاركة. مجموعات البيانات والنتائج متوفرة في: https://github.com/sapienzanlp/mcl-wic.
تصف هذه الورقة نظام فريق Cambridge المقدم إلى المهمة المشتركة SEMEVAL-2021 على الغموض المتعدد اللغات واللغة الاجتماعية في السياق.بناء فوق نموذج لغة ملثم مسبقا مدرب مسبقا، يتم تدريب نظامنا أولا مسبقا على بيانات خارج المجال، ثم ضبطها على بيانات داخل ال مجال.نوضح فعالية استراتيجية التدريب التي تتراوح خطوتين مقترح وفوائد تكبير البيانات من كل من الأمثلة القائمة والموارد الجديدة.نحن مزيد من التحقيق في التمثيلات المختلفة وإظهار أن إضافة الميزات المستندة إلى عن بعد مفيدة في مهمة الغموض للكلمة في السياق.ينتج نظامنا نتائج تنافسية للغاية في المسار المتبادل دون تدريب على أي بيانات عبر اللغات؛وتحقق نتائج أحدث النتائج في المسار متعدد اللغات، الترتيب الأول في لغتين (العربية والروسية) والثانية في الفرنسية من أصل 171 نظام مقدم.
في هذه الورقة، اقترحنا محلل دلالي أبعاد بر فندقية، وهو مصمم من خلال دمج معلومات على مستوى Word.حقق نموذجنا ثلاثة من أفضل النتائج في أربعة مقاييس على rocling 2021 المهمة المشتركة: تحليل المعنويات الأبعاد للنصوص التعليمية ".أجرينا سلسلة من التجارب لمقا رنة فعالية مختلف الأساليب المدربة مسبقا.علاوة على ذلك، فإن النتائج تعاني أيضا على أن طريقتنا يمكن أن تحسن بشكل كبير من الأداء من الأساليب الكلاسيكية.استنادا إلى التجارب، ناقشنا أيضا تأثير هياكنات النموذج ومجموعات البيانات.
في هذا العمل، نقدم نهجنا لحل المهمة Semeval 2021 2: الغموض المتعددة اللغات والتبلغة في السياق (MCL-WIC). المهمة هي مشكلة تصنيف زوج الجملة حيث يكون الهدف هو اكتشاف ما إذا كانت كلمة معينة مشتركة بين كل من الجمل تثير نفس المعنى. نقدم أنظمة لكلا الإعدادا ت - متعددة اللغات (جمل الزوج تنتمي إلى نفس اللغة) واللغة اللغوية (جمل الزوج تنتمي إلى لغات مختلفة). يتم توفير بيانات التدريب باللغة الإنجليزية فقط. وبالتالي، فإننا نوظف تقنيات النقل عبر اللغات. توظف نهجنا نماذج اللغة القائمة على المحولات التي تم تدريبها مسبقا، مثل Electra و Albert، للمهمة الإنجليزية و XLM-R لجميع المهام الأخرى. لتحسين أداء هذه الأنظمة، نقترح إضافة إشارة إلى الكلمة التي سيتم إزالتها وتزيد بياناتنا عن طريق انعكاس زوج الجملة. ونحن كذلك زيادة DataSet المقدمة إلينا مع WIC و XL-WIC و SEMCOR 3.0. باستخدام الكفر، نحقق أداء قويا في المهمة المتعددة اللغات، حيث وضعت أولا في المهام الفرعية EN-EN و FR-FR. بالنسبة للإعداد المتبادل، فإننا أعملنا بترجمة طرق اختبار وطريقة طلقة صفرية، باستخدام نماذجنا متعددة اللغات، مع الأداء الأخير بشكل أفضل قليلا.
في هذه الورقة، نصف أساليبنا المقترحة لمهمة الغموض المتعددة اللغات في السياق في Semeval-2021.في هذه المهمة، يجب أن تحدد الأنظمة ما إذا كانت الكلمة التي تحدث في جملتين مختلفة يتم استخدامها بنفس المعنى أم لا.اقترحنا عدة طرق باستخدام نموذج بيرت المدرب مس بقا.في اثنين منهم، نقوم بتعديل الجمل وإضافتهم كمدخلات إلى بيرت، وفي أحدهم، استخدمنا WordNet لإضافة بعض المعلومات المعجمية الإضافية.قمنا بتقييم طرقنا المقترحة على بيانات الاختبار في مهمة Semeval- 2021 2.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا