ترغب بنشر مسار تعليمي؟ اضغط هنا

TGIF: Graph Graph مدمج التنسيق المتكامل للمحافظة على UD المعزز مع Finetuning Generic-Langual - اللغة الفردية

TGIF: Tree-Graph Integrated-Format Parser for Enhanced UD with Two-Stage Generic- to Individual-Language Finetuning

277   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم مساهمتنا في المهمة المشتركة IWPT 2021 بشأن التحليل في التبعيات العالمية المعززة. مكون النظام الرئيسي الخاص بنا هو محلل خرطوم من أشجار الشجرة الهجين التي تدمج (أ) تنبؤات تمتد الأشجار الرسوم البيانية المحسنة مع (ب) حواف بياني إضافية غير موجودة في الأشجار الممتدة. نحن أيضا اعتماد استراتيجية Finetuning حيث نركن أولا محيطا عاما لغة على تسلسل البيانات من جميع اللغات المتاحة، ثم، في خطوة ثانية، Finetune على كل لغة فردية بشكل منفصل. بالإضافة إلى ذلك، نطور مجموعة كاملة من الوحدات الكاملة الخاصة بنا ذات الصلة بالمهمة المشتركة، بما في ذلك التكفيق، تجزئة الجملة، والتوسع الرمز المميز متعدد الكلمات، استنادا إلى نماذج XLM-R المدربة مسبقا ولغة ما قبل التدريب على مستوى الشخصية عارضات ازياء. يوصل تقديمنا إلى ELAS في المتوسط ​​الكلي 89.24 في مجموعة الاختبار. تحتل المرتبة الأولى بين جميع الفرق، مع وجود هامش أكثر من 2 إيلاس المطلق عبر التقديم الأفضل الأداء الأفضل، وأفضل درجة في 16 من أصل 17 لغة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إلى جانب رزق BiAffine، تم تكييف المحولات بفعالية مع تحويل الرسائل النصية وحققت أداء حالة من الفن على تحليل عمرو.ومع ذلك، فإن العديد من الأعمال السابقة تعتمد على فك تشفير BiAffine لأي منهما أو كلا من القوس والملصقات على الرغم من أن معظم الميزات المستخ دمة من قبل وحدة فك الترميز قد تتعلم من قبل المحول بالفعل.تقدم هذه الورقة نهجا جديدا لتحليل عمرو من خلال الجمع بين البيانات غير المتجانسة (الرموز والمفاهيم والملصقات) كإدخال واحد إلى محول لتعلم الانتباه، واستخدام مصفوفات الاهتمام فقط من المحول للتنبؤ بجميع العناصر في الرسوم البيانية AMR (المفاهيم، الأقواس،تسميات).على الرغم من أن نماذجنا تستخدم معلمات أقل بكثير من محلل الرسم البياني للحالة السابقة، فإنها تظهر دقة مماثلة أو أفضل على عمرو 2.0 و 3.0.
تعاني رسوم الرسوم البيانية المعرفة من Sparsity والتي تتحلل من جودة التمثيلات الناتجة عن الطرق المختلفة. في حين أن هناك وفرة من المعلومات النصية في جميع أنحاء الويب والعديد من قواعد المعرفة الموجودة، فإن محاذاة المعلومات في جميع مصادر البيانات المتنوع ة تظل تحديا في الأدبيات. وقد تناولت العمل السابق جزئيا هذه المشكلة عن طريق إثراء كيانات الرسم البياني المعرفي بناء على "حدوث كلمات" بجدية موجودة في كيانات الرسوم البيانية والنص الخارجي، بينما نحقق تكبير "" لينة "من خلال اقتراح إثراء الرسم البياني المعرفي وإطار التضمين اسمه الحافة. بالنظر إلى الرسم البياني المعرفي الأصلي، فإننا نقوم أولا بإنشاء رسم بياني معدني غني ولكن صاخبة يستخدم النصوص الخارجية في المستوى الدلالي والهيكل الهيكلية. لتقطير المعرفة ذات الصلة وقمع الضوضاء المقدمة، نقوم بتصميم مصطلح محاذاة رسم بياني في مساحة تضمين مشتركة بين الرسم البياني الأصلي والرسم البياني المعزز. لتعزيز التعلم التضمين في الرسم البياني المعزز، فإننا نتاجر مواصلة علاقة الموقع بالكيان المستهدف بناء على أخذ العينات السلبية. النتائج التجريبية على أربعة مجموعات بيانات قياسية تثبت متانة وفعالية الحافة في تبديد الارتباط وتصنيف العقدة.
مجردة لأنظمة معالجة اللغات الطبيعية، وهي نوعين من الأدلة تدعم استخدام تمثيلات نصية من نماذج اللغة العصبية المحددة "على الفوروريا غير المخلفات الكبيرة: الأداء على معايير مستوحاة من التطبيقات (بيترز وآخرون، 2018، في جملة أمور أخرى)، والظهور من التجريدا ت النحوية في تلك التمثيلات (Tenney et al.، 2019، في جملة أمور أخرى). من ناحية أخرى، فإن الافتقار إلى الإشراف الأساسي يدعو إلى المسائل مدى جودة هذه التمثيلات يمكن أن تلتقط المعنى (Bender and Koller، 2020). نحن نطبق تحقيقات جديدة إلى نماذج اللغة الأخيرة --- التركيز على وجه التحديد على هيكل الوسائد المسند على النحو الذي يتعرض عليه التبعيات الدلالية (إيفانوفا وآخرون، 2012) --- وإيجاد ذلك، على عكس بناء الجملة، لا يتم إحضار الدلالات إلى السطح من قبل اليوم نماذج مسبقا. بعد ذلك، نستخدم تشفير الرسومات التنافيلية لتشمل صراحة على التقييم الدلالي في الفوائد الخاصة بمهام المهام، وتحقيق فوائد العائد لمهام فهم اللغة الطبيعية (NLU) في معيار الغراء. يوضح هذا النهج إمكانية الإشراف اللغوي للأغراض العامة (بدلا من المهام الخاصة)، أعلاه وما يتجاوز الاحتجاج والتأمل التقليدي. تساعد العديد من التشخيص في توطين فوائد نهجنا
نحن تصف محلول Nuig لمهمة IWPT 2021 بمهمة التعبير المعزز (ED) معزز بلغات متعددة.بالنسبة لهذه المهمة المشتركة، نقترح وتقييم محلل إد المحلي المستند SEQ2SEQ SEQ2SEQ ومقرها SEQ2SEQ الذي يتنبأ بمجموعة ED-Parse من جملة مدخلات معينة كأسلسلة موضعية موضعية للن موذج النسبي.نموذجنا المقترح هو شبكة عصبية متعددة الاستخدامات تؤدي خمس مهام رئيسية في وقت واحد وهي وضع علامات UPOS، ووضع العلامات UFEAT، والليمون، والتحليل التبعية والحد من التحليل.علاوة على ذلك، نستخدم النموذج اللغوي المتاح في قاعدة بيانات Wals لتحسين قدرة محللنا المحترفين المقترحين على الانتقال عبر اللغات.تشير النتائج إلى أن SEQ2SEQ ED-Parser المقترح لدينا يؤدي على قدم المساواة مع محلل ED-Art-Art على الرغم من وجود علامة أبسط.
تتطلب QA مؤخرا مع أسئلة التفكير المنطقي علاقات على مستوى المرور بين الجمل.ومع ذلك، فإن النهج الحالية لا تزال تركز على العلاقات على مستوى الجملة تتفاعل بين الرموز.في هذا العمل، نستكشف عن أدلة على مستوى المرور التجميعي لحل ضمنيا المنطق المنطقي باستخدام المعلومات المستندة إلى الخطاب.نقترح شبكة الرسم البياني على داجرا (DAGN) تلك الأسباب التي تعتمد على هيكل الخطاب للنصوص.يرميز النموذج معلومات الخطاب كشركة رسم بياني مع وحدات الخطاب الأولية (EDUS) وعلاقات الخطاب، وتعلم ميزات Converse-Aware عبر شبكة رسم بياني لمهام QA المصب.يتم إجراء التجارب على اثنين من مجموعات البيانات المنطقية من المنطقية، reclor and logiqa، ونتائج dagn المقترحة لدينا نتائج تنافسية.يتوفر شفرة المصدر في https://github.com/eleanor-h/dagn.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا