ترغب بنشر مسار تعليمي؟ اضغط هنا

وصف النظام لمهمة commongen مع نموذج المؤشر

System Description for the CommonGen task with the POINTER model

311   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في تجربة حالية، كنا نقوم باختبار DataSet Commongen للمهمة الهيكلية إلى النص من GEM Living Benchmark مع نموذج مؤشر القيد القائم.يمثل المؤشر هندسة هجينة، والجمع بين النماذج القائمة على الإدراج والمحول، والتنبؤ بالكمية وموقع الإدراج في نفس الوقت.لذلك يتم إنشاء النص تدريجيا بطريقة غير متوازية غير تلقائية، بالنظر إلى مجموعة الكلمات الرئيسية.كان النموذج المحدد ضبطه بشكل جيد على تقسيم تدريب لمجموعة بيانات Commungen وتم مقارنة نتيجة الجيل بالتحقق من الصحة والتحدي.تتم مناقشة مخرجات المقاييس المستلمة، والتي تقيس المعادلات المعجمية، التشابه الدلالي والتنوع، في التفاصيل في وصف النظام الحالي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تناقش هذه الورقة المهمة المشتركة لمصطلحات WMT 2021 من منظور "Meta".نقدم نتائج تجاربنا باستخدام مجموعة بيانات المصطلحات و OpenNMT (Klein et al.، 2017) و Joeynmt (Kreutzer et al.، 2019) Toolkits لاتجاه اللغة الإنجليزية إلى الفرنسية.تجربتنا 1 يقارن تنبؤ ات مجموعة الأدوات.تستخدم التجربة 2 OpenNMT لضبط النموذج.نبلغ عن نتائجنا للحصول على المهمة مع البرنامج النصي التقييم ولكن في الغالب مناقشة الخصائص اللغوية لمجموعة بيانات المصطلحات المقدمة للمهمة.نحن نقدم دليلا على أهمية أنواع الأنواع النصية عبر الدرجات، بعد أن تم تكرار البرامج النصية للتقييم.
الترجمة الآلية العصبية (NMT) هي تكنولوجيا ترجمة آلية سائدة في الوقت الحاضر بسبب مرونةها التدريبية المتنقلة المحيرة.ومع ذلك، لا يزال NMT يكافح من أجل الترجمة بشكل صحيح في إعدادات الموارد المنخفضة خصيصا على أزواج اللغة البعيدة.طريقة واحدة للتغلب على ذل ك هي استخدام المعلومات من طرائق أخرى إذا كانت متوفرة.الفكرة هي أنه على الرغم من الاختلافات في اللغات، فإن كل من المصدر والمتحدثين اللغوي المستهدف يرون نفس الشيء والتمثيل المرئي لكل من المصدر والهدف هو نفسه، والذي يمكن أن يساعد النظام بشكل إيجابي.يمكن أن تساعد المعلومات متعددة الوسائط نظام NMT لتحسين الترجمة عن طريق إزالة الغموض على بعض العبارات أو الكلمات.نحن نشارك في ورشة العمل الثامنة حول الترجمة الآسيوية (WAT - 2021) لمهمة الترجمة الإنجليزية العربية الهندية وتحقيق 42.47 و 37.50 نقطة بلو للتقييم والتحدي الفرعي، على التوالي.
تعد تحليل التمثيل المعنى التجريدي مهمة التنبؤ بالسجن إلى الرسم حيث لا تتماشى العقد المستهدفة بشكل صريح إلى رموز الجملة. ومع ذلك، نظرا لأن عقد الرسوم البيانية تستند بشكل دلون على أساس واحد أو أكثر من رموز الجملة، يمكن استخلاص المحاذاة الضمنية. تعمل ال محللون المستقلون على الانتقال عبر الجملة من اليسار إلى اليمين، والتقاط هذا التحيز الاستقرائي عبر المحاذاة بتكلفة التعبير المحدود. في هذا العمل، نقترح نظام يستند إلى الانتقال الذي يجمع بين الصعب على الجمل مع آلية مؤشر الإجراءات ذات الجانب المستهدف لتحديد الرموز المصدر من تمثيلات العقدة ومحاذاة العناوين. نقوم بالنماذج التحولات وكذلك آلية المؤشر من خلال تعديلات واضحة داخل بنية محول واحدة. يتم تشفير معلومات هيكل الدولة ومحلل الرسم البياني بكفاءة باستخدام رؤوس الانتباه. نظظ أن نهج مؤشر العمل لدينا يؤدي إلى زيادة التعبير عن التعبير والكتابة مكاسب كبيرة (+1.6 نقطة) مقابل أفضل محلل عمرو على الانتقال في ظروف مماثلة للغاية. أثناء استخدام أي رسوم إعادة التصنيف الرسم البياني، فإن طرازنا الفردي ينتج عنه ثاني أفضل نقاط Smatch في AMR 2.0 (81.8)، والذي تم تحسينه إلى 83.4 مع بيانات الفضة والكشف عن الفرم.
يصور وصف نظام المهام المشترك هذا اثنين من بنيات الشبكة العصبية المقدمة إلى المسار الصحيح، من بينها النظام الفائز الذي سجل الأعلى في المهام الفرعية 7A و 7 ب.نقدم بالتفصيل النهج، خطوات المعالجة المسبقة والبنية المستخدمة لتحقيق النتائج المقدمة، وكذلك تو فير مستودع جيثب لإعادة إنتاج الدرجات.يعتمد النظام الفائز على نموذج لغة مسبق من المحولات وحل المهام الفرعية في وقت واحد.
في هذه الورقة، نقدم نظام TMU العصبي الخاص بنا (NMT) مقدم له مهمة براءات الاختراع (اليابانية والإنجليزية الكورية اليابانية) من ورشة العمل الثامنة حول الترجمة الآسيوية (Nakazawa et al.، 2021).في الآونة الأخيرة، اقترحت عدة دراسات طرز فك التشفير المدربة مسبقا باستخدام بيانات أحادية الأونلينغ.تم عرض واحدة من النماذج المدربة مسبقا، بارت (لويس وآخرون، 2020)، لتحسين دقة الترجمة عن طريق ضبط الدقيقة مع بيانات ثنائية اللغة.ومع ذلك، قاموا بتجريد الترجمة الإنجليزية الرومانية فقط باستخدام اللغة الإنجليزية بارت.في هذه الورقة، ندرس فعالية بارت اليابانية باستخدام مكتب براءات الاختراع الياباني Corpus 2.0.تشير تجاربنا إلى أن البارت الياباني يمكنه أيضا تحسين دقة الترجمة في كل من الترجمات اليابانية اليابانية والإنجليزية الكورية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا