ترغب بنشر مسار تعليمي؟ اضغط هنا

Supertagging الذيل الطويل مع فك التشفير منظم الأشجار الفئات المعقدة

Supertagging the Long Tail with Tree-Structured Decoding of Complex Categories

389   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مجردة على الرغم من أن Supertaggers الحالي CCG يحقق دقة عالية على مجموعة اختبار WSJ القياسية، إلا أن القليل من الأنظمة تستخدم الهيكل الداخلي للفئات التي ستقود الاشتقاق النحوي أثناء التحليل.يتم اقتطاع التغذية تقليديا، وتخلص العديد من أنواع الفئات النادرة والمعقدة في الذيل الطويل.ومع ذلك، Supertags هي أنفسهم الأشجار.بدلا من التخلي عن علامات نادرة، نحقق في النماذج البناءة التي تمثل هيكلها الداخلي، بما في ذلك أساليب جديدة للتنبؤ منظم الأشجار.إن أفضل Tagger لدينا قادرة على استعادة جزء كبير من التبرعات الطويلة الذيل وحتى يولد فئات CCG التي لم يتم رؤيتها مطلقا في التدريب، مع تقارب الحالة السابقة للفن في دقة العلامات الشاملة مع عدد أقل من المعلمات.نحن مزيد من التحقيق في مدى تعميم النهج المختلفة لمجموعات التقييم خارج النطاق.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم إحراك المصالح المتزايدة في أنظمة الموافقة على المحادثة (CRS)، والتي تستكشف تفضيل المستخدم من خلال تفاعلات المحادثة من أجل تقديم توصية مناسبة. ومع ذلك، لا يزال هناك نقص في القدرة في CRS الحالية إلى (1) اجتياز مسارات التفكير المتعددة على المعرفة الأ ساسية لإدخال العناصر والسمات ذات الصلة، و (2) ترتيب كيانات مختارة بشكل مناسب بموجب نود النظام الحالي للسيطرة على جيل الاستجابة. لمعالجة هذه المشكلات، نقترح Walker CR-Walker في هذه الورقة، وهو نموذج يقوم بتنفيذ التفكير منظم في الأشجار في رسم بياني للمعرفة، ويولد أعمال حوار إعلامية لتوجيه توليد اللغة. ينظر المخطط الفريد من المنطق المنظم في الأشجار إلى الكيان اجتاز كل قفزة كجزء من أعمال الحوار لتسهيل توليد اللغة، والذي يربط كيف يتم اختيار الكيانات والأعرب عنها. تظهر التقييمات التلقائية والبشرية أن CR-Walker يمكن أن يصل إلى توصية أكثر دقة، وتوليد استجابات أكثر إعلامية وجذابة.
غالبا ما يتطلب جيل النص الشرطي القيود المعجمية، أي الكلمات التي يجب أو لا ينبغي إدراجها في نص الإخراج. في حين أن الوصفة المهيمنة لجيل النظام الشرطي كانت نماذج لغوية متماثلة على نطاق واسع يتم تصويرها على بيانات التدريب الخاصة بمهام المهام، فإن مثل هذه النماذج لا تتعلم اتباع القيود الأساسية بشكل موثوق، حتى عند الإشراف على كميات كبيرة من الأمثلة الخاصة بمهام المهام وبعد نقترح فك التشفير العصبي، خوارزمية بسيطة ولكنها فعالة تمكن نماذج اللغة العصبية - تحت إشراف أو لا - لتوليد نص بطلاقة مع مرضية القيود المعقدة المعقدة. نهجنا قوي بعد كفاءة. يتعامل مع أي مجموعة من القيود المعجمية المعبرة تحت المنطق المسند، في حين أن وقت التشغيل مقاربها يعادل البحث عن شعاع التقليدية. تظهر النتائج التجريبية على أربعة معايير أن فك التشفير العصبي تتفوق على النهج السابقة، بما في ذلك الخوارزميات التي تتعامل مع مجموعة فرعية من قيودنا. علاوة على ذلك، نجد أن النماذج غير الخاضعة للكشف عن فك التشفير العصبي في كثير من الأحيان تفوق النماذج الخاضعة للإشراف مع فك التشفير التقليدي، حتى عندما تستند الأخير إلى شبكات أكبر بكثير. تشير نتائجنا إلى حد الشبكات العصبية واسعة النطاق لتوليد القابل للتحكم بالقلق ووعد خوارزميات وقت الاستقدمية.
العديد من النماذج العصبية الحديثة المصممة للمناسبة الروماتونية تؤدي بشكل سيء على الاستدلال النزولي.لمعالجة هذا القصور، قمنا بتطوير شبكة عصبية منظم بشجرة اليقظة.وهي تتألف من شبكة ذاكرة طويلة الأجل على المدى القصير (TREE-LSTM) مع اهتمام ناعم.تم تصميمه لنموذج معلومات شجرة التحليل النحوية من زوج الجملة من مهمة التفكير.يتم استخدام مجمع ذاتي اليقظة لمحاذاة تمثيلات الفرضية والفرضية.نقدم نموذجنا وتقييمه باستخدام DataSet EnteraTment Monoticity (MED).نعرض ونحاول شرح أن نموذجنا يفوق النماذج الحالية على ميد.
تعتمد معظم نماذج الترجمة الآلية العصبية الحالية ترتيب فك التشفير الرخيصي إما من اليسار إلى اليمين أو اليمين إلى اليسار.في هذا العمل، نقترح طريقة رواية تنفصل قيود أوامر فك التشفير هذه، تسمى فك تشفير الذكية.وبشكل أكثر تحديدا، تتوقع طريقةنا أولا كلمة مت وسط.يبدأ فك شفرة الكلمات الموجودة على الجانب الأيمن من الكلمة المتوسطة ثم يولد كلمات على اليسار.نحن نقيم طريقة فك التشفير الذكية المقترحة على ثلاث مجموعات البيانات.تظهر النتائج التجريبية أن الطريقة المقترحة يمكن أن تتفوق بشكل كبير على النماذج الأساسية القوية.
تهدف الترجمة الآلية المتنوعة إلى توليد ترجمات لغة مستهدفة مختلفة عن عقوبة لغة مصدر معينة. للاستفادة من العلاقة الخطية في مجال الجملة الكامنة التي أدخلت من خلال التدريب المزيج، نقترح طريقة رواية، خلطتيبات، لتوليد ترجمات مختلفة عن جملة الإدخال من خلال الاسترجاء الخطي مع أزواج من الجملة المختلفة من كوربوس التدريب أثناء فك التشفير. لزيادة تحسين الإخلاص وتنوع الترجمات، نقترح مقاربتين بسيطة ولكنها فعالة لتحديد أزواج جملة متنوعة في كوربوس التدريب وضبط وزن الاستيفاء لكل زوج في المقابل. علاوة على ذلك، من خلال التحكم في وزن الاستيفاء، يمكن لطريقتنا تحقيق المفاضلة بين الإخلاص والتنوع دون أي تدريب إضافي، وهو مطلوب في معظم الأساليب السابقة. تتم تجارب WMT'16 EN-RO، WMT'14 EN-DE، و WMT'17 Zh-en لإظهار أن طريقتنا تتفوق بشكل كبير على جميع أساليب الترجمة الآلية المتنوعة السابقة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا