ترغب بنشر مسار تعليمي؟ اضغط هنا

دراسة تجريبية عن جيل المفاتيح العصبي

An Empirical Study on Neural Keyphrase Generation

323   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

شهدت السنوات الأخيرة ازدهارا من أعمال جيل المفاتيح العصبي (KPG)، بما في ذلك إصدار العديد من البيانات واسعة النطاق ومجموعة من النماذج الجديدة لمعالجةها.زاد أداء النموذج على مهام KPG بشكل كبير مع أبحاث التعلم العميق المتطور.ومع ذلك، يفتقر إلى مقارنة شاملة بين مختلف التصاميم النموذجية، والتحقيق الشامل على العوامل ذات الصلة التي قد تؤثر على أداء تعميم نظام KPG.في هذه الدراسة التجريبية، نهدف إلى ملء هذه الفجوة من خلال توفير نتائج تجريبية واسعة وتحليل العوامل الأكثر أهمية التي تؤثر على تعميم نماذج KPG.نأمل أن تساعد هذه الدراسة في توضيح بعض الشكوك المحيطة بمهمة KPG وتسهيل البحث في المستقبل حول هذا الموضوع.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

على الرغم من التحسينات المستمرة في جودة الترجمة الآلية، تظل الترجمة التلقائية الشعر مشكلة صعبة بسبب عدم وجود شاعرية موازية مفتوحة، وبالنسبة إلى التعقيدات الجوهرية المعنية في الحفاظ على الدلالات والأناقة والطبيعة المجازية للشعر. نقدم إجراءات تجريبية ل ترجمة الشعر على طول عدة أبعاد: 1) حجم وأسلوب بيانات التدريب (Poetic vs. غير شعري)، بما في ذلك إعداد الصفر بالرصاص؛ 2) ثنائي اللغة مقابل التعلم متعدد اللغات؛ و 3) نماذج لغة خاصة للعائلة مقابل نماذج عائلية مختلطة. لإنجاز ذلك، نساهم في مجموعة بيانات متوازية من ترجمات الشعر لعدة أزواج اللغة. تبين نتائجنا أن ضبط التركيب المتعدد اللغات على النص الشعري يتفوق بشكل كبير على النص المتعدد اللغوي على النص غير الشعري الذي هو 35X أكبر في الحجم، كلاهما من حيث المقاييس التلقائية (BLEU، Bertscore، المذنب) ومقاييس التقييم البشري مثل الإخلاص ( معنى والأناقة الشعرية). علاوة على ذلك، فإن ضبط التردد متعدد اللغات على البيانات الشعرية تتفوق على ضبط ثنائي اللغة على البيانات الشعرية.
يتطلب التواصل السلس والفعال القدرة على أداء استنتاج المناشد الكامن أو الصريح. يركز معايير التفكير في المناولة (مثل Socialiqa و Commonsenseqa) بشكل رئيسي على المهمة التمييزية المتمثلة في اختيار الإجابة الصحيحة من مجموعة من المرشحين، ولا تنطوي على تولي د لغة تفاعلية كما هو الحال في الحوار. علاوة على ذلك، فإن مجموعات بيانات الحوار الحالية لا تركز صراحة على عرض المنطقي كجايت. في هذه الورقة، نقدم دراسة تجريبية للعموم في توليد استجابة الحوار. نحن أولا استخراج السيارات الحوارات العمومية من مجموعات بيانات الحوار الموجودة من خلال الاستفادة من Congalnet، الرسم البياني المعرفة للعموم. علاوة على ذلك، بناء على السياقات الاجتماعية / المواقف في Socialiqa، نجمع مجموعة بيانات حوار جديدة مع حوارات 25 كيلو بايت تهدف إلى عرض العمولة الاجتماعية في بيئة تفاعلية. نقوم بتقييم نماذج توليد الاستجابة المدربة باستخدام مجموعات البيانات هذه والعثور على النماذج المدربة على كلا من المستخرجة وبياناتنا التي تم جمعها تنتج الردود التي تظهر باستمرار المزيد من المنطقي من الأساس. أخيرا، نقترح نهج للتقييم التلقائي للعموم التي تعتمد على ميزات مشتقة من نماذج النقدية واللغة المدربة مسبقا وحوار الحوار، وتظهر ارتباطا معقولا بالتقييم البشري لجودة الردود.
أصبحت نماذج اللغة متعددة اللغات المحددة مسبقا أداة شائعة في تحويل قدرات NLP إلى لغات الموارد المنخفضة، وغالبا مع التعديلات.في هذا العمل، ندرس أداء، قابلية القابلية للضغط، والتفاعل بين اثنين من هذه التكيفات: تكبير المفردات وتروية النصوص.تقييماتنا حول العلامات بين الكلام، تحليل التبعية الشامل، والاعتراف الكياري المسمى في تسعة لغات متنوعة منخفضة الموارد تدعم صلاحية هذه الأساليب مع رفع أسئلة جديدة حول كيفية تكييف النماذج متعددة اللغات على النحو الأمثل إلى إعدادات الموارد المنخفضة.
من المفترض أن تكون المعلومات المتسلسلة، A.AK.A.، أمر ضروري لمعالجة تسلسل مع الشبكة العصبية المتكررة أو تشفير الشبكة العصبية المتكررة.ومع ذلك، هل من الممكن ترميز اللغات الطبيعية دون أوامر؟بالنظر إلى كيس من الكلمات من جملة مضطربة، قد لا يزال البشر قادر ين على فهم ما تعني هذه الكلمات عن طريق إعادة ترتيبها أو إعادة بناءها.مستوحاة من هذا الحدس، في هذه الورقة، نقوم بإجراء دراسة للتحقيق في كيفية تأثير معلومات الطلب في تعلم اللغة الطبيعية.من خلال إدارة مقارنات شاملة، قارأت كميا قدرة العديد من النماذج العصبية الممثلة لتنظيم الأحكام من كيس من الكلمات بموجب ثلاثة سيناريوهات نموذجية، وتلخيص بعض النتائج والتحديات التجريبية، والتي يمكن أن تسلي الضوء على البحوث المستقبلية على خط العمل هذا.
يمكن تصنيف الأجهزة المحمولة، التي تلخص تماما المواضيع الرفيعة المستوى التي تمت مناقشتها في وثيقة، في عبارة البصرة الحالية التي تظهر صراحة في النص المصدر والفتحية الغائبة التي لا تتطابق مع أي لاحق متجاور ولكنه مرتبط للغاية بالمصدر. معظم نهج توليد مفات يح المفاتيح الموجودة تولد بمتزامنة خط أساتيجية موجودة وتغيب دون تمييز هذه الفئتين بشكل صريح. في هذه الورقة، يقترح اقتراح نهج محدد (SGG) في التعامل مع توليد الجماهير الموجود والمجابطة الحاضر بشكل منفصل مع آليات مختلفة. على وجه التحديد، SGG هي شبكة عصبية هرمية تتألف من محدد مقرا لها في طبقة منخفضة تتركز على جيل المفتاح الحالي، ومولد موجه في الاختيار في طبقة عالية مخصصة للتغيب عن جيل تسخير الغيام، ووحشية في المنتصف معلومات من محدد للمولد. النتائج التجريبية على أربعة معايير توليد مفاتيح المفاتيح توضح فعالية طرازنا، والتي تتفوق بشكل كبير على خطوط الأساس القوية لكلا الجداول الرائعة الحالية والمغادرة. علاوة على ذلك، فإننا نقدم SGG إلى مهمة توليد العنوان تشير إلى إمكانية قدرتها على مهام توليد اللغة الطبيعية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا