ترغب بنشر مسار تعليمي؟ اضغط هنا

أنواع حقن الكيان في جيل النص الموجه في الكيان

Injecting Entity Types into Entity-Guided Text Generation

468   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أدت النجاحات الأخيرة في النمذجة التوليدية العميقة إلى تقدم كبير في توليد اللغة الطبيعية (NLG).أظهرت دمج الكيانات في نماذج الجيل العصبي تحسينات كبيرة من خلال المساعدة في استنتاج الموضوع الموجز وإنشاء محتوى متماسك.لتعزيز دور الكيان في NLG، في هذه الورقة، نهدف إلى نموذج نوع الكيان في مرحلة فك التشفير لتوليد كلمات سياقية بدقة.نقوم بتطوير نموذج NLG الجديد لإنتاج تسلسل مستهدف بناء على قائمة معينة من الكيانات.يحتوي نموذجنا على وحدة فك ترميز متعددة الخطوات التي تحفز أنواع الكيان في عملية تذكر الجيل.تجارب عملاء أخبار عامين تظهر حقن النوع ينفذ أفضل من نوع خطوط خطوط أسلاف التضمين.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في حين أن نماذج قوية مدربة مسبقا قد تحسنت بطلاقة نماذج توليد النص، فإن كفاية الدلالة - القدرة على توليد نص مخلص من الدلالة إلى الإدخال - لا تزال قضية ملحوظة. في هذه الورقة، نقدم كفايات دهالية التقييم التلقائية الجديدة، والتي يمكن استخدامها لتقييم نما ذج توليد المدى التي تنفذ الرسوم البيانية التي لفظها RDF (إطار وصف الموارد) نص يحتوي على تذرف من الكيانات التي تحدث في RDF إدخال. هذا مهم مثل رودس موضوع وكيانات الكائنات التي تشكل 2/3 من المدخلات. نحن نستخدم المقياس الخاص بنا بمقارنة 25 نماذج من المهام المشتركة Webnlg وندرش الارتباط بنتائج التقييمات البشرية للكفايات الدلالية. نظرا لأنه بينما يرتبط متري لدينا مع درجات التقييم البشري، يختلف هذا الارتباط مع تفاصيل إعداد التقييم البشري. هذا يشير إلى أنه من أجل قياس كفاية الكيان التي تتخذ من النصوص التي تم إنشاؤها، قد يكون متريا أوتوماتيا مثل المرء المقترح هنا أكثر موثوقية، حيث كان أقل عرضية وأكثر ركزا على اللفظ الصحيح للمدخلات، من تدابير التقييم البشرية.
تعد إجراءات تخليق علوم المواد مجالا واعدا ل NLP العلمي، حيث يمكن أن توفر النمذجة المناسبة لهذه الوصفات نظرة ثاقبة في طرق جديدة لإنشاء المواد. ومع ذلك، فإن التحدي الأساسي في بناء نماذج استخراج المعلومات لإجراءات توليف علوم المواد هو الحصول على ملصقات دقيقة للمواد والعمليات والكيانات الأخرى في تلك الإجراءات. نقدم إحدى كائنات كيان جديدة تذكر التعليقات التوضيحية أكثر من 595 نصية إجرائية تخليق علوم المواد (157،488 رمزا)، والتي توسع بشكل كبير بيانات التدريب المتاحة لمهمة التعرف على الكيان المسمى. نحن نبحث عن مخزون جديد لملفات جديدة مصممة لتوفير شروح متسقة ونهج شرح جديد يهدف إلى زيادة سرعة اتساق وخبراء المجال. تشير دراسات الاتفاقية المشتركة بين النقدية ونماذج الأساس المدربين على البيانات إلى أن كوربوس يوفر شروحا عالية الجودة من هذه الأنواع. تساعد هذه Corpus في وضع أساس النمذجة عالية الجودة في المستقبل لإجراءات التجميعية.
إن إزالة الكيانات المسماة (NED)، والتي تنطوي على رسم الخرائط النصية للكيانات الهيكلية، تحديا بشكل خاص في المجال الطبي بسبب وجود كيانات نادرة.تقتصر الأساليب الحالية بوجود الموارد الهيكلية الخشونة في قواعد المعرفة الطبية الحيوية وكذلك استخدام مجموعات ا لبيانات التدريبية التي توفر تغطية منخفضة على الموارد غير الشائعة.في هذا العمل، نتعلم هذه المشكلات من خلال اقتراح طريقة تكامل بيانات عبر المجال التي تنقل المعرفة الهيكلية من قاعدة معارف النص العامة إلى المجال الطبي.نحن نستخدم مخطط الاندماج لدينا لزيادة الموارد الهيكلية وتوليد مجموعة بيانات كبيرة بييوميديا للأحاد المحاكمة.يحقق نموذج عائليتنا مع المعرفة الهيكلية المحقونة أداء حديثة على مجموعة بيانات القياس الطبية القياسية: التوصيلات و BC5CDR.علاوة على ذلك، فإننا نحسن الغموض من كيانات نادرة تصل إلى 57 نقطة دقة.
التنبؤ بالعلامة المستنيرة عن مجموعة من النصوص وقواعد المعرفة المنوية، يجمع بين إكمال الرسوم البيانية المعرفة مع استخراج العلاقات، هي مهمة درس صغيرة نسبيا.النظام الذي يمكن أن يؤدي هذه المهمة له القدرة على تمديد مجموعة تعسفية من جداول قاعدة البيانات ال علائقية مع المعلومات المستخرجة من Corpus Document.يتناول OpenKi [1] هذه المهمة من خلال استخراج الكيانات المسماة ويستند عبر أدوات Openie، ثم تعلم تضمين العلاقات من الرسم البياني لعلاقة الكيانات الناتجة عن التنبؤ بالعلاقة، مما يتفوق على النهج السابقة.نقدم امتدادا من Openki الذي يشتمل على مذكرات من التمثيلات القائمة على النصوص للكيانات والعلاقات.نوضح أن هذا يؤدي إلى زيادة كبيرة في الأداء على نظام دون هذه المعلومات.
الملخص ندرس التعلم التعرف على الكيان المسمى في وجود التعليقات التوضيحية في الكيان المفقود.نحن نقترب من هذا الإعداد باسم وضع علامات مع المتغيرات الكامنة واقتراح خسارة جديدة، ونسبة الكيان المتوقعة، لتعلم النماذج بحضور العلامات المفقودة بشكل منهجي.نظرا لأن نهجنا صوتي من الناحية النظرية ومفيدة تجريبيا.تجريفيا، نجد أنه يجتمع أو يتجاوز أداء خطوط أساس قوية وحديثة من بين الفنون عبر مجموعة متنوعة من اللغات والسيناريوهات التوضيحية ومبالغ البيانات المسمى.على وجه الخصوص، نجد أنه يتفوق بشكل كبير على الطرق السابقة من الأساليب السابقة من Mayhew et al.(2019) ولي وآخرون.(2021) بواسطة +12.7 و +2.3 F1 النتيجة في بيئة صعبة مع فقط 1000 عرض توضيحية متحيزة، بلغ متوسطها عبر 7 مجموعات من مجموعات البيانات.نظهر أيضا أنه عندما يقترن نهجنا، فإن مخطط التعليق التوضيحي رواية متفوقة تفوق التعليق التوضيحي الشامل لميزانيات التوضيحية المتواضعة

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا