ترغب بنشر مسار تعليمي؟ اضغط هنا

النمذجة جملة محسنة من الإطار الدلالي

Frame Semantic-Enhanced Sentence Modeling for Sentence-level Extractive Text Summarization

394   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تهدف تلخيص النص الاستخراجي على مستوى الجملة إلى تحديد جمل مهمة من وثيقة معينة.ومع ذلك، فإن الأمر صعب للغاية لنموذج أهمية الجمل.في هذه الورقة، نقترح نمذجة جملة محسنة من الإطار الدلالي على الرواية لتلخيص الاستخراج، والتي ترفع دلالات الإطار لنموذج الجمل من كل من مستوى الجملة داخل الجملة ومستوى الجملة بين الجملة، مما يسهل مهمة تلخيص النص.على وجه الخصوص، ترفع دلالات المستوى داخل الجملة عناصر الإطارات وإطار العناصر لنموذج الهيكل الدلالي الداخلي في غضون جملة، في حين أن دلالات مستوى المستوى بين الجملة تستفيد العلاقات بالإطار إلى الإطارات إلى العلاقات النموذجية بين الجمل.تثبت تجارب واسعة على اثنين من Corpus Corpus CNN / DM و NYT أن نموذجنا يتفوق على ستة أساليب حديثة بشكل كبير.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه الورقة توقعات إطارات دلالية، وهي مهمة تتوقع الإطارات الدلالية التي ستحدث في الجمل العشرة أو 100 أو حتى 1000 شخص في قصة تشغيل. ركز العمل السابق على التنبؤ بالمستقبل الفوري للقصة، مثل واحد إلى بعض الأحكام المقبلة. ومع ذلك، عندما يكتب الروائيون قصص طويلة، فإن توليد بعض الجمل لا يكفي لمساعدتهم على اكتساب نظرة ثاقبة رفيعة المستوى لتطوير قصة المتابعة. في هذه الورقة، نقوم بصياغة قصة طويلة كسلسلة من كتل القصة، "حيث تحتوي كل كتلة على عدد ثابت من الجمل (E.G.، 10 أو 100، أو 200). يسمح لنا هذه الصياغة بالتنبؤ بقص القصة المتابعة تتجاوز نطاق بعض الجمل. نحن نمثل كتلة قصة باستخدام الترددات المصطلح (TF) من الإطارات الدلالية فيها، وتطبيعها من خلال تردد المستندات العكسية لكل إطار (IDF). نجري تجارب توقعات دلالية للإطار على 4794 كتابا من Bookcorpus و 7،962 من الملخصات العلمية من CODA-19، مع أحجام الكتلة تتراوح بين 5 إلى 1000 جمل. تظهر النتائج أن النماذج الآلية يمكن أن تتوقع كتل قصة المتابعة أفضل من خطوط الأساس العشوائية السابقة والإعادة، مما يشير إلى جدوى المهمة. نتعلم أيضا أن النماذج التي تستخدم تمثيل الإطار كيزات تفوق جميع الأساليب الموجودة عندما يكون حجم الكتلة أكثر من 150 جمل. يوضح التقييم البشري أيضا تمثيل الإطار المقترح، عند تصوره كدولة كلمة، مفهومة وممثلا ومحددة للبشر.
تم اعتماد الأساليب القائمة على الرسم البياني مؤخرا لتلخيص نص مبادرة.ومع ذلك، فإن الأساليب القائمة على الرسم البياني الموجودة فقط تنظر فقط في علاقات الكلمات أو معلومات الهيكل، والتي تهمل الارتباط بينهما.في وقت واحد التقاط علاقات الكلمة ومعلومات الهيكل من الجمل، نقترح شبكة الرسم البياني المزدوج الرواية لتلخيص جملة الاختيارات.على وجه التحديد، نقوم أولا بإنشاء رسم بياني للسيناريو الدلالي والكلمة الدلالية الرسم البياني على أساس FRAMENET، وبالتالي تعلم تمثيلاتها وطريقة الانصهار الرسم البياني للتصميم لتعزيز ارتباطها والحصول على تمثيل دلالي أفضل لجيل الملخص.تظهر النتائج التجريبية النموذج لدينا تفوق الأساليب الموجودة في مجموعة بيانات قياسية شعبية، I.E.، GIGAWORD و DUC 2004.
في هذه الورقة، ندرس تلخيص الجملة المبادرة.هناك ميزان معلومات أساسية يمكن أن تؤثر على جودة تلخيص الأخبار، والتي هي الكلمات الرئيسية للموضوع والهيكل المعرفي لنص الأخبار.علاوة على ذلك، فإن تشفير المعرفة الموجودة لديها أداء ضعيف في هيكل المعرفة بالقضاء ا لسريع.بالنظر إلى هذه، نقترح KAS، ومعرفة رواية وتحويل الكلمات الرئيسية المعزز بإطار تلخيص الجملة المبادرة.يتم استخدام Tri-Encoders لإدماج سياقات النص الأصلي وهيكل المعرفة وموضوع الكلمات الرئيسية في وقت واحد، مع بنية معرفة خطية خاصة.التقييمات التلقائية والبشرية تثبت أن KAS تحقق أفضل العروض.
يعد تحليل الإطار الدلالي مهمة تحليل دلالية تعتمد على Framenet التي تلقت اهتماما كبيرا مؤخرا.تتضمن المهمة عادة ثلاث مجموعات فرعية بالتتابع: (1) التعرف المستهدف، (2) تصنيف الإطار و (3) وصف الدور الدليمي.ترتبط المهارات الفرعية الثلاثة ارتباطا وثيقا أثنا ء وجود دراسات سابقة طرازها بشكل فردي، مما يتجاهل اتصالاتهم المتدربين، وفي الوقت نفسه يحث مشكلة نشر الأخطاء.في هذا العمل، نقترح نموذج عصبي نهاية إلى نهائي لمعالجة المهمة بشكل مشترك.بشكل ملموس، استغلنا طريقة قائمة على الرسم البياني، فيما يتعلق بتحليل الإطار الدلالي كمشكلة بناء الرسم البياني.يتم التعامل مع جميع المسندات والأدوار كجزء رسم بياني، ويتم أخذ علاقاتهم كحواف رسم بياني.نتائج التجربة على مجموعة بيانات قياسية من الإطار الدلالي تظهر أن طريقتنا تنافسية للغاية، مما يؤدي إلى أداء أفضل من نماذج خطوط الأنابيب.
تعتمد نماذج تلخيص الجماع بشكل كبير على آليات النسخ، مثل شبكة المؤشر أو الاهتمام، لتحقيق أداء جيد، تقاس بالتداخل النصي مع الملخصات المرجعية.نتيجة لذلك، تبقى الملخصات التي تم إنشاؤها بالقرب من التركيبات في المستند المصدر.نقترح نموذج * الحكم * نموذج لتو ليد المزيد من الملخصات الجماعية.يتضمن وحدة فك ترميز هرمي يقوم أولا بإنشاء تمثيل الجملة الموجزة التالية، ثم ظروف مولد Word على هذا التمثيل.إن ملخصاتنا الناتجة أكثر إشراك وفي الوقت نفسه تحقق درجات روج عالية عند مقارنتها بالملخصات المرجعية البشرية.نتحقق من فعالية قرارات التصميم لدينا بالتقييمات الواسعة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا