توقعات الإطار الدلالي


الملخص بالعربية

تقدم هذه الورقة توقعات إطارات دلالية، وهي مهمة تتوقع الإطارات الدلالية التي ستحدث في الجمل العشرة أو 100 أو حتى 1000 شخص في قصة تشغيل. ركز العمل السابق على التنبؤ بالمستقبل الفوري للقصة، مثل واحد إلى بعض الأحكام المقبلة. ومع ذلك، عندما يكتب الروائيون قصص طويلة، فإن توليد بعض الجمل لا يكفي لمساعدتهم على اكتساب نظرة ثاقبة رفيعة المستوى لتطوير قصة المتابعة. في هذه الورقة، نقوم بصياغة قصة طويلة كسلسلة من كتل القصة، "حيث تحتوي كل كتلة على عدد ثابت من الجمل (E.G.، 10 أو 100، أو 200). يسمح لنا هذه الصياغة بالتنبؤ بقص القصة المتابعة تتجاوز نطاق بعض الجمل. نحن نمثل كتلة قصة باستخدام الترددات المصطلح (TF) من الإطارات الدلالية فيها، وتطبيعها من خلال تردد المستندات العكسية لكل إطار (IDF). نجري تجارب توقعات دلالية للإطار على 4794 كتابا من Bookcorpus و 7،962 من الملخصات العلمية من CODA-19، مع أحجام الكتلة تتراوح بين 5 إلى 1000 جمل. تظهر النتائج أن النماذج الآلية يمكن أن تتوقع كتل قصة المتابعة أفضل من خطوط الأساس العشوائية السابقة والإعادة، مما يشير إلى جدوى المهمة. نتعلم أيضا أن النماذج التي تستخدم تمثيل الإطار كيزات تفوق جميع الأساليب الموجودة عندما يكون حجم الكتلة أكثر من 150 جمل. يوضح التقييم البشري أيضا تمثيل الإطار المقترح، عند تصوره كدولة كلمة، مفهومة وممثلا ومحددة للبشر.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث