توليد القصة هي مهمة مفتوحة وعشرية، مما يشكل تحديا لتقييم نماذج جيل القصة.نقدم اختبار المغامرة الخاصة بك، إعداد الكتابة التعاوني لتقييم نموذج الزوجي.تولد طرازان اقتراحات للناس لأنهم يكتبون قصة قصيرة؛نطلب من الكتاب اختيار أحد الاقتراحين، ونحن نلاحظ اقتراحات النموذج التي يفضلونها.كما يتيح الإعداد أيضا إجراء مزيد من التحليل بناء على المراجعات التي يقوم بها الناس إلى الاقتراحات.نظظ أن هذه التدابير، إلى جانب المقاييس التلقائية، توفر صورة إعلامية لأداء النماذج، سواء في الحالات التي تكون فيها الاختلافات في طرق التوليد صغيرة (عينة من أعلى النواة مقابل Top-K) وكبير (نماذج Fusion Fusion)وبعد
Story generation is an open-ended and subjective task, which poses a challenge for evaluating story generation models. We present Choose Your Own Adventure, a collaborative writing setup for pairwise model evaluation. Two models generate suggestions to people as they write a short story; we ask writers to choose one of the two suggestions, and we observe which model's suggestions they prefer. The setup also allows further analysis based on the revisions people make to the suggestions. We show that these measures, combined with automatic metrics, provide an informative picture of the models' performance, both in cases where the differences in generation methods are small (nucleus vs. top-k sampling) and large (GPT2 vs. Fusion models).
المراجع المستخدمة
https://aclanthology.org/
يقارن تقييم نماذج الرد على الأسئلة التوضيحية حول التوقعات النموذجية. ومع ذلك، اعتبارا من اليوم، فإن هذه المقارنة تعتمد في الغالب معجمية، وبالتالي تفتقد الإجابات التي لا تحتوي على تداخل جذري ولكن لا تزال مماثلة متشابهة دلالة، وبالتالي علاج الإجابات ال
أظهرت الدراسات الحديثة أن نظام التحيز في نظام اقتراحات Thetext يمكن أن ينشر في كتابة المشروع.في هذه الدراسة التجريبية، نطلب من TheQuestion: كيف يتفاعل الناس مع نماذج الإشراطات النصية النصية، في Inline Next Threase Sugges-Tion واجهة وكيفية إدخال تحيز
استولت رواية القصص الآلية منذ فترة طويلة اهتمام الباحثين في كل من الروايات في الحياة اليومية.تظهر أفضل القصص المصنوعة من قبل الإنسان مؤامرة متماسكة، وأحرف قوية، والالتزام بالأنواع، والأسماك التي لا تزال الدول الحالية من الفن لا تزال تكافح من أجل إنتا
النماذج التركيبية المنظمة جذابة لأنها تتحلل صراحة المشاكل وتوفير مخرجات متوسطة تفسير تفسر الثقة في أن النموذج ليس مجرد إزالته على القطع الأثرية للبيانات. ومع ذلك، فإن تعلم هذه النماذج صعبة، ومع ذلك، نظرا لأن الإشراف على المهمة النهائية يوفر فقط إشارة
جيل القصة هي مهمة تهدف إلى إنشاء قصة ذات مغزى تلقائيا. هذه المهمة صعبة لأنها تتطلب فهما رفيع المستوى للمعنى الدلالي للجمل والسببية لأحداث القصة. تفشل نماذج NaiveSequence-To-Stuncence عموما في الحصول على هذه المعرفة، حيث يصعب ضمان صحة منطقية في نموذج