لإمكانية النمط الكامل لقدرة الإنسان التي تشبه الإنسان على طرح الأسئلة، يجب أن تكون نماذج توليد السؤال التلقائي (QG) قادرة على إنتاج تعبيرات متعددة من نفس السؤال مع مستويات مختلفة من التفاصيل. لسوء الحظ، لا تتضمن مجموعات البيانات الحالية المتاحة لتعلم QG إعادة الصياغة أو الاختلافات السؤال التي تؤثر على قدرة النموذج على تعلم هذه القدرة. نقدم التنوب، مجموعة بيانات تحتوي على إعادة كتابة من الحقائق التي تم إنشاؤها من قبل الإنسان من بيانات الفريق المستخدمة على نطاق واسع لمعالجة هذا القيد. تم الحصول على أسئلة في التنوب عن طريق الجمع بين سؤال معين مع حقائق من الكيانات المشار إليها في السؤال. نحن ندرس نموذج فك التشفير المزدوج ومولد السؤال المحدد لحقيقة (FIQG)، لتعلم إنشاء أسئلة غير ضيقة من الواقع من سؤال معين. تظهر النتائج التجريبية أن FIQG يشتمل بفعالية على معلومات من الحقائق لإضافة المزيد من التفاصيل لسؤال معين. إلى حد علمنا، لدينا هي الدراسة الأولى لتقديم ضخ الحقائق كأشكال جديدة من إعادة صياغة الأسئلة.
To fully model human-like ability to ask questions, automatic question generation (QG) models must be able to produce multiple expressions of the same question with different levels of detail. Unfortunately, existing datasets available for learning QG do not include paraphrases or question variations affecting a model's ability to learn this capability. We present FIRS, a dataset containing human-generated fact-infused rewrites of questions from the widely-used SQuAD dataset to address this limitation. Questions in FIRS were obtained by combining a given question with facts of entities referenced in the question. We study a double encoder-decoder model, Fact-Infused Question Generator (FIQG), for learning to generate fact-infused questions from a given question. Experimental results show that FIQG effectively incorporates information from facts to add more detail to a given question. To the best of our knowledge, ours is the first study to present fact-infusion as a novel form of question paraphrasing.
المراجع المستخدمة
https://aclanthology.org/
في توليد السؤال، يجب أن يكون السؤال الناتج يرتبطا جيدا وغالبا ما يتعلق بالإجابة بمثابة المدخلات. استمتعت أساليب الجيل العصبي في الغالب بالدليل التوزيعي للكلمات كإجراءات ذات معنى وتوليد أسئلة واحدة في وقت واحد. في هذه الورقة، نستكشف إمكانية الترميزات
في التعليم، أصبحت أسئلة الاختبار أداة مهمة لتقييم معرفة الطلاب.ومع ذلك، فإن إعداد هذه الأسئلة يدويا هو مهمة مملة، وبالتالي تم اقتراح توليد السؤال التلقائي كديل ممكن.حتى الآن، ركزت الغالبية العظمى من الأبحاث على توليد نص الأسئلة، والاعتماد على سؤال حو
توليد أزواج الإجابة ذات الجودة العالية هي مهمة صلبة ولكنها ذات مغزى. على الرغم من أن الأعمال السابقة قد حققت نتائج رائعة حول توليد الأسئلة على دراية بالإجابة، فمن الصعب تطبيقها في تطبيق عملي في مجال التعليم. تتناول هذه الورقة لأول مرة مهمة توليد زوج
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا
بدافع من جيل السؤال المقترح في أنظمة توصية أخبار المحادلات، نقترح نموذجا لتوليد أزواج الإجابات السؤال (أزواج ضمان الجودة) مع أسئلة ذاتية التركيز ذاتي ومقيد الطول، إجابات تلخص المادة.نبدأ بجمع مجموعة بيانات جديدة من المقالات الإخبارية مع أسئلة كعناوين