تصحيح النصوص الناتجة عن المحولات باستخدام ميزات الخطاب وتعدين الويب


الملخص بالعربية

يمكن أن تولد الأساليب الحديثة القائمة على المحولات إلى NLG مثل GPT-2 إنشاء نصوص أصلية متماسكة بشكل ملائم.ومع ذلك، فإن هذه النصوص التي تم إنشاؤها لها عيوب خطيرة: خطاب عالمي يتعارض مع الجمل من حيث قيم الكيان.نحن نتناول كل من هذه العيوب: أنها مستقلة ولكن يمكن دمجها لتوليد النصوص الأصلية التي ستكون متسقة وصادقة.تقدم هذه الورقة نهجا لتقدير جودة هيكل الخطاب.تؤكد النتائج التجريبية أن هيكل الخطاب للنصوص التي تم إنشاؤها حاليا غير دقيق.نقترح اتجاهات البحث لتصحيحه باستخدام ميزات الخطاب أثناء إجراء ضبط الدقيقة.النهج المقترح عالمي ويمكن تطبيقه على لغات مختلفة.بصرف النظر عن ذلك، نقترح طريقة لتصحيح قيم الكيان الخاطئة استنادا إلى تعدين الويب ومحاذاة النص.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث