نهج تحرير النص إلى تجزئة الكلمات اليابانية المشتركة، وعلامات نقاط البيع والتطبيع المعجمي


الملخص بالعربية

تعد التطبيع المعجمي، بالإضافة إلى تقسيم الكلمات وعلامات جزء من الكلام، مهمة أساسية لمعالجة النصية اليابانية التي أنشأها المستخدم.في هذه الورقة، نقترح نموذج تحرير النصوص لحل المهمة الثلاثة المشتركة وطرق توليد البيانات المسمى Pseudo للتغلب على مشكلة نقص البيانات.أظهرت تجاربنا أن النموذج المقترح حقق أداء تطبيع أفضل عند التدريب على بيانات أكثر تنوعا المصممة بالقطرات.

المراجع المستخدمة

https://aclanthology.org/

تحميل البحث