في لغات parataxis مثل الصينية، يتم بناء معاني الكلمات باستخدام تكوينات كلمات محددة، والتي يمكن أن تساعد في إزالة حواس الكلمات.ومع ذلك، نادرا ما يتم استكشاف هذه المعرفة في أساليب Disambiguation Sense (WSD) السابقة.في هذه الورقة، نقترح نفايات المعرفة بتكوين النصوص لتعزيز WSD الصيني.نحن أولا بناء مجموعة بيانات WSD الصينية على نطاق واسع مع تكوينات الكلمات.بعد ذلك، نقترح نموذج صيغة نموذجية لإدماج تكوين الكلمات بشكل صريح في حالة إزالة الغموض.لتعزيز التعميم، نقوم بتصميم وحدة تنقية تكوين كلمة في حالة تعويض تكوين كلمة غير متوفرة.تظهر النتائج التجريبية أن طريقتنا تجلب تحسن كبير في الأداء على خطوط خطوط خطوط خطوط طويلة.
In parataxis languages like Chinese, word meanings are constructed using specific word-formations, which can help to disambiguate word senses. However, such knowledge is rarely explored in previous word sense disambiguation (WSD) methods. In this paper, we propose to leverage word-formation knowledge to enhance Chinese WSD. We first construct a large-scale Chinese lexical sample WSD dataset with word-formations. Then, we propose a model FormBERT to explicitly incorporate word-formations into sense disambiguation. To further enhance generalizability, we design a word-formation predictor module in case word-formation annotations are unavailable. Experimental results show that our method brings substantial performance improvement over strong baselines.
المراجع المستخدمة
https://aclanthology.org/
تظهر الأبحاث الحديثة أن النماذج المدربة مسبقا (PTMS) مفيدة تجزئة الكلمات الصينية (CWS).ومع ذلك، فإن PTMS المستخدمة في الأعمال السابقة عادة ما تعتمد نمذجة اللغة كامرأة تدريبية مسبقا، تفتقر إلى معرفة تجزئة مسبقة خاصة بمهام المهام وتجاهل التناقض بين مها
عادة ما تحقق الأساليب الخاضعة للإشراف أفضل أداء في مشكلة غموض معنى الكلمة.ومع ذلك، فإن عدم توفر إحساس كبير مشروح بالنسبة للعديد من اللغات منخفضة الموارد يجعل هذه الأساليب غير قابل للتطبيق لها في الممارسة العملية.في هذه الورقة، نقوم بتخفيف هذه المشكلة
التحديد التركيز هو مهمة مقترحة حديثا تركز على اختيار الكلمات للتأكيد في جمل قصيرة.الطريقة التقليدية تنظر فقط في معلومات التسلسل من الجملة مع تجاهل هيكل الجملة الغنية ومعلومات علاقة الكلمة.في هذه الورقة، نقترح إطارا جديدا يعتبر هيكل الجملة عبر رسم بيا
أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض
التحيز بين الجنسين في Adgeddings تصبح تدريجيا حقل بحثي حية في السنوات الأخيرة.تهدف معظم الدراسات في هذا المجال إلى أساليب القياس والدولي مع اللغة الإنجليزية كلغة الهدف.تحقق هذه الورقة في التحيز بين الجنسين في تضيير كلمة ثابتة من منظور فريد من منظور ص