نقترح طريقة رواية من التمييز المجنس - Polysemy لثلاثة لغات الهند الهندية (الإنجليزية والإسبانية والبولندية).تم استخدام آلات Vector Support واستخدام الانحدار اللوجستي لاسو بنجاح في هذه المهمة، مما يتفوق على الأساس.تم استخدام مجموعة الميزات خصائص Lemma وأشابه لمعان ومسافات الرسم البياني وأنماط Polysemy.تؤدي نماذج ML المقترحة بشكل جيد على قدم المساواة باللغة الإنجليزية واللغتين الأخرى (تشكل مجموعات بيانات الاختبار).لا استبعدت الخوارزميات معظم حالات شنيعها فحسب، بل كانت أيضا فعالة في التمييز بين الدوران الدلالي الوثيق وغير المباشر.
We propose a novel method of homonymy-polysemy discrimination for three Indo-European Languages (English, Spanish and Polish). Support vector machines and LASSO logistic regression were successfully used in this task, outperforming baselines. The feature set utilised lemma properties, gloss similarities, graph distances and polysemy patterns. The proposed ML models performed equally well for English and the other two languages (constituting testing data sets). The algorithms not only ruled out most cases of homonymy but also were efficacious in distinguishing between closer and indirect semantic relatedness.
المراجع المستخدمة
https://aclanthology.org/
تقرر ما إذا كانت كلمة غامضة من الناحية الدلوية مجهبة أو polysemous تعادل إنشاء ما إذا كان لديه أي زوج من الحواس غير المرتبط بهليا.نقدم طرق جديدة لهذه المهمة التي تستفيد من المعلومات من الموارد المعجمية متعددة اللغات.نحن نثبت رسميا الخصائص النظرية الت
أحد الجوانب المركزية لنماذج اللغة السياقية هو أنه ينبغي أن يكون قادرا على التمييز بين معنى الكلمات الغامضة من قبل سياقاتهم. في هذه الورقة، نقوم بالتحقيق في مدى تشكيلات الكلمات السياقية التي تشكل تعدد التعدد المعني بالضمان التقليدي من Polysemy ومجهلي.
تعد استعادة الترقيم متطلبات أساسية لقراءة النص المستمدة من أنظمة التعرف على الكلام التلقائي (ASR). تقتصر معظم الحلول المعاصرة على التنبؤ ببعض العلامات التي تحدث بشكل متكرر، مثل الفترات والفواصل وعلامات الاستفهام - وفقط واحد لكل كلمة. ومع ذلك، في لغة
على الرغم من التطورات الحديثة في الدور الدوالي الذي يدفعه ترميز النص المدرب مسبقا مثل بيرت، فإن الأداء يتخلف عند تطبيقه على المسندات لاحظ بشكل غير منتظم أثناء التدريب أو إلى الجمل في مجالات جديدة. في هذا العمل، يمكننا التحقيق في كيفية تحسين أداء وضع
في هذه الورقة، نقارن قواميس Oxford Lexico و Merriam Webster مع Princeton Wordnet فيما يتعلق بوصف التشابه الدلالي (DIS) بين الحواس PolySemous والمجتلسة التي يمكن استنتاجها منها.تفتقر WordNET إلى أي وصف صريح من PolySemy أو الجنسية، ولكن كشبكة من الحواس