ترغب بنشر مسار تعليمي؟ اضغط هنا

التمييز الجنسي من Polysemy في Waldnets: الإنجليزية والإسبانية والأسماء البولندية

Discriminating Homonymy from Polysemy in Wordnets: English, Spanish and Polish Nouns

233   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح طريقة رواية من التمييز المجنس - Polysemy لثلاثة لغات الهند الهندية (الإنجليزية والإسبانية والبولندية).تم استخدام آلات Vector Support واستخدام الانحدار اللوجستي لاسو بنجاح في هذه المهمة، مما يتفوق على الأساس.تم استخدام مجموعة الميزات خصائص Lemma وأشابه لمعان ومسافات الرسم البياني وأنماط Polysemy.تؤدي نماذج ML المقترحة بشكل جيد على قدم المساواة باللغة الإنجليزية واللغتين الأخرى (تشكل مجموعات بيانات الاختبار).لا استبعدت الخوارزميات معظم حالات شنيعها فحسب، بل كانت أيضا فعالة في التمييز بين الدوران الدلالي الوثيق وغير المباشر.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقرر ما إذا كانت كلمة غامضة من الناحية الدلوية مجهبة أو polysemous تعادل إنشاء ما إذا كان لديه أي زوج من الحواس غير المرتبط بهليا.نقدم طرق جديدة لهذه المهمة التي تستفيد من المعلومات من الموارد المعجمية متعددة اللغات.نحن نثبت رسميا الخصائص النظرية الت ي توفر الأساس لأساليبنا.على وجه الخصوص، نوضح كيف يتبعه المراسل المركزي لكل فرضية للترجمة في Hauer و Kondrak (2020A) من خصائص Synet التي صاغها Hauer و Kondrak (2020B).يوضح التقييم التجريبي أن نهجنا يحدد حالة من الفن الجديد للكشف الجنسي.
أحد الجوانب المركزية لنماذج اللغة السياقية هو أنه ينبغي أن يكون قادرا على التمييز بين معنى الكلمات الغامضة من قبل سياقاتهم. في هذه الورقة، نقوم بالتحقيق في مدى تشكيلات الكلمات السياقية التي تشكل تعدد التعدد المعني بالضمان التقليدي من Polysemy ومجهلي. تحقيقا لهذه الغاية، نقدم مجموعة بيانات ممتدة ومشروحة للإنسان من التشابه بين الكلمة المعززة ومقبولية التعاونية، وتقييم مدى جودة تشابه المضبوط يتوقع التشابه في المعنى. تشير كلا النوعين من الأحكام البشرية إلى أن تشابه تفسيرات البلاثي يسقط في متواصل بين هوية المعنى والمجانسة. ومع ذلك، نلاحظ أيضا اختلافات كبيرة في تصنيفات التشابه من PolySemes، وتشكيل أنماط ثابتة لأنواع مختلفة من بديل الشعور بالسلاسة. وهكذا يبدو أن مجموعة البيانات الخاصة بنا هي التقاط جزء كبير من تعقيد الغموض المعجمي، ويمكن أن توفر سرير اختبار واقعي للمشروعات السياقية. من بين النماذج التي تم اختبارها، تظهر بيرت كبيرة أقوى ارتباطا مع تصنيفات تشابه تشابه الكلمة المجمعة، ولكن النضالات لتكرار أنماط التشابه الملاحظة باستمرار. عند تجميع نماذج كلمات غامضة تستند إلى ادباتهم، يعرض النموذج ثقة عالية في تماثيل متفائل وبعض أنواع بدائل البلاستيك، ولكن يفشل باستمرار للآخرين.
تعد استعادة الترقيم متطلبات أساسية لقراءة النص المستمدة من أنظمة التعرف على الكلام التلقائي (ASR). تقتصر معظم الحلول المعاصرة على التنبؤ ببعض العلامات التي تحدث بشكل متكرر، مثل الفترات والفواصل وعلامات الاستفهام - وفقط واحد لكل كلمة. ومع ذلك، في لغة مكتوبة، نتعامل مع عدد أكبر بكثير من أحرف علامات الترقيم (مثل الأقواس الواصلية، وما إلى ذلك)، ومجموعاتها (مثل الأقواس متبوعة ب DOT). لا يمكن دائما تقليل علامات الترقيم هذه بشكل لا لبس فيه إلى مجموعة أساسية من العلامات الأكثر تدويرا. في هذا العمل، نقيم عدة طرق في مهمة إعادة إعمار علامات الترقيم الشاملة. نحن نقوم بإجراء تجارب على الفورما المتوازي لغغتين مختلفتين، والإنجليزية والبولندية - اللغات مع التشكل البسيط والمعقد نسبيا، على التوالي. نحن نحقق أيضا في تأثير بناء نموذج على علامات ترقيم شاملة حول جودة مهام ترقيم الترقيم الأساسية
على الرغم من التطورات الحديثة في الدور الدوالي الذي يدفعه ترميز النص المدرب مسبقا مثل بيرت، فإن الأداء يتخلف عند تطبيقه على المسندات لاحظ بشكل غير منتظم أثناء التدريب أو إلى الجمل في مجالات جديدة. في هذا العمل، يمكننا التحقيق في كيفية تحسين أداء وضع العلامات على الدوران المنخفض التردد والبيانات خارج نطاق البيانات باستخدام Verbnet، معجم فعل يضم الأفعال إلى فئات هرمية تستند إلى سلوك النحوية والدلية المشتركة وتحدد التمثيل الدلالي وصف العلاقات بين الحجج. نجد أن فئات Verbnet توفر مستوى فعال من التجريد، وتحسين التعميم على المساكن المنخفض التردد من خلال السماح لهم بالتعلم من الأمثلة التدريبية للندوات الأخرى المنتمدة إلى نفس الفصل. نجد أيضا أن التدريب المشترك لعلامات الدور الحرفية والأزهار المسند للفئات الحرفية للأفعال البسيطة يؤدي إلى تحسينات في كلا المهام، مما يدعم بشكل طبيعي استخراج التمثيلات الدلالية في فيربيت.
في هذه الورقة، نقارن قواميس Oxford Lexico و Merriam Webster مع Princeton Wordnet فيما يتعلق بوصف التشابه الدلالي (DIS) بين الحواس PolySemous والمجتلسة التي يمكن استنتاجها منها.تفتقر WordNET إلى أي وصف صريح من PolySemy أو الجنسية، ولكن كشبكة من الحواس المرتبطة، قد يتم استخدامها لحساب المسافات الدلالية بين حواس الكلمات.لمقارنة Wordnet مع القواميس، فإننا حولنا عينة من المجهرية من المجهرية للأخير إلى الرسوم البيانية والربط بينهم مع حواس ما يعادل السابقين.وجدنا أن القواميس في اتفاق مرتفع مع بعضها البعض، إذا كان المرء يعتبر polysemy والمجهلي تماما، وفي التمويل المعتدل، إذا كان المرء يركز فقط على أوصاف Polysemy.أعطى قياس أقصر أطوال مسارات على WordNET النتائج قابلة للمقارنة مع تلك الموجودة على القواميس في التنبؤ بالانتفاضة الدلالية بين الحواس Polysemous، لكنها كانت أقل استشارة مع الاعتراف بالمجازمة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا