في دلالات معجمية، يتم علاج تجزئة الجملة الكاملة ووضع القطاع من الظواهر المختلفة بشكل عام بشكل منفصل، على الرغم من الترابط.نحن نفترض أن مهمة الاعتراف الدلالية المعتمدة الموحدة هي وسيلة فعالة لتغليف الأساليب التوضيحية سابقا من التوضيحية، بما في ذلك التعبير / التصنيف التعبير المتعدد الكلمات والعلامات الفائقة.باستخدام Streusle Corpus، نربط تسلسل CRF العصبي Tagger وتقييم أدائه على طول محاور مختلفة من التوضيحية.نظرا لأن مجموعة العلامات تعميم تعميم المهام السابقة (PARSEME، DIMSUM)، فإننا نتقييم بالإضافة إلى ذلك مدى جودة تعميم النموذج إلى مجموعات الاختبار هذه، وإيجاد أنها تقترب أو تجاوز النماذج الحالية على الرغم من التدريب فقط على Streusle.ينشئ عملنا أيضا نماذج أساسية ومقاييس التقييم لنمذجة متكاملة ودقيقة للدلالات المعجمية، مما يسهل العمل في المستقبل في هذا المجال.
In lexical semantics, full-sentence segmentation and segment labeling of various phenomena are generally treated separately, despite their interdependence. We hypothesize that a unified lexical semantic recognition task is an effective way to encapsulate previously disparate styles of annotation, including multiword expression identification / classification and supersense tagging. Using the STREUSLE corpus, we train a neural CRF sequence tagger and evaluate its performance along various axes of annotation. As the label set generalizes that of previous tasks (PARSEME, DiMSUM), we additionally evaluate how well the model generalizes to those test sets, finding that it approaches or surpasses existing models despite training only on STREUSLE. Our work also establishes baseline models and evaluation metrics for integrated and accurate modeling of lexical semantics, facilitating future work in this area.
المراجع المستخدمة
https://aclanthology.org/
تقترح هذه الدراسة نهجا نطق في موقف الكلام لنموذج التعرف على قانون الحوار العصبي القائم على الشبكة (دار)، مما يشتمل على الترميز الموضعي للموقف المطلق أو النسبي للكلام.النهج المقترح مستوحى من الملاحظة أن بعض أعمال الحوار لها اتجاهات مناصب الحدوث.تبين ا
تقدم هذه الورقة توقعات إطارات دلالية، وهي مهمة تتوقع الإطارات الدلالية التي ستحدث في الجمل العشرة أو 100 أو حتى 1000 شخص في قصة تشغيل. ركز العمل السابق على التنبؤ بالمستقبل الفوري للقصة، مثل واحد إلى بعض الأحكام المقبلة. ومع ذلك، عندما يكتب الروائيون
يمكن أن تكون كمية المعلومات المتاحة عبر الإنترنت ساحقة للمستخدمين من هضمها، خاصة عند التعامل مع تعليقات المستخدمين الآخرين عند اتخاذ قرار بشأن شراء منتج أو خدمة. في هذا السياق، تكون أنظمة تلخيص الرأي ذات قيمة كبيرة، واستخراج معلومات مهمة من النصوص وت
من الصعب معالجة وسائل التواصل الاجتماعي لأدوات معالجة اللغة الطبيعية القائمة، بسبب الأخطاء الإملائية، والكلمات غير القياسية، والتقصاصات، والرسملة غير القياسية وعلامات الترقيم.إحدى الطرق للتحايل على هذه المشكلات هي تطبيع بيانات الإدخال قبل المعالجة.رك
مجردة أننا نعتمد وجهة نظر تطورية حول تغيير اللغة التي تؤثر العوامل المعرفية (بالإضافة إلى الخدمات الاجتماعية) على لياقة الكلمات ونجاحها في النظام الإيكولوجي اللغوي.على وجه التحديد، نقترح مجموعة متنوعة من العوامل النفسية --- الدلالية، التوزيع، والفونو