اكتسبت المهام المورفولوجية شعبية لائقة داخل مجتمع NLP في السنوات الأخيرة، حيث توفر مجموعات بيانات كبيرة متعددة اللغات تحليلا مورفولوجي للكلمات، إما في أو خارج السياق. ومع ذلك، فإن الافتقار إلى تعريف لغوي واضح للكلمات ديطات العمل التلقيح غير مكتمل واجب في التناقضات، لا سيما عبر اللغوية. في هذا العمل، نقوم بتوسيع الانعكاسات المورفولوجية للكلمات لإنقاذ الجمل لتوفير عالمية حقيقية منفصلة عن تقاليد هربيا لاستخدام المساحة البيضاء. للسماح بإلقاء التوضيح عن انعطاف الجملة، نحدد مخططا شرحا مورفولوجي بواسطة مجموعة ثابتة من ميزات الانهيار. نقدم مجموعة بيانات صغيرة عبر اللغوية بما في ذلك جمل بسيطة نصف تم إنشاؤها بشكل دائم في 4 لغات متنوعة من الناحية النموذجية المشروح وفقا لمخططنا المقترح، وإظهار أن مهمة إعادة انتقالة يصعب بشكل كبير ولكن تغيير النطاق من الكلمات إلى محددة بشكل جيد الجمل تسمح الواجهة مع نماذج اللغة السياقية.
Morphological tasks have gained decent popularity within the NLP community in the recent years, with large multi-lingual datasets providing morphological analysis of words, either in or out of context. However, the lack of a clear linguistic definition for words destines the annotative work to be incomplete and mired in inconsistencies, especially cross-linguistically. In this work we expand morphological inflection of words to inflection of sentences to provide true universality disconnected from orthographic traditions of white-space usage. To allow annotation for sentence-inflection we define a morphological annotation scheme by a fixed set of inflectional features. We present a small cross-linguistic dataset including semi-manually generated simple sentences in 4 typologically diverse languages annotated according to our suggested scheme, and show that the task of reinflection gets substantially more difficult but that the change of scope from words to well-defined sentences allows interface with contextualized language models.
References used
https://aclanthology.org/
Pronunciation lexicons and prediction models are a key component in several speech synthesis and recognition systems. We know that morphologically related words typically follow a fixed pattern of pronunciation which can be described by language-spec
Arabic sentiment analysis research existing currently is very limited. While sentiment analysis has many applications in English, the Arabic language is still recognizing its early steps in this field. In this paper, we show an application
on Arabic
Document-level event extraction is critical to various natural language processing tasks for providing structured information. Existing approaches by sequential modeling neglect the complex logic structures for long texts. In this paper, we leverage
Framing a news article means to portray the reported event from a specific perspective, e.g., from an economic or a health perspective. Reframing means to change this perspective. Depending on the audience or the submessage, reframing can become nece
Discourse segmentation and sentence-level discourse parsing play important roles for various NLP tasks to consider textual coherence. Despite recent achievements in both tasks, there is still room for improvement due to the scarcity of labeled data.