تقدم هذه الورقة Norecneg - مجموعة بيانات النفي الأولى المشروح للنرويجية.تم تفاح الإشارات النفي والعنوان الواحدة في الجملة عبر أكثر من 11 ألف جمل تمتد أكثر من 400 وثيقة لمجموعة فرعية من الاستعراض النرويجي Corpus (Norec).بالإضافة إلى تقديم مناقشة متعمقة للمبادئ التوجيهية التوضيحية، نقدم أيضا مجموعة أولى من النتائج القياسية المستندة إلى نهج بياني لتحليل الرسم البياني.
This paper introduces NorecNeg -- the first annotated dataset of negation for Norwegian. Negation cues and their in-sentence scopes have been annotated across more than 11K sentences spanning more than 400 documents for a subset of the Norwegian Review Corpus (NoReC). In addition to providing in-depth discussion of the annotation guidelines, we also present a first set of benchmark results based on a graph-parsing approach.
المراجع المستخدمة
https://aclanthology.org/
أصبح على الإنترنت على الإنترنت مصدر قلق متزايد للنساء العربيات الذين يعانون من سوء المعاملة على الإنترنت على أساس الجنس على أساس يومي. يمكن أن تساعد أنظمة الكشف الأوتوماتيكية في كراثيلي في حظر المحتوى السام العربي للمرأة. يتم إعاقة تطوير هذه النظم من
دقة النفي النفي هي مفتاح استخراج المعلومات عالية الجودة من النصوص السريرية، ولكن حتى الآن، كانت الجهود المبذولة لجعل المشفرين المستخدمة في نفي استخراج المعلومات، كانت تقتصر على اللغة الإنجليزية.نقدم نهجا عالميا لاستحقاق النرجب متعدد اللغات اللغوي، ال
أدوات البناء لإزالة المعلومات الحساسة مثل الأسماء الشخصية والعناوين وأرقام الهواتف - ما يسمى بالمعلومات الصحية المحمية (PHI) - من النص الحر الإكلينيكي هي مهمة مهمة لجعل النصوص السريرية متاحة للبحث. يجب تقييم هذه أدوات تحديد الهوية فيما يتعلق بجودتها
تقدم هذه الورقة StoryDB --- مجموعة بيانات واسعة متعددة اللغات من الروايات.StoryDB هي جثة من النصوص التي تضم قصص في 42 لغة مختلفة.تتضمن كل لغة 500+ قصص.تشمل بعض اللغات أكثر من 20 ألف قصة.يتم فهرسة كل قصة عبر اللغات والمسمى مع العلامات مثل النوع أو الم
أظهرت نماذج اختيار الاستجابة متعددة الدوران مؤخرا أداء مماثل للبشر في العديد من البيانات القياسية.ومع ذلك، في البيئة الحقيقية، غالبا ما تحتوي هذه النماذج على نقاط ضعف، مثل اتباع تنبؤات غير صحيحة تستند بشكل كبير على الأنماط السطحية دون فهم شامل للسياق