تصف هذه الورقة نظامنا لمهمة SIGMORPHON 2021 المشتركة على تجميع النموذج المورفولوجي غير المقترح، والذي يطلب من المشاركين أن يثبتوا نماذج تم تأصيلهم معا وفقا ليمما الأساسي دون مساعدة من بيانات التدريب المشروح.نحن نوظف تجميع التجمعات التجمعات إلى مجموعة الكلمة معا باستخدام مقياس تقيي يجمع بين مسافة إلكترونية ومن المسافة الدلالية من Word Ageddings.نقوم بتجربة اثنين من الاختلافات في تحرير النموذج المستند إليه عن بعد لقياس المسافة الإلكترونية، ولكن نظرا لقيود الوقت، لا يتحسن نظامنا عبر النظام الأساسي للمهمة المشتركة.
This paper describes our system for the SIGMORPHON 2021 Shared Task on Unsupervised Morphological Paradigm Clustering, which asks participants to group inflected forms together according their underlying lemma without the aid of annotated training data. We employ agglomerative clustering to group word forms together using a metric that combines an orthographic distance and a semantic distance from word embeddings. We experiment with two variations of an edit distance-based model for quantifying orthographic distance, but, due to time constraints, our system does not improve over the shared task's baseline system.
المراجع المستخدمة
https://aclanthology.org/
يصف هذا العمل تقديم Edinburgh إلى المهمة Sigmorphon 2021 المشتركة 2 على تجميع النموذج المورفولوجي غير المقترح.إعطاء إدخال النص الخام، وكانت المهمة لتعيين كل رمز رمزية إلى كتلة مع الرموز الأخرى من نفس النموذج.نحن نستخدم تجزئة محول القواعد جنبا إلى جنب
نحن تصف مهمة Sigmorphon الثانية على التورفولوجيا غير المدعومة: الهدف من المهمة المشتركة SIGMORPHON 2021 على تجميع النماذج المورفولوجية غير المزدئة غير المنشأة هو أنواع الكلمات العنقودية من كوربوس نص الخام إلى النماذج.تحقيقا لهذه الغاية، نطلق سرورا لم
تصف هذه الورقة تقديم فريق CU-UBC لمهمة SIGMORPHON 2021 المشتركة 2: تجميع النماذج المورفولوجية غير المنصوص عليها.يولد نظامنا النماذج باستخدام قواعد التحول المورفولوجية التي يتم اكتشافها من البيانات الأولية.نقوم بتجربة طريقتين لاكتشاف القواعد.نهجنا الأ
مع التقدم في نماذج اللغة العصبية، تحول تركيز إجراءات الاختاذ اللغوية من النهج القائمة على الأجيال القائمة على الأجيال.في حين أن قدرة الحمولة الأخيرة في الحمولة مثيرة للإعجاب، تظل توليد النصوص الحقيقية مظاهرة تحديا.في هذه الورقة، نقوم بإعادة النظر في
مجردة، نقدم محول تحرير يعتمد على إعادة تحديد موضع (محرر)، مما يجعل توليد التسلسل مرنا بسلاسة يسمح للمستخدمين بسلاسة لتحديد التفضيلات في الاختيار المعجمي الإخراج.بناء على النماذج الأخيرة لتوليد التسلسل غير التلقائي (GU al.، 2019)، يولد المحرر تسلسلات