ترغب بنشر مسار تعليمي؟ اضغط هنا

تجميع النموذج مع مسافة تحرير المرجح

Paradigm Clustering with Weighted Edit Distance

409   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تصف هذه الورقة نظامنا لمهمة SIGMORPHON 2021 المشتركة على تجميع النموذج المورفولوجي غير المقترح، والذي يطلب من المشاركين أن يثبتوا نماذج تم تأصيلهم معا وفقا ليمما الأساسي دون مساعدة من بيانات التدريب المشروح.نحن نوظف تجميع التجمعات التجمعات إلى مجموعة الكلمة معا باستخدام مقياس تقيي يجمع بين مسافة إلكترونية ومن المسافة الدلالية من Word Ageddings.نقوم بتجربة اثنين من الاختلافات في تحرير النموذج المستند إليه عن بعد لقياس المسافة الإلكترونية، ولكن نظرا لقيود الوقت، لا يتحسن نظامنا عبر النظام الأساسي للمهمة المشتركة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يصف هذا العمل تقديم Edinburgh إلى المهمة Sigmorphon 2021 المشتركة 2 على تجميع النموذج المورفولوجي غير المقترح.إعطاء إدخال النص الخام، وكانت المهمة لتعيين كل رمز رمزية إلى كتلة مع الرموز الأخرى من نفس النموذج.نحن نستخدم تجزئة محول القواعد جنبا إلى جنب مع الاستدلال القائم على التردد للتنبؤ مجموعات النماذج.حقق نظامنا أعلى متوسط درجة F1 عبر 9 لغات اختبار، ووضع أولا من 15 رسالة.
نحن تصف مهمة Sigmorphon الثانية على التورفولوجيا غير المدعومة: الهدف من المهمة المشتركة SIGMORPHON 2021 على تجميع النماذج المورفولوجية غير المزدئة غير المنشأة هو أنواع الكلمات العنقودية من كوربوس نص الخام إلى النماذج.تحقيقا لهذه الغاية، نطلق سرورا لم دة 5 لغات تطوير و 9 لغات اختبار، وكذلك النماذج الجزئية الذهبية للتقييم.نتلقى 14 تقريرا من 4 فرق تتبع الاستراتيجيات المختلفة، ويستند أفضل نظام أداء على قواعد النحوية.تختلف النتائج بشكل كبير عبر اللغات.ومع ذلك، فإن جميع الأنظمة متفوقة من قبل Lemmmmmmmatizer تحت إشراف، مما يعني أنه لا يزال هناك مجال للتحسين.
تصف هذه الورقة تقديم فريق CU-UBC لمهمة SIGMORPHON 2021 المشتركة 2: تجميع النماذج المورفولوجية غير المنصوص عليها.يولد نظامنا النماذج باستخدام قواعد التحول المورفولوجية التي يتم اكتشافها من البيانات الأولية.نقوم بتجربة طريقتين لاكتشاف القواعد.نهجنا الأ ول يولد بادئة وتحولات لاحقة بين سلاسل مماثلة.ثانيا، نحن نقوم بتجربة المزيد من القواعد العامة التي يمكن أن تطبق التحولات داخل سلاسل الإدخال بالإضافة إلى التحويلات البادئة واللاحقة.نجد أن أفضل أداء إجمالي يتم تسليمها عن طريق البادئة وقواعد اللاحقة ولكن المزيد من قواعد التحول العامة تؤدي أفضل لغات مع التشكل الغزيرة ونباتات مورفيم إلى كلمة عالية للغاية.
مع التقدم في نماذج اللغة العصبية، تحول تركيز إجراءات الاختاذ اللغوية من النهج القائمة على الأجيال القائمة على الأجيال.في حين أن قدرة الحمولة الأخيرة في الحمولة مثيرة للإعجاب، تظل توليد النصوص الحقيقية مظاهرة تحديا.في هذه الورقة، نقوم بإعادة النظر في إجراء إخفاء التشريطات اللغوي المستندة إلى التحرير، مع فكرة أن نموذج لغة مانع يوفر حل خارج الرف.الطريقة المقترحة تلغي بناء القاعدة المضنية ولديها قدرة حمولة عالية للنموذج المستند إلى التحرير.يظهر أيضا أنه أكثر أمانا ضد الكشف التلقائي من الأسلوب القائم على الجيل أثناء تقديم سيطرة أفضل على إيقاف تشغيل سعة الحمولة / الحمولة الأمنية.
مجردة، نقدم محول تحرير يعتمد على إعادة تحديد موضع (محرر)، مما يجعل توليد التسلسل مرنا بسلاسة يسمح للمستخدمين بسلاسة لتحديد التفضيلات في الاختيار المعجمي الإخراج.بناء على النماذج الأخيرة لتوليد التسلسل غير التلقائي (GU al.، 2019)، يولد المحرر تسلسلات جديدة من خلال تحرير الفرضيات الإثارة.يعتمد على عملية "إعادة وضع رواية" مصممة لتفكيك الاختيار المعجمي من قرارات تحديد المواقع Word، مع تمكين الأوراج الفعالة للتعلم التقليد والتحرير الموازي في وقت فك التشفير.من التجريبية، يستخدم المحرر القيود المعجمية الناعمة بشكل أكثر فعالية من محول Levenshtein (Gu et al.، 2019) أثناء تسريع فك التشفير بشكل كبير مقارنة بشكل كبير بالبحث عن شعاع (Post and Vilar، 2018).يحقق المحرر أيضا جودة ترجمة قابلة للمقارنة أو أفضل مع سرعة فك التشفير أسرع من مهام الترجمة الآلية الرومانية والإنجليزية والإنجليزية والإنجليزية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا