ترغب بنشر مسار تعليمي؟ اضغط هنا

خلفية في الانعطاف المورفولوجي العصبي

Backtranslation in Neural Morphological Inflection

269   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

Backtranslation هي تقنية شائعة للاستفادة من البيانات غير المسبقة في سيناريوهات الموارد المنخفضة في الترجمة الآلية.تنطبق الطريقة بشكل مباشر على توليد الانفعال المورفولوجي إذا كانت نماذج الكلمة غير المسبقة متوفرة.تقوم هذه الورقة بتقييم إمكانات خلفية الانعطاف المورفولوجي باستخدام البيانات من ست لغات مع البيانات المسمى المسجلة من مورد Sigmorphon المشترك للبيانات والبيانات غير المسبقة من مصادر مختلفة.النتيجة الناتجة الأساسية هي أن Backtranslation يمكن أن تقدم تحسينات متواضعة في سيناريوهات الموارد المنخفضة، ولكن فقط إذا كانت البيانات غير المسبقة نظيفة للغاية وقد تم تصفيتها بنفس المعايير التوضيحية مثل البيانات المسمى.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقدم هذه الورقة تقديم فريق Guclasp ل Sigmorphon 2021 المهمة المشتركة بشأن التعميم في توليد الانعطاف المورفولوجي.نقوم بتطوير نموذج متعدد اللغات للانضباط المورفولوجي والتركيز بشكل أساسي على تحسين النموذج باستخدام استراتيجيات تدريب مختلفة لتحسين الدقة والتعميم عبر اللغات.
تتحمل الأساليب الحالية لإدماج قيود المصطلحات في الترجمة الآلية (MT) عادة أن شرط القيد يتم توفيرها في أشكالهم المورفولوجية الصحيحة. هذا يحد من تطبيقه إلى سيناريوهات العالم الحقيقي حيث يتم توفير شروط القيد كمولماس. في هذه الورقة، نقدم إطارا وحدات لإدما ج قيود Lemma في MT العصبية (NMT) التي يمكن فيها تطبيق المعرفة اللغوية وأنواع متنوعة من نماذج NMT بشكل مرني. يعتمد ذلك على وحدة انعطاف عبر اللغات الرواية التي تلحق قيود LEMMA المستهدفة بناء على سياق المصدر. نستكشف وحدات الانقسام العصبية المستندة إلى القواعد ذات الدوافع التي تعتمد على القواعد ومقرها إلى البيانات وتصميم أجنحة اختبار الصحة باللغة الإنجليزية والألمانية والأخبار الإنجليزية - الليتوانية لتقييمها في تكييف المجال وإعدادات MT منخفضة الموارد. تشير النتائج إلى أن وحدة الانعكاسات التي تعتمد على قواعدنا تساعد نماذج NMT على دمج قيود LEMMA بشكل أكثر دقة من الوحدة العصبية وتتفوق على النهج الحالي للنهائي مع انخفاض تكاليف التدريب.
نحن تصف أنظمة NMT الخاصة بنا المقدمة إلى المهمة المشتركة WMT2021 في ترجمة الأخبار الإنجليزية - التشيكية: CUNI-DOCTRANSFORMER (CUBBITT على مستوى المستند) و Cuni-Marian-Baselines.نحن نحسن السابق بمعالجة أفضل من تجزئة الجملة وعلاج ما بعد معالجة الأخطاء في تحديد الأرقام والوحدات.نحن نستخدم الأخير للتجارب مع تقنيات الخلفية المختلفة.
نقدم تقديم BME لمهمة Sigmorphon 2021 0 الجزء 1، التعميم عبر المهمة المشتركة بين اللغات المتنوعة من الناحية النموذجية.نحن نستخدم نموذج فك تشفير LSTM مع ثلاثة خطوات التدريب المدرب لأول مرة على جميع اللغات، ثم ضبطها على كل عائلة لغة وأخيرا ضبطها على الل غات الفردية.نستخدم نوع مختلف من تقنية تكبير البيانات في الخطوتين الأولين.تفوق نظامنا على التقديم الآخر الوحيد.على الرغم من أنه لا يزال أسوأ من خط الأساس المحول الذي أصدره المنظمون، فإن نموذجنا أبسط وأن تقنياتنا تكبير البيانات تنطبق بسهولة على لغات جديدة.نقوم بإجراء دراسات الاجتثاث وإظهار أن تقنيات المعزز والخطوات التدريبية الثلاثة غالبا ما تساعد ولكن في بعض الأحيان يكون لها تأثير سلبي.رمز لدينا هو متاح علنا.
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا ت اختبار الباحث البشري من الألمانيةوالإنجليزية والهولندية في مهمة SIGMORPHON-UNIMORPH 2021 المشتركة، مع نتائج تنافسية.وقد ثبت بعض الخصائص الرسمية لعملية التعميم الحد الأدنى.تم تطوير طريقة تلقائية لإنشاء محفزات اختبار Wug للتجارب المستقبلية التي تحقق ما إذا كانت التعميمات المورفولوجية النموذجية ضئيلة للغاية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا