ترغب بنشر مسار تعليمي؟ اضغط هنا

نستكشف الصلة بين المدى الذي يتم فيه الحفاظ على العلاقات النحوية في الترجمة وسهولة إنشاء شجرة تحليل بشكل صحيح في إعداد طلقة صفرية. في حين أن العمل السابق يشير إلى مثل هذه العلاقة، إلا أنه يميل إلى التركيز على مستوى الكلي وليس على مستوى الحواف الفردية --- فجوة نهدف إلى معالجتها. كحالة اختبار، نقوم بنقل التبعيات العالمية (UD) من الإنجليزية إلى مجموعة متنوعة من اللغات وإجراء مجموعتين من التجارب. في واحد، نقوم بتحليل الأداء الصفر بالرصاص بناء على مدى الحفاظ على حواف مصدر اللغة الإنجليزية في الترجمة. في مكان آخر، نطبق ثلاث تحولات بدوائية بمرحلة مغلفة إلى UD، مما يخلق المزيد من الإصدارات المستقرة عبر الأغراض، وتقييم إمتصاصها الصفرية بالرصاص. من أجل مقارنة أداء التحليل عبر مخططات مختلفة، نقوم بإجراء تقييم خارجي على المهمة المصب المتمثلة في استخراج العلاقات عبر اللغات المتبادلة باستخدام مجموعة فرعية من المعيار الإنجليزي القياسي المترجم إلى الروسية والكورية. في كلتا المجموعتين من التجارب، تشير نتائجنا إلى علاقة قوية بين الاستقرار عبر اللغات وأداء تحليل اللقطة الصفرية.
في حين أن مقاييس الأداء الكلية يمكن أن تولد رؤى قيمة على نطاق واسع، إلا أن هيمنتها تعني ظاهرة أكثر تعقيدا وشغنا، مثل الغموض، قد يتم التغاضي عنها.التركيز على الشروط الغامضة (على سبيل المثال مشمس، غائم، شاب، إلخ) نحن تفحص سلوك النماذج المدرجة بشكل مريئ ي والنصوص فقط، وإيجاد الاختلافات المنهجية من الأحكام الإنسانية حتى عندما يكون الأداء العام للنموذج مرتفعا.للمساعدة في تفسير هذا التباين، نحدد افتراضين أدلى به مجموعات البيانات والنماذج التي تم فحصها، وتسترشد بفلسفة الغموض، عزل الحالات التي لا تعقد فيها.
يلعب اختلاف المجال دورا مهما في تقدير أداء نموذج في مجالات جديدة. في حين أن هناك أدب كبيرا على تدابير الاختلاف، يجد الباحثون صعوبة في اختيار الاختلاف المناسب لتطبيق NLP معين. نحن نتطلع إلى هذا القصور من قبل كل من المسح الأدبيات ومن خلال دراسة تجريبية . نحن نطور تصنيفا من تدابير الاختلاف التي تتكون من ثلاث فصول --- إجراءات نظرية ونشرية هندسية وترتيب أعلى وتحديد العلاقات بينهما. علاوة على ذلك، لفهم حالات الاستخدام المشترك لهذه التدابير، نحن ندرك ثلاث تطبيقات جديدة - 1) اختيار البيانات، 2) تمثيل التعلم، و 3) القرارات في البرية - واستخدامها لتنظيم أدبنا. من هذا، نحدد أن التدابير النظريية للمعلومات منتشرة لمدة 1) و 3)، وتدابير ذات ترتيب أعلى أكثر شيوعا لمدة 2). لمزيد من المساعدة في مساعدة الباحثين في اختيار التدابير المناسبة للتنبؤ بالانخفاض في الأداء - وهو جانب مهم في القرارات في البرية، نقوم بإجراء تحليل العلاقة الممتدة 130 سيناريوهات تكيف المجال، و 3 مهام NLP متنوعة و 12 تدابير مختلفة تم تحديدها من مسحنا. لحساب هذه الاختلافات، نعتبر تمثيلات الكلمات السياقية الحالية (CWR) والتباين من التمثيلات الموزعة الأكبر سنا. نجد أن التدابير التقليدية على توزيعات الكلمات لا تزال تعمل كأساس قواعد قوية، في حين أن تدابير ذات طلب أعلى مع CWR فعالة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا