في هذه الورقة، نحدد نوعا مثيرا للاهتمام من الخطأ في إخراج أنظمة الترجمة الآلية العصبية غير الخاضعة للكشف عنها مثل Undreamt1. نشير إلى نوع الخطأ هذا كمحالة ترجمة مدخبة. نلاحظ أن نماذج UNMT التي تستخدم ضوضاء خلط ورق اللعب الكلمة (كما هو الحال في حالة UNTreamt) يمكن أن تولد كلمات صحيحة ولكنها تفشل في غرزة معا لتشكيل العبارات. نتيجة وكلمات الجملة المترجمة تبدو سارعت وانخفاض بلو. نحن نفترض أن السبب وراء مشكلة الترجمة المخفوقة هي "خلط الضوضاء" التي يتم تقديمها في كل جملة مدخلات كاستراتيجية دنيوية. لاختبار فرضيتنا ونحن نجيب من خلال إعادة تدريب نماذج بعثة الأمم المتحدة في غول الصين نقوم بتوقف عن تدريب نموذج Denoising UNMT بعد قررت التكرارات مسبقا واستئناف التدريب من أجل التكرارات المتبقية - أي رقم هو أيضا قررت مسبقا - باستخدام الجملة الأصلية كمدخل دون إضافة أي ضجيج. يحقق حلنا المقترح نماذج UNMT تحسين الأداء التي تتدرب تقليديا. نوضح هذه المكاسب الأداء في أربع أزواج ولغوية وبيزن. والإنجليزية-الفرنسية والإنجليزية والألمانية والإنجليزية-الإسبانية والبنجابية الهندية. يوضح تحليلنا النوعي والكمي أن استراتيجية إعادة التدريب يساعد على تحقيق محاذاة أفضل كما لوحظ من خلال الاهتمام Heatmap والترجمة الجملية الأفضل وأدى إلى تحسين إحصائيا في درجات بلو.
In this paper and we identify an interesting kind of error in the output of Unsupervised Neural Machine Translation (UNMT) systems like Undreamt1. We refer to this error type as Scrambled Translation problem. We observe that UNMT models which use word shuffle noise (as in case of Undreamt) can generate correct words and but fail to stitch them together to form phrases. As a result and words of the translated sentence look scrambled and resulting in decreased BLEU. We hypothesise that the reason behind scrambled translation problem is 'shuffling noise' which is introduced in every input sentence as a denoising strategy. To test our hypothesis and we experiment by retraining UNMT models with a simple retraining strategy. We stop the training of the Denoising UNMT model after a pre-decided number of iterations and resume the training for the remaining iterations- which number is also pre-decided- using original sentence as input without adding any noise. Our proposed solution achieves significant performance improvement UNMT models that train conventionally. We demonstrate these performance gains on four language pairs and viz. and English-French and English-German and English-Spanish and Hindi-Punjabi. Our qualitative and quantitative analysis shows that the retraining strategy helps achieve better alignment as observed by attention heatmap and better phrasal translation and leading to statistically significant improvement in BLEU scores.
المراجع المستخدمة
https://aclanthology.org/
يسلط البحث الضوء على مشكلة لعلها الأهم بين مجموع المشكلات التي نجدها في تاريخ الفلسفة ألا و هي مشكلة الطبيعة. يحاول بحثنا سبر معنى الطبيعة من بواكيره الأولى حتى هيغل، كما سنحاول، في هذا البحث تناول مشكلة الطبيعة من الجانبين المنهجي و المعرفي، للوقوف
ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتج
تعتبر تعليقات الفيديو الحية، أو '' Danmu ''، ميزة ناشئة على منصات الفيديو الآسيوية عبر الإنترنت. Danmu تعليقات متزامنة الوقت مغطاة في تشغيل الفيديو. هذه التعليقات تثري بشكل فريد تجربة المستخدمين ومشاركتهم. أصبحت هذه التعليقات عامل تحديدا في شعبية مقا
لقد قمنا في هذا البحث بدراسة الارتباط الخطي المتعدد بين المتغيرات المستقلة في
نموذج الانحدار الخطي المتعدد في حالة وجود خلل في أحد شروط النموذج
الأساسية ، و عرضنا دراسة نظرية مرجعية لأنواع الارتباط الخطي و أسباب ظهور
مشكلة الارتباط الخطي المتعدد،
يقدم هذا المقال حلا لتلك المشكلة بإشراك شبكة المتحكم المناطقية -بعد أن تم تطويرها بتصنيع طبقة تطبيقات مناسبة للتطبيقات المالية- في شبكة الصرافات الآلية لما تمتاز به من مزايا عديدة أشهرها, أولوية النفاذ و عدم فقدان المسرى, حيث تم مقارنة النموذج المقتر