غالبا ما تفشل أنظمة الترجمة الآلية في الحفاظ على خصائص أسلوبية وبراغمية مختلفة لنص المصدر (E.G. المشاعر والمشاعر والسمات الجنسانية وغيرها) إلى الهدف وخاصة في سيناريو منخفض الموارد. يمكن أن تؤثر هذه الخسارة على أداء أي مهمة معالجة اللغة الطبيعية المصب (NLP) ومثل تحليل المعرفات وهذا يعتمد بشدة على إخراج أنظمة MT. أصبحت القابلية للإصابة بفقدان القطبية أكثر شدة عندما يعمل نظام MT لترجمة محتوى مصدر يفتقر إلى بنية لغة شرعية (على سبيل المثال نص المراجعة). لذلك، يجب أن نجد طرقا لتقليل الآثار غير المرغوب فيها لتفقد المعنويات في الترجمة دون المساومة مع الكفاية. في عملنا الحالي، نقدم إطارا عميقا لتعليم التعلم (RL) مع التعلم من المناهج الدراسية (وفقا لصعوبات المكافأة) لضبط معايير نظام MT العصبي المدرب مسبقا بحيث الترجمة التي تم إنشاؤها يقوم بنجاح بترميز المعنويات الأساسية للمصدر دون المساس بالكفاية على عكس الأساليب السابقة. نقوم بتقييم أسلوبنا المقترح على مجموعات البيانات المراجعة باللغة الإنجليزية - الهندية والفرنسية - الإنجليزية (مجال مطعم) ووجدت أن طريقتنا تجلب تحسنا كبيرا على العديد من خطوط الأساس في مهام الترجمة الآلية وتصنيف المعنويات.
Machine Translation (MT) systems often fail to preserve different stylistic and pragmatic properties of the source text (e.g. sentiment and emotion and gender traits and etc.) to the target and especially in a low-resource scenario. Such loss can affect the performance of any downstream Natural Language Processing (NLP) task and such as sentiment analysis and that heavily relies on the output of the MT systems. The susceptibility to sentiment polarity loss becomes even more severe when an MT system is employed for translating a source content that lacks a legitimate language structure (e.g. review text). Therefore and we must find ways to minimize the undesirable effects of sentiment loss in translation without compromising with the adequacy. In our current work and we present a deep re-inforcement learning (RL) framework in conjunction with the curriculum learning (as per difficulties of the reward) to fine-tune the parameters of a pre-trained neural MT system so that the generated translation successfully encodes the underlying sentiment of the source without compromising the adequacy unlike previous methods. We evaluate our proposed method on the English--Hindi (product domain) and French--English (restaurant domain) review datasets and and found that our method brings a significant improvement over several baselines in the machine translation and and sentiment classification tasks.
المراجع المستخدمة
https://aclanthology.org/
في حين أن التعلم المناهج الدراسي (CL) حصل مؤخرا على الجر في مهام معالجة اللغة الطبيعية، فإنه لا يزال غير محروم بشكل مناسب. تعمل سابقا على إظهار فعاليتها فقط ولكن تفشل في شرح وتفسير الأعمال الداخلية بالكامل. في هذه الورقة، نقوم بتحليل تعلم المناهج الد
تحقق هذه الورقة وتكشف عن العلاقة بين اثنين من التخصصات المتعلقة بآلات التعلم عن كثب، وهي التعلم النشط (AL) وتعلم المناهج الدراسية (CL)، من عدسة العديد من المناهج الرواية.تقدم هذه الورقة أيضا التعلم المناهج الدراسية النشطة (ACL) الذي يحسن AL من خلال ا
حاليا، تتلقى الترجمة متعددة اللغات الآلية أكثر اهتماما أكثر وأكثر لأنها تجلب أداء أفضل لغات الموارد المنخفضة (LRLS) وتوفر مساحة أكبر. ومع ذلك، فإن نماذج الترجمة متعددة اللغات الحالية تواجه تحديا شديدا: عدم التوازن. نتيجة لذلك، فإن أداء الترجمة من لغا
في هذه الدراسة، اقترحنا طريقة وضع العلامات الزائفة القائمة على معجم الرواية باستخدام نهج AI (XAI) القائم. النهج الحالي لديه قيود أساسية في متواضتهم لأن المصنف الفقراء يؤدي إلى وضع علامة ناعمة غير دقيقة، ويؤدي إلى تصنيف الفقراء بشكل متكرر. وفي الوقت ن
توفر المحاكاة الطبية بيئة تسيطر عليها لتدريب وتقييم المهارات السريرية. ومع ذلك، كمنصة تقييم، فإنه يتطلب وجود فاحص من ذوي الخبرة لتوفير ملاحظات الأداء، والتي تشمل عادة باستخدام قائمة مرجعية محددة المهام. هذا يجعل عملية التقييم غير فعالة ومكلفة. علاوة