في هذه الورقة، نهدف إلى معالجة التحديات المحيطة بترجمة النص الصيني القديم: (1) الفجوة اللغوية بسبب الاختلاف في عصائر النتائج في الترجمات التي هي فقيرة في الجودة، و (2) تفتقد معظم الترجمات المعلومات السياقيةغالبا ما يكون هذا أمرا ضروريا للغاية لفهم النص.تحقيقا لهذه الغاية، نحسن تقنيات الترجمة السابقة عن طريق اقتراح ما يلي: نحن نورد المهمة كهجوم تنبؤ متعدد الملصقات حيث يتنبأ النموذج كل من الترجمة وعصرها الخاص.نلاحظ أن هذا يساعد على سد الفجوة اللغوية كما يتم استخدام السياق الزمني أيضا كمعلومات مساعدة.نحن نقوم بالتحقق من طريقنا على كوربوس موازية مشروح مع معلومات التسلسل الزمني وإظهار فعاليتها تجريبيا في إنتاج مخرجات الترجمة عالية الجودة.نقوم بإصدار كل من التعليمات البرمجية وبيانات البحث في المستقبل.
In this paper, we aim to address the challenges surrounding the translation of ancient Chinese text: (1) The linguistic gap due to the difference in eras results in translations that are poor in quality, and (2) most translations are missing the contextual information that is often very crucial to understanding the text. To this end, we improve upon past translation techniques by proposing the following: We reframe the task as a multi-label prediction task where the model predicts both the translation and its particular era. We observe that this helps to bridge the linguistic gap as chronological context is also used as auxiliary information. We validate our framework on a parallel corpus annotated with chronology information and show experimentally its efficacy in producing quality translation outputs. We release both the code and the data for future research.
المراجع المستخدمة
https://aclanthology.org/
كيفية إنشاء ملخصات من أنماط مختلفة دون مطالبة كوربورا في الأساليب المستهدفة، أو تدريب نماذج منفصلة؟نقدم أساليب رواية يمكن نشرها أثناء فك التشفير الموجز على أي نموذج تلخيص مقرها المحولات المدرب مسبقا.(1) تعديل حالة وحدة فك التشفير يعدل على الفور حالات
تهدف الترجمة التكيفية إلى تضمين ملاحظات المستخدمين بشكل حيوي لتحسين جودة الترجمة. في سيناريو ما بعد التحرير، يتم إدراج تصحيحات المستخدم لإخراج الترجمة الآلي باستمرار في نماذج الترجمة، أو تقليل أو إلغاء تحرير الأخطاء المتكررة وزيادة فائدة الترجمة الآل
ندرس مهمة التعلم وتقييم embeddings الصينية.نقوم أولا بإنشاء مجموعة بيانات تقييم جديدة تحتوي على مرادفات IDIOM والمتضادات.قد لا تكون مراقبة أن طرق تضمين الكلمة الصينية الحالية قد لا تكون مناسبة لتعلم Adiom AregBeddings، ونحن نقدم طريقة قائمة على بيرت
التحيز بين الجنسين في Adgeddings تصبح تدريجيا حقل بحثي حية في السنوات الأخيرة.تهدف معظم الدراسات في هذا المجال إلى أساليب القياس والدولي مع اللغة الإنجليزية كلغة الهدف.تحقق هذه الورقة في التحيز بين الجنسين في تضيير كلمة ثابتة من منظور فريد من منظور ص
على الرغم من أن تحيز التعرض قد درس على نطاق واسع في بعض مهام NLP، إلا أنه يواجه تحدياته الفريدة في توليد استجابة الحوار، وسيناريو الجيل الممثل الأول إلى مختلف. في الحوار الإنساني الحقيقي، هناك العديد من الردود المناسبة لنفس السياق، ليس فقط مع تعبيرات