ترغب بنشر مسار تعليمي؟ اضغط هنا

تدرك الوقت الترجمة الصينية القديمة والاستدلال

Time-Aware Ancient Chinese Text Translation and Inference

374   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نهدف إلى معالجة التحديات المحيطة بترجمة النص الصيني القديم: (1) الفجوة اللغوية بسبب الاختلاف في عصائر النتائج في الترجمات التي هي فقيرة في الجودة، و (2) تفتقد معظم الترجمات المعلومات السياقيةغالبا ما يكون هذا أمرا ضروريا للغاية لفهم النص.تحقيقا لهذه الغاية، نحسن تقنيات الترجمة السابقة عن طريق اقتراح ما يلي: نحن نورد المهمة كهجوم تنبؤ متعدد الملصقات حيث يتنبأ النموذج كل من الترجمة وعصرها الخاص.نلاحظ أن هذا يساعد على سد الفجوة اللغوية كما يتم استخدام السياق الزمني أيضا كمعلومات مساعدة.نحن نقوم بالتحقق من طريقنا على كوربوس موازية مشروح مع معلومات التسلسل الزمني وإظهار فعاليتها تجريبيا في إنتاج مخرجات الترجمة عالية الجودة.نقوم بإصدار كل من التعليمات البرمجية وبيانات البحث في المستقبل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

كيفية إنشاء ملخصات من أنماط مختلفة دون مطالبة كوربورا في الأساليب المستهدفة، أو تدريب نماذج منفصلة؟نقدم أساليب رواية يمكن نشرها أثناء فك التشفير الموجز على أي نموذج تلخيص مقرها المحولات المدرب مسبقا.(1) تعديل حالة وحدة فك التشفير يعدل على الفور حالات فك الترميز النهائية مع هدنات النمط المدربين خارجيا، لإثارة تحسين الإخراج مقابل نمط مستهدف.(2) تنبؤ وحدة الكلمة تقييد استخدام كلمة لفرض عنصر تحكم جذاب قوي أثناء التوليد.في تجارب تلخص مع التحكم في البساطة، يجد التقييم التلقائي والقضاة البشري نماذجنا المنتجة للنواتج بلغات أبسط بينما لا تزال مفيدة.ونحن نولد أيضا عناوين الأخبار مع العديد من الميول الإيديولوجية، والتي يمكن تمييزها من قبل البشر مع احتمال معقول.
تهدف الترجمة التكيفية إلى تضمين ملاحظات المستخدمين بشكل حيوي لتحسين جودة الترجمة. في سيناريو ما بعد التحرير، يتم إدراج تصحيحات المستخدم لإخراج الترجمة الآلي باستمرار في نماذج الترجمة، أو تقليل أو إلغاء تحرير الأخطاء المتكررة وزيادة فائدة الترجمة الآل ية. في الترجمة الآلية العصبية، قد يتحقق هذا الهدف عبر مناهج التعلم عبر الإنترنت، حيث يتم تحديث معلمات الشبكة بناء على كل عينة جديدة. يتطلب هذا النوع من التكيف عادة معدلات تعليمية أعلى، والتي يمكن أن تؤثر على جودة النماذج مع مرور الوقت. بدلا من ذلك، قد تحافظ إعدادات التعلم عبر الإنترنت الأقل عدوانية على الاستقرار النموذجي، بتكلفة تقليل التكيف مع التصحيحات التي تم إنشاؤها بواسطة المستخدم. في هذا العمل، نقوم بتقييم تكوينات التعلم المختلفة عبر الإنترنت مع مرور الوقت، وقياس تأثيرها على العينات التي تم إنشاؤها من قبل المستخدم، وكذلك مجموعات بيانات داخل المجال والخروج من المجال. تشير النتائج في مجالين مختلفين إلى أن الأساليب المختلطة التي يجمع بين التعلم عبر الإنترنت مع ضبط الدفعة الدائمة قد تكون هناك حاجة إلى توازن بين فوائد التعلم عبر الإنترنت مع الاستقرار النموذجي.
ندرس مهمة التعلم وتقييم embeddings الصينية.نقوم أولا بإنشاء مجموعة بيانات تقييم جديدة تحتوي على مرادفات IDIOM والمتضادات.قد لا تكون مراقبة أن طرق تضمين الكلمة الصينية الحالية قد لا تكون مناسبة لتعلم Adiom AregBeddings، ونحن نقدم طريقة قائمة على بيرت التي تتعلم مباشرة أن تضمين ناقلات التعابير الفردية.نحن نقارن تجريبيا الأساليب الحالية وطريقتنا.نجد أن طريقتنا تتفوق بشكل كبير على الأساليب الحالية على مجموعة بيانات التقييم التي شيدناها.
التحيز بين الجنسين في Adgeddings تصبح تدريجيا حقل بحثي حية في السنوات الأخيرة.تهدف معظم الدراسات في هذا المجال إلى أساليب القياس والدولي مع اللغة الإنجليزية كلغة الهدف.تحقق هذه الورقة في التحيز بين الجنسين في تضيير كلمة ثابتة من منظور فريد من منظور ص يني.من خلال التدريب على تمثيلات الكلمات مع نماذج مختلفة، يتم تقييم التحيز بين الجنسين وراء ناقلات الصفات.من خلال مقارنة بين النتائج المنتجة ومجموعة بيانات مسجلة بشرية، نوضح كيف يميز التحيز بين الجنسين المشفرة في AdmBeddings من مواقف الناس.
على الرغم من أن تحيز التعرض قد درس على نطاق واسع في بعض مهام NLP، إلا أنه يواجه تحدياته الفريدة في توليد استجابة الحوار، وسيناريو الجيل الممثل الأول إلى مختلف. في الحوار الإنساني الحقيقي، هناك العديد من الردود المناسبة لنفس السياق، ليس فقط مع تعبيرات مختلفة، ولكن أيضا مع مواضيع مختلفة. لذلك، بسبب الفجوة الأكبر بكثير بين العديد من ردود الحقيقة الأرضية والاستجابة الاصطناعية التي تم إنشاؤها، فإن تحيز التعرض أكثر تحديا في مهمة توليد الحوار. ما هو أكثر من ذلك، حيث يشجع MLE النموذج على تعلم الكلمات الشائعة فقط بين ردود الحقيقة المختلفة ، ولكن يتجاهل الأجزاء المثيرة والمحددة، قد يؤدي التحيز التعريض إلى أن يؤدي المزيد إلى مشكلة توليد الاستجابة المشتركة، مثل لا أعرف "وهاها؟" في هذه الورقة، نقترح آلية تحول التكيف الرواية، والتي تتعلم العبور تلقائيا بين التعلم الأساسي للحقيقة وتولد التعلم فيما يتعلق بدرجة مطابقة على مستوى الكلمة، مثل تشابه جيب التمام. تظهر النتائج التجريبية على كل من مجموعة بيانات STC الصينية ومجموعة بيانات Reddit الإنجليزية، أن طريقتنا التكيفية تحقق تحسنا كبيرا من حيث التقييم القائم على المتري والتقييم البشري، مقارنة بنهج تحيز التعرض للدولة القصيرة. يظهر تحليل إضافي حول مهمة NMT أيضا أن طرازنا يمكن أن يحقق تحسنا كبيرا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا