يترجم الأساليب الموجودة للترجمة الآلية (MT) في الغالب نص معين في لغة المصدر في اللغة المستهدفة وبدون تشير صراحة إلى المعلومات التي لا غنى عنها لإنتاج ترجمة مناسبة. لا يشمل ذلك فقط المعلومات في العناصر والطرائق النصية الأخرى من النصوص الموجودة في نفس المستند، بل أيضا معلومات إضافية وثلاثة وثيقة وغير لغوية مثل المعايير والسكوب. لتصميم تدفقات عمل الترجمة أفضل ونحن بحاجة إلى التمييز بين مشكلات الترجمة التي يمكن حلها من خلال أساليب النص إلى النص الموجودة وغيرها. تحقيقا لهذه الغاية، أجرينا تقييم تحليلي لنواتج MT وأخذ مهمة ترجمة من الأخبار الإنجليزية إلى اليابانية كدراسة حالة. أولا وأمثلة على مشكلات الترجمة وتنقيحاتها تم جمعها بواسطة طريقة ما بعد التحرير على مرحلتين (PE): أداء الحد الأدنى من PE للحصول على الترجمة التي يمكن تحقيقها بناء على المعلومات النصية المعينة وإجراء المزيد من الأداء الكامل للحصول على ترجمة مقبولة حقا تشير إلى أي المعلومات إذا لزم الأمر. ثم تم تحليل أمثلة المراجعة التي تم جمعها يدويا. كشفنا عن القضايا والمعلومات المهيمنة التي لا غنى عنها لحلها وكائن مثل مواصفات النمط المحبوسين والمعدات المصطلحات والمعرفة الخاصة بالمجال والمستندات المرجعية الخاصة بالمجال وتحديد تمييز واضح بين الترجمة وما يمكن أن يحقق MT النص إلى النص في النهاية.
Existing approaches for machine translation (MT) mostly translate given text in the source language into the target language and without explicitly referring to information indispensable for producing proper translation. This includes not only information in other textual elements and modalities than texts in the same document and but also extra-document and non-linguistic information and such as norms and skopos. To design better translation production work-flows and we need to distinguish translation issues that could be resolved by the existing text-to-text approaches and those beyond them. To this end and we conducted an analytic assessment of MT outputs and taking an English-to-Japanese news translation task as a case study. First and examples of translation issues and their revisions were collected by a two-stage post-editing (PE) method: performing minimal PE to obtain translation attainable based on the given textual information and further performing full PE to obtain truly acceptable translation referring to any information if necessary. Then and the collected revision examples were manually analyzed. We revealed dominant issues and information indispensable for resolving them and such as fine-grained style specifications and terminology and domain-specific knowledge and and reference documents and delineating a clear distinction between translation and what text-to-text MT can ultimately attain.
المراجع المستخدمة
https://aclanthology.org/
نقوم بإلقاء مجموعة من مهام استخراج المعلومات في إطار ترجمة نصية إلى ثلاثية. بدلا من حل كل مهمة تعتمد على مجموعات البيانات والنماذج الخاصة بالمهام، نقوم بإضفاء الطابع الرسمي على المهمة كترجمة بين نص الإدخال الخاص بمهارات المهام وتصل إلى ثلاث مرات. من
يمكن أن ترجمت نماذج النص العصبي المؤقتة مؤخرا لترجمة أسئلة اللغة الطبيعية بفعالية لاستعلامات SQL المقابلة على قواعد البيانات غير المرئية.العمل في الغالب على مجموعة بيانات العنكبوت، اقترح الباحثون حلولا متطورة بشكل متزايد للمشكلة.على عكس هذا الاتجاه،
تم جمع معظم مجموعات بيانات تحليل الدلالات المتاحة، والتي تتكون من أزواج من الكلام الطبيعي والنماذج المنطقية، فقط لغرض تدريب وتقييم أنظمة فهم اللغة الطبيعية.ونتيجة لذلك، فإنها لا تحتوي على أي من ثراء ومجموعة متنوعة من الكلام الطبيعية التي تحدث، حيث يس
يقدم هذا العمل ITIHASA، مجموعة بيانات ترجمة واسعة النطاق تحتوي على 93،000 زوج من Sanskrit Shlokas وترجماتها الإنجليزية.يتم استخراج شلوكاس من اثنين من الملصفات الهندية بمعنى.، رامايانا وماهاوصفنا أولا الدافع وراء عمالة مثل هذه البيانات ومتابعة التحليل
منذ أن تم اعتماد النماذج العصبية في توليد لغة البيانات إلى النص، فقد تم اعتمادها دائما على المكونات الخارجية لتحسين دقتها الدلالية، لأن النماذج عادة لا تظهر القدرة على توليد نص يذكر بشكل موثوق كل المعلومات المقدمة فيالمدخل.في هذه الورقة، نقترح طريقة