الهدف من هذه الورقة هو وصف العملية التي يتم تنفيذها لتطوير كوربوس في LEL يتألف من النصوص المستخرجة من مواقع الشركات الصغيرة والمتوسطة في جنوب شركات الأسفلية من القطاعات الصحية التي ستكون بمثابة أساس لتقييم جودة MT. مراحل تجميع الشركة الموازية كانت: (1) اختيار المواقع ذات المحتوى المترجم في اللغة الإنجليزية والإسبانية، (2) تنزيل ملفات HTML من مواقع الويب المحددة، (3) الملفات تصفية الملفات الإنجليزي وإقرانها مع مكافئات اللغة الإنجليزية (4) تجميع كوربورا الفردية (EN و ES) لكل من مواقع الويب المحددة، (V) دمج الأفراد الفردي إلى كوربوس عامين واحد باللغة الإنجليزية والآخر في الإسبانية، (6) اختيار نموذج تمثيلي من يتم استخدام شرائح لاستخدامها كترجمات أصلية (EN) وترجمات مرجعية (EN)، (VII)، بناء السور الموازي المقصود لتقييم MT. سوف تعمل Corpus الموازية التي ولدت في تقييم جودة الترجمة الآلية في المستقبل. بالإضافة إلى ذلك، يمكن أن تكون شركة أحادية الناتجة التي تم إنشاؤها أثناء العملية كقاعدة لتنفيذ البحوث التي تركز على التحليل اللغوي - ثنائي اللغة أو أحادي الأجل.
The aim of this paper is to describe the process carried out to develop a paral-lel corpus comprised of texts extracted from the corporate websites of south-ern Spanish SMEs from the sanitary sector which will serve as the basis for MT quality assessment. The stages for compiling the parallel corpora were: (i) selection of websites with content translated in English and Spanish, (ii) downloading of the HTML files of the selected websites, (iii) files filtering and pairing of English files with their Spanish equivalents, (iv) compilation of individual corpora (EN and ES) for each of the selected websites, (v) merging of the individual corpora into a two general corpus one in English and the other in Spanish, (vi) selection a representative sample of segments to be used as original (ES) and reference translations (EN), (vii) building of the parallel corpus intended for MT evaluation. The parallel corpus generated will serve to future Machine Translation quality assessment. In addition, the monolingual corpora generated during the process could as a base to carry out research focused on linguistic -- bilingual or monolingual − analysis.
المراجع المستخدمة
https://aclanthology.org/
في هذه الورقة، نصف عملية بناء كوربوس للشركات سيتم استخدامها كإعادة إرجاع للنمذجة وحوسبة المخلفات المحادثات المضمنة باستخدام أدوات Commu-Nication and Collaboration.إن AdvertGoal of the إعادة إعمار الخيوط هو "بيل" لتوفير قيمة للمصدر في حالات استخدام Va
إن السلوك العشوائي الحالي لأصحاب المصالح داخل حوض نهر الأبرش في الاقليم الساحلي السوري بما يحتويه من البحيرة والنهر يهدد أكثر من أي وقت مضى بتلويث الحوض بأكمله. الهدف من هذه الورقة هو معالجة حالة الإدارة المشتركة للموارد المائية بين اللاعبين المحليين
المحادثات غالبا ما تكون في المختبرات والشركات.ملخص أمر حيوي لفهم محتوى مناقشة للأشخاص الذين لم يحضروا المناقشة.إذا تم توضيح الملخص كهيكل وسيطة، فمن المفيد فهم أساسيات المناقشة على الفور.هدفنا في هذه الورقة هو التنبؤ بهيكل رابط بين العقد التي تتكون من
في الآونة الأخيرة، بدأ عدد من مقدمي الترجمة الآلات التجارية (MT) تقديم ميزات مسرد يسمح للمستخدمين بتنفيذ المصطلحات في إخراج نموذج عام. ومع ذلك، على حد علمنا، ليس من الواضح كيف ستؤثر هذه الميزات على دقة المصطلحات والنوعية الشاملة للإخراج. تهدف المساهم
يقدم هذا العمل ITIHASA، مجموعة بيانات ترجمة واسعة النطاق تحتوي على 93،000 زوج من Sanskrit Shlokas وترجماتها الإنجليزية.يتم استخراج شلوكاس من اثنين من الملصفات الهندية بمعنى.، رامايانا وماهاوصفنا أولا الدافع وراء عمالة مثل هذه البيانات ومتابعة التحليل