الهدف من هذه الورقة هو وصف العملية التي يتم تنفيذها لتطوير كوربوس في LEL يتألف من النصوص المستخرجة من مواقع الشركات الصغيرة والمتوسطة في جنوب شركات الأسفلية من القطاعات الصحية التي ستكون بمثابة أساس لتقييم جودة MT. مراحل تجميع الشركة الموازية كانت: (1) اختيار المواقع ذات المحتوى المترجم في اللغة الإنجليزية والإسبانية، (2) تنزيل ملفات HTML من مواقع الويب المحددة، (3) الملفات تصفية الملفات الإنجليزي وإقرانها مع مكافئات اللغة الإنجليزية (4) تجميع كوربورا الفردية (EN و ES) لكل من مواقع الويب المحددة، (V) دمج الأفراد الفردي إلى كوربوس عامين واحد باللغة الإنجليزية والآخر في الإسبانية، (6) اختيار نموذج تمثيلي من يتم استخدام شرائح لاستخدامها كترجمات أصلية (EN) وترجمات مرجعية (EN)، (VII)، بناء السور الموازي المقصود لتقييم MT. سوف تعمل Corpus الموازية التي ولدت في تقييم جودة الترجمة الآلية في المستقبل. بالإضافة إلى ذلك، يمكن أن تكون شركة أحادية الناتجة التي تم إنشاؤها أثناء العملية كقاعدة لتنفيذ البحوث التي تركز على التحليل اللغوي - ثنائي اللغة أو أحادي الأجل.