ماهي أنواع الترجمة الآلية الإحصائية ؟


تقسم الترجمة الآلية الإحصائية (تاح) إلى:

الأساس هو الكلمة (Word- Based)

الأساس هو الكلمة، هو النهج الأصل، ويحلل على مستوى الوحدات المعجمية. وهو ما يعني أن كل كلمة في المصدر لها كلمة مقابلة في الهدف. ونعلم أن كثيراً من الكلمات في كثير من اللغات لها أكثر من معنى. ومن الواضح، أن هذا الأمر هو معضلة للترجمة الآلية، يجب حلها، ربما بتحرير سابق. وقد نجد صعوبات أخرى في لغات غير موجودة في لغات أخرى.

الأساس هو شبه الجملة ( (Phase- Based

نهج "الأساس هو شبه الجملة" في (تآح) وضع لحل المشكلات المذكورة أعلاه. لكن المصطلح "شبه الجملة" لا يدل على أنظمة قادرة على تحديد أشباه جمل محفزة لغوياً، وتحليلها وفصل بعضها عن بعض. ويدل المصطلح على سلاسل من كلمات متتالية (نغرام/ تعريب n-gram)، ظهرت في بيانات ما. ويسمح استعمال هذه السلاسل بمعالجة بعض نقائص (تآح) الناتجة من استعمال "الأساس هو الكلمة". كما تيسر هذه المعالجة بعمل خوارزميات أفضل لمعالجة الغموض في المعاني لكلمة ما. وكذلك، اعتماداً على طول هذه السلاسل فقد صار بالإمكان معالجة قضايا ترتيب الكلمات أو أي ظواهر نحوية. كما أن (تآح) التراتبية ذات نهج "الأساس هو شبه الجملة"، ويعرف أيضاً بأنه (تآح) من نهج "الأساس هو النحو" هو أسلوب متقدم يسمح باستعمال بيانات نحوية شجرية الأساس في نموذج شبه الجملة.