يستخدم نظام ذاكرة الترجمة (TM)، وهو مكون رئيسي للترجمة بمساعدة الكمبيوتر (CAT)، على نطاق واسع لتحسين إنتاجية المترجمين البشريين من خلال تقديم استخدام فعال للمورد المترجم سابقا.نقترح طريقة لتحقيق استرجاع عالي السرعة من ذاكرة الترجمة الكبيرة عن طريق تقييم التشابه بناء على نموذج ناقل، وتقديم النتيجة التجريبية.من خلال تجربتنا باستخدام Lucene، محرك بحث استرجاع لاسترجاع المعلومات مفتوح المصدر، نستنتج أنه من الممكن تحقيق سرعة استرجاع في الوقت الفعلي لن حول عشرات من ميكروثونات حتى بالنسبة لذاكرة الترجمة الكبيرة مع 5 ملايين زوج قطاعي.
Translation Memory (TM) system, a major component of computer-assisted translation (CAT), is widely used to improve human translators' productivity by making effective use of previously translated resource. We propose a method to achieve high-speed retrieval from a large translation memory by means of similarity evaluation based on vector model, and present the experimental result. Through our experiment using Lucene, an open source information retrieval search engine, we conclude that it is possible to achieve real-time retrieval speed of about tens of microseconds even for a large translation memory with 5 million segment pairs.
المراجع المستخدمة
https://aclanthology.org/
الهدف من هذه الورقة هو التحقيق في نهج قياس التشابه في ذاكرة الترجمة (TM) في خمس أدوات ترجمة بمساعدة كمبيوتر تمثيلي عند استرداد جمل التباين في الفعل في الترجمة باللغة العربية إلى الإنجليزية. في اللغة الإنجليزية، تشمل الملصقات في الأفعال في الأفعال فقط
على الرغم من شعبية هائلة لأنظمة ذاكرة الترجمة والبحث النشط في هذا المجال، لا تزال ميزات معالجة اللغة الخاصة بها تعاني من قيود معينة.في حين أن العديد من الأوراق الأخيرة تركز على قدرات مطابقة الدلالية من TMS، فإن هذه الدراسة المخططة ستعالج كيفية أداء ه
أنظمة ذاكرة الترجمة (TMS) هي المكون الرئيسي لأدوات الترجمة المساعدة بمساعدة الكمبيوتر. يقومون بتخزين الترجمات التي تسمح بتوفير الوقت عن طريق تقديم الترجمات على قاعدة البيانات من خلال مطابقة عدة أنواع مثل المباريات الغامضة، والتي تحسبها خوارزميات مثل
قام تطوير تقنيات الترجمة، مثل ذاكرة الترجمة والترجمة الآلية، قد غيرت تماما سير عمل صناعة الترجمة وسير العمل في العقود الماضية.ومع ذلك، تم تطوير TM و MT بشكل منفصل حتى وقت قريب.سيقوم هذا المشروع المستمر بدراسة التكامل الخارجي ل TM و MT، وفحص ما إذا كا
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً
و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات
معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية
الدلالية (Semantic Si