الاختلاف الدلالي بلغات ذات صلة هو مصدر قلق رئيسي لللغويات التاريخية.نحن نحقق في التحقيق اللغوي في الاختلاف الدلالي من أزواج المعروفة باللغات الإنجليزية والرومانسية، عن طريق تدمير Word.تحقيقا لهذه الغاية، نقدم مجموعة بيانات جديدة من الإدراك في جميع أزواج تلك اللغات.نحن نصف أنواع الأخطاء التي حدثت خلال عملية تحديد المعرفة الآلية وتصحيحها يدويا.بالإضافة إلى ذلك، نسمي أن نملصق اللغة الإنجليزية وفقا لالئصال الخاصة بهم، وفصلها إلى مجموعتين: القروض القديمة والقروض الأخيرة.في هذه البيانات المنوية، نقوم بتحليل خصائص Word مثل التردد والبولزيمي، وتوزيع درجات التشابه بين مجموعات مختلفة بلغات مختلفة.نحدد تلقائيا مجموعات مختلفة من الإنجليز، وضع اتجاه جديد للبحث في cognates، والقروض وتحليل الأصدقاء الخاطئين في لغات ذات صلة.