الاختلاف الدلالي بلغات ذات صلة هو مصدر قلق رئيسي لللغويات التاريخية.نحن نحقق في التحقيق اللغوي في الاختلاف الدلالي من أزواج المعروفة باللغات الإنجليزية والرومانسية، عن طريق تدمير Word.تحقيقا لهذه الغاية، نقدم مجموعة بيانات جديدة من الإدراك في جميع أزواج تلك اللغات.نحن نصف أنواع الأخطاء التي حدثت خلال عملية تحديد المعرفة الآلية وتصحيحها يدويا.بالإضافة إلى ذلك، نسمي أن نملصق اللغة الإنجليزية وفقا لالئصال الخاصة بهم، وفصلها إلى مجموعتين: القروض القديمة والقروض الأخيرة.في هذه البيانات المنوية، نقوم بتحليل خصائص Word مثل التردد والبولزيمي، وتوزيع درجات التشابه بين مجموعات مختلفة بلغات مختلفة.نحدد تلقائيا مجموعات مختلفة من الإنجليز، وضع اتجاه جديد للبحث في cognates، والقروض وتحليل الأصدقاء الخاطئين في لغات ذات صلة.
Semantic divergence in related languages is a key concern of historical linguistics. We cross-linguistically investigate the semantic divergence of cognate pairs in English and Romance languages, by means of word embeddings. To this end, we introduce a new curated dataset of cognates in all pairs of those languages. We describe the types of errors that occurred during the automated cognate identification process and manually correct them. Additionally, we label the English cognates according to their etymology, separating them into two groups: old borrowings and recent borrowings. On this curated dataset, we analyse word properties such as frequency and polysemy, and the distribution of similarity scores between cognate sets in different languages. We automatically identify different clusters of English cognates, setting a new direction of research in cognates, borrowings and possibly false friends analysis in related languages.
المراجع المستخدمة
https://aclanthology.org/
يمكن أن تلعب الموارد الحسابية مثل سورانيا المشروح الدولى دورا مهما في تمكين المتحدثين لغات الأقليات الأصلية للمشاركة في الحكومة والتعليم ومجالات الحياة العامة في لغتهم العامة.ومع ذلك، فإن العديد من اللغات - بشكل رئيسي أولئك الذين لديهم سكان متكلمون أ
اقترحت الدراسات النفسية تتبع العين أن التماسك الدلالي في السياق والتنبؤية تؤثر على معالجة اللغة خلال نشاط القراءة.في هذه الدراسة، يمكننا التحقيق في الارتباط بين أوجه التشابه الجيبيني المحسوب مع نماذج تضمين كلمة (كلا من البيانات الثابتة والسياقية) وبي
تهدف التحليل الدلالي القائم على الرسم البياني إلى تمثيل معنى نصي من خلال الرسوم البيانية الموجهة. باعتبارها واحدة من أكثر تمثيلات المعنى الواعدة في مجال الأغراض العامة، اكتسبت هذه الهياكل وتحليلها زخما فائدة كبير خلال السنوات الأخيرة، مع اقتراح عدة ش
تقدير أنظمة التشابه الدلالي النصي (STS) درجة تشابه معنى بين جملتين.تقدر أنظمة STS عبر اللغات درجة تشابه معنى بين جملتين، كل منها بلغة مختلفة.عادة ما تستخدم الخوارزميات الحديثة عادة نهجا بالغضب بشدة، يصعب استخدامه لغات ضعف الموارد.ومع ذلك، يحتاج أي نه
نقدم مجموعة بيانات تغيير دلالية معجمية مشروحة يدويا للروسية: رشيفتيفال.يتم ضمان حداثةها من خلال مجموعة واحدة من الكلمات المستهدفة المشروحة لتحولاتهم الدلالية DIACHRONIC عبر ثلاث فترات زمنية، بينما استخدم العمل السابق فترات زمنية فقط أو مجموعات مختلفة