تقدم هذه الورقة العمل قيد التقدم نحو إنشاء أسرة من الكلمات من أجل Sanskrit واليونانية القديمة واللاتينية.بناء على المحاولات السابقة في هذا المجال، نقوم بوضع هذه الجهود التي تقوم بتجمعها من دلالات الصفحات العلنية WordNet مع نظريات المعنى من اللغويات المعرفية.نناقش بعض الابتكارات التي أدخلناها إلى هندسة Wordnet، لتحقيق أفضل لالتقاط polysemy من الكلمات، وكذلك الميزات الخاصة باللغة الهندية الأوروبية.نستنتج الورقة تأطير عملنا داخل الصورة الأكبر للموارد المتاحة للغات القديمة وإظهار أن أدوات البحث المدعومة من Wordnet - لديها القدرة على إعادة تحديد أنواع الأسئلة التي يمكن أن يطلب من لغة اللغة القديمة.
This paper presents the work in progress toward the creation of a family of WordNets for Sanskrit, Ancient Greek, and Latin. Building on previous attempts in the field, we elaborate these efforts bridging together WordNet relational semantics with theories of meaning from Cognitive Linguistics. We discuss some of the innovations we have introduced to the WordNet architecture, to better capture the polysemy of words, as well as Indo-European language family-specific features. We conclude the paper framing our work within the larger picture of resources available for ancient languages and showing that WordNet-backed search tools have the potential to re-define the kinds of questions that can be asked of ancient language corpora.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة مشاركة فريق BSC في ترجمة الموارد المنخفضة لغات WMT2021 للمهمة المشتركة بين اللغات الهندية الأوروبية.يهدف النظام إلى حل التتبع الفرعي 2: مقالات التراث الثقافي ويكيبيديا، والتي تنطوي على الترجمة في أربع لغات رومانسية: الكاتالونية والإيطا
تصف هذه الورقة مهمة Charles University الفرعية للمصطلحات المهمة المشتركة للترجمة في WMT21.الهدف من هذه المهمة هو تصميم نظام يترجم مع شروط معينة بناء على قاعدة بيانات المصطلحات المقدمة، مع الحفاظ على جودة الترجمة الشاملة عالية.تنافسنا في زوج اللغة الإ
في هذا العمل، نحقق في أساليب المهمة الصعبة المتمثلة في الترجمة بين أزواج لغة الموارد المنخفضة التي تظهر بعض مستوى التشابه.على وجه الخصوص، نعتبر فائدة نقل التعلم للترجمة بين العديد من لغات الموارد المنخفضة الأوروبية من الهند من الأسر الجرمانية والروما
توضح هذه الورقة تقديم TENTRANS إلى مهمة مشتركة من Translation Translation منخفضة اللغات WMT21 لأزواج اللغة الرومانسية.تركز هذه المهمة على تحسين جودة الترجمة من الكاتالونية إلى Occitan والرومانية والإيطالية، بمساعدة لغات الموارد ذات الصلة ذات الصلة.نح
تقترح هذه الورقة تنفيذ الكلمات الخمسة لغات جنوب إفريقيا، وهي SEPEDI و SETSWANA و TSHIVENDA و ISZULU و ISIXHOSA لإضافتها لفتح Wordnets متعدد اللغات (OMW) على مجموعة أدوات اللغة الطبيعية (NLTK).يتم تحويل Wordnets الأفريقي من Princeton Wordnet (PWN) 2.0