ترغب بنشر مسار تعليمي؟ اضغط هنا

نحو إنشاء Wallets لغات الهند القديمة الأوروبية

Toward the creation of WordNets for ancient Indo-European languages

464   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة العمل قيد التقدم نحو إنشاء أسرة من الكلمات من أجل Sanskrit واليونانية القديمة واللاتينية.بناء على المحاولات السابقة في هذا المجال، نقوم بوضع هذه الجهود التي تقوم بتجمعها من دلالات الصفحات العلنية WordNet مع نظريات المعنى من اللغويات المعرفية.نناقش بعض الابتكارات التي أدخلناها إلى هندسة Wordnet، لتحقيق أفضل لالتقاط polysemy من الكلمات، وكذلك الميزات الخاصة باللغة الهندية الأوروبية.نستنتج الورقة تأطير عملنا داخل الصورة الأكبر للموارد المتاحة للغات القديمة وإظهار أن أدوات البحث المدعومة من Wordnet - لديها القدرة على إعادة تحديد أنواع الأسئلة التي يمكن أن يطلب من لغة اللغة القديمة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة مشاركة فريق BSC في ترجمة الموارد المنخفضة لغات WMT2021 للمهمة المشتركة بين اللغات الهندية الأوروبية.يهدف النظام إلى حل التتبع الفرعي 2: مقالات التراث الثقافي ويكيبيديا، والتي تنطوي على الترجمة في أربع لغات رومانسية: الكاتالونية والإيطا لية والوكر والرومانية.النظام المقدم هو نموذج الترجمة شبه الإشراف متعدد اللغات.إنه يستند إلى نموذج لغة مدرب مسبقا، وهما XLM-Roberta، وهو ما يتم ضبطه في وقت لاحق مع البيانات الموازية التي تم الحصول عليها في الغالب من OPUS.على عكس الأعمال الأخرى، نستخدم XLM فقط لتهيئة التشفير والتهيئة بشكل عشوائي فك تشفير ضحلة.النتائج المبلغ عنها قوية وأداء جيدا لجميع اللغات التي تم اختبارها.
تصف هذه الورقة مهمة Charles University الفرعية للمصطلحات المهمة المشتركة للترجمة في WMT21.الهدف من هذه المهمة هو تصميم نظام يترجم مع شروط معينة بناء على قاعدة بيانات المصطلحات المقدمة، مع الحفاظ على جودة الترجمة الشاملة عالية.تنافسنا في زوج اللغة الإ نجليزية الفرنسية.يعتمد نهجنا على توفير الترجمات المرغوبة إلى جانب جملة الإدخال وتدريب النموذج لاستخدام هذه المصطلحات المقدمة.نحن Lemmatize المصطلحات على حد سواء أثناء التدريب والاستدلال، للسماح للنموذج لمعرفة كيفية إنتاج الأشكال السطحية الصحيحة للكلمات، عندما تختلف عن النماذج المتوفرة في قاعدة بيانات المصطلحات.
في هذا العمل، نحقق في أساليب المهمة الصعبة المتمثلة في الترجمة بين أزواج لغة الموارد المنخفضة التي تظهر بعض مستوى التشابه.على وجه الخصوص، نعتبر فائدة نقل التعلم للترجمة بين العديد من لغات الموارد المنخفضة الأوروبية من الهند من الأسر الجرمانية والروما نسية.على وجه الخصوص، نبني اثنين من الطبقات الرئيسية من النظم القائمة على النقل لدراسة كيفية استخدام ترابط الأداء الترجمة.النظام الأساسي يضم النموذج الذي تم تدريبه مسبقا على زوج لغة ذات صلة ونظام قابل للتناقض بشكل جيد-قم بإلغاء التدريب مسبقا على زوج لغة غير ذات صلة.تبين تجاربنا أنه على الرغم من أن المرتبطة ليست ضرورية لنقل التعلم للعمل، إلا أنها تنفذ أداء نموذجي.
توضح هذه الورقة تقديم TENTRANS إلى مهمة مشتركة من Translation Translation منخفضة اللغات WMT21 لأزواج اللغة الرومانسية.تركز هذه المهمة على تحسين جودة الترجمة من الكاتالونية إلى Occitan والرومانية والإيطالية، بمساعدة لغات الموارد ذات الصلة ذات الصلة.نح ن نستخدم أساسا الترجمة المرجانية، والطرق القائمة على المحور، ونماذج متعددة اللغات، ونقل النموذج المدربين مسبقا، ونقل المعرفة داخل المجال لتحسين جودة الترجمة.في مجموعة الاختبار، يحقق نظامنا الأفضل المقدم بمتوسط 43.45 درجات بلو حساسة لحالة الأحرف عبر جميع أزواج الموارد المنخفضة.تتوفر بياناتنا ورمز النماذج المدربة مسبقا مسبقا في هذا العمل في أمثلة تقييم Tentrans.
تقترح هذه الورقة تنفيذ الكلمات الخمسة لغات جنوب إفريقيا، وهي SEPEDI و SETSWANA و TSHIVENDA و ISZULU و ISIXHOSA لإضافتها لفتح Wordnets متعدد اللغات (OMW) على مجموعة أدوات اللغة الطبيعية (NLTK).يتم تحويل Wordnets الأفريقي من Princeton Wordnet (PWN) 2.0 إلى 3.0 لتتناسب مع Synsets في PWN 3.0.بعد التحويل، كان هناك 7157 و 11972 و 1288 و 6380 و 9460 Lemmas لسيبيدي و Setswana و Tshivenda و Isizulu و ISIX- Hosa على التوالي.Setswana، ISIXHOSA، SEPEDI يحتوي على المزيد من الليمان مقارنة ب 8 لغات في OMW و ISZULU يحتوي على المزيد من الليمون مقارنة ب 7 لغات في OMW.تم نشر مكتبة للتطوير المستمر للملفات الأفريقية في OMW باستخدام NLTK.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا