ترغب بنشر مسار تعليمي؟ اضغط هنا

Word Word الأيسلندية: إعادة تصميم تركز على تكنولوجيا اللغة لقاعدة بيانات معجمية

The Icelandic Word Web: A language technology-focused redesign of a lexicosemantic database

71   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كلمة الويب الأيسلندية الجديدة (IW) هي إعادة تصميم تكنولوجيا لغة تركز على قاعدة بيانات معجمية للإدخالات ذات الصلة الدوالية.تم تنفيذ كيانات IW والعلاقات وخطط البيانات الوصفية والتصنيف من الصفر في أنظمة اثنين، Ontolex and Skos.بعد إجراء بعض التعديلات على نظام التشغيل البيني Ontolex و SKOS، كان من الممكن أيضا تنفيذ ميزات IW المحددة التي، في حين أن المحتمل غير المحتمل، تشكل جزءا لا يتجزأ من الوظيفة المعجمية للإنترنت Word.أيضا في هذا التنفيذ يتم الوصول إلى كمية أكبر من البيانات اللغوية، ومجموعة أكبر من خيارات البحث، وإمكانية معالجة الآلي، والقدرة على إجراء البحوث من خلال Sparql دون امتلاك إتقان أيسلندي.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم دراسة تمثيلات الكلمات المخولة بمعلومات لغوية إضافية وأثبت أنها تتفوق على المدينات التقليدية. تركز الأساليب الحالية بشكل رئيسي على تضمينات التعلم للكلمات أثناء تضمينها من المعلومات اللغوية (المشار إليها باسم تضمين الحبوب) بعد التعلم. يقترح هذا العم ل تضمين ميداني إطار لإمكانية التعلم بشكل مشترك لكل من وظائف الكلمة والحبوب من خلال دمج المجالات اللغوية المورفولوجية والصوتية والخلوية. يزعم الإطار أن خط أنابيب مبتكرة غرامة يدمج الحقول اللغوية المتعددة وتنتج تسلسلات الحبوب عالية الجودة لتعلم تمثيلات الكلمات العليا. تم تصميم خوارزمية رواية أيضا لتعلم المدينات للكلمات والحبوب عن طريق التقاط المعلومات الواردة داخل كل مجال ويتم تقاسمها عبرها. النتائج التجريبية للمهام المعجمية ومهام معالجة اللغة الطبيعية المصب توضح أن إطار عملنا يمكن أن يتعلم أفضل تضمين الوزراء وشرح الحبوب. التقييمات النوعية تظهر تضييق الحبوب التقاط المعلومات الدلالية بشكل فعال.
تصف هذه المساهمة وحدة من الدورة التدريبية تسعى إلى توفير التخصصات الإنسانية مع فهم أساسي لتكنولوجيا اللغة وتطبيقاتها باستخدام Python.تتكون مواد التعلم من أجهزة الكمبيوتر المحمولة Jupyter التفاعلية ومرافقة مقاطع فيديو YouTube، والتي تتوفر بدراء مع ترخيص Creative Commons.
نقدم نهجا جديدا لتجانس وتحسين جودة Adgeddings Word.نحن نعتبر طريقة لتدبير تضمين كلمة تم تدريبها على نفس الكملات ولكن مع تهيئة مختلفة.نقوم بتعريف جميع النماذج إلى مساحة متجهية مشتركة باستخدام تطبيق فعال لإجراءات تحليل Scristes (GPA) المعمم (GPA)، تستخ دم سابقا في ترجمة Word متعددة اللغات.يوضح تمثيل الكلمات لدينا تحسينات متسقة على النماذج الأولية وكذلك متوسطها التبسيط، على مجموعة من المهام.نظرا لأن التمثيلات الجديدة أكثر استقرارا وموثوقة، فهناك تحسن ملحوظ في تقييمات كلمة نادرة.
نقدم Query2Prod2VEC، وهو نموذج يسبب تمثيلات معجمية للبحث عن المنتج في تضمين المنتج: في نموذجنا، يعني المعنى رسم خرائط بين الكلمات والمساحة الكامنة من المنتجات في متجر رقمي.نستفيد من جلسات التسوق لتعلم المساحة الأساسية واستخدام التعليقات التوضيحية للت جارة لبناء التظليلات المعجمية للتقييم: تظهر تجاربنا أن طرازنا أكثر دقة من التقنيات المعروفة من أدب NLP و IR.أخيرا، نشدد على أهمية كفاءة البيانات للبحث عن المنتج خارج عمالقة البيع بالتجزئة، وتسليط الضوء على كيفية تناسب Query2Prod2VEC قيودا عملية التي يواجهها معظم الممارسين.
في هذه الورقة، نقدم رؤية تجاه إنشاء منصة مالطا لتكنولوجيا اللغات الوطنية؛جهد مستمر يهدف إلى توفير أساس لتعزيز اللغات الرسمية في مالطا، أي المالطية والإنجليزية، باستخدام الترجمة الآلية.سيؤدي ذلك إلى المساهمة في تحسين دعم تكنولوجيا اللغة الحالية لغوية لغة الموارد المنخفضة المالطية، عبر حقول اللغويات الحسابية المتعددة، مثل معالجة الكلام والترجمة الآلية وتحليل النصوص ومصادر متعددة الوسائط.تتمثل الأهداف النهائية في إزالة الحواجز اللغوية، وزيادة إمكانية الوصول، وتعزيز الخدمات عبر الحدود، والأهم من ذلك لتسهيل الحفاظ على اللغة المالطية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا