ترغب بنشر مسار تعليمي؟ اضغط هنا

الاعتراف الدلالي المعجمي

Lexical Semantic Recognition

461   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في دلالات معجمية، يتم علاج تجزئة الجملة الكاملة ووضع القطاع من الظواهر المختلفة بشكل عام بشكل منفصل، على الرغم من الترابط.نحن نفترض أن مهمة الاعتراف الدلالية المعتمدة الموحدة هي وسيلة فعالة لتغليف الأساليب التوضيحية سابقا من التوضيحية، بما في ذلك التعبير / التصنيف التعبير المتعدد الكلمات والعلامات الفائقة.باستخدام Streusle Corpus، نربط تسلسل CRF العصبي Tagger وتقييم أدائه على طول محاور مختلفة من التوضيحية.نظرا لأن مجموعة العلامات تعميم تعميم المهام السابقة (PARSEME، DIMSUM)، فإننا نتقييم بالإضافة إلى ذلك مدى جودة تعميم النموذج إلى مجموعات الاختبار هذه، وإيجاد أنها تقترب أو تجاوز النماذج الحالية على الرغم من التدريب فقط على Streusle.ينشئ عملنا أيضا نماذج أساسية ومقاييس التقييم لنمذجة متكاملة ودقيقة للدلالات المعجمية، مما يسهل العمل في المستقبل في هذا المجال.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تقترح هذه الدراسة نهجا نطق في موقف الكلام لنموذج التعرف على قانون الحوار العصبي القائم على الشبكة (دار)، مما يشتمل على الترميز الموضعي للموقف المطلق أو النسبي للكلام.النهج المقترح مستوحى من الملاحظة أن بعض أعمال الحوار لها اتجاهات مناصب الحدوث.تبين ا لتقييمات على Corpus لوحة المفاتيح أن الترميز الموضعي المقترح للكلام يحسن إحصائيا بشكل كبير أداء دار.
تقدم هذه الورقة توقعات إطارات دلالية، وهي مهمة تتوقع الإطارات الدلالية التي ستحدث في الجمل العشرة أو 100 أو حتى 1000 شخص في قصة تشغيل. ركز العمل السابق على التنبؤ بالمستقبل الفوري للقصة، مثل واحد إلى بعض الأحكام المقبلة. ومع ذلك، عندما يكتب الروائيون قصص طويلة، فإن توليد بعض الجمل لا يكفي لمساعدتهم على اكتساب نظرة ثاقبة رفيعة المستوى لتطوير قصة المتابعة. في هذه الورقة، نقوم بصياغة قصة طويلة كسلسلة من كتل القصة، "حيث تحتوي كل كتلة على عدد ثابت من الجمل (E.G.، 10 أو 100، أو 200). يسمح لنا هذه الصياغة بالتنبؤ بقص القصة المتابعة تتجاوز نطاق بعض الجمل. نحن نمثل كتلة قصة باستخدام الترددات المصطلح (TF) من الإطارات الدلالية فيها، وتطبيعها من خلال تردد المستندات العكسية لكل إطار (IDF). نجري تجارب توقعات دلالية للإطار على 4794 كتابا من Bookcorpus و 7،962 من الملخصات العلمية من CODA-19، مع أحجام الكتلة تتراوح بين 5 إلى 1000 جمل. تظهر النتائج أن النماذج الآلية يمكن أن تتوقع كتل قصة المتابعة أفضل من خطوط الأساس العشوائية السابقة والإعادة، مما يشير إلى جدوى المهمة. نتعلم أيضا أن النماذج التي تستخدم تمثيل الإطار كيزات تفوق جميع الأساليب الموجودة عندما يكون حجم الكتلة أكثر من 150 جمل. يوضح التقييم البشري أيضا تمثيل الإطار المقترح، عند تصوره كدولة كلمة، مفهومة وممثلا ومحددة للبشر.
يمكن أن تكون كمية المعلومات المتاحة عبر الإنترنت ساحقة للمستخدمين من هضمها، خاصة عند التعامل مع تعليقات المستخدمين الآخرين عند اتخاذ قرار بشأن شراء منتج أو خدمة. في هذا السياق، تكون أنظمة تلخيص الرأي ذات قيمة كبيرة، واستخراج معلومات مهمة من النصوص وت قديمها للمستخدم بطريقة أكثر فهمة. من المعروف أيضا أن استخدام التمثيلات الدلالية يمكن أن يفيدن جودة الملخصات التي تم إنشاؤها. تهدف هذه الورقة إلى تطوير أساليب تلخيص الرأي بناء على مجردة معنى تمثيل النصوص في اللغة البرتغالية البرازيلية. تم التحقيق في أربع طرق مختلفة، إلى جانب بعض مناهج الأدب. تظهر النتائج أن الأسلوب المستند إلى جهاز التعلم الآلي أنتج ملخصات ذات جودة أعلى، مما يتفوق على تقنيات الأدب الأخرى على الرسوم البيانية الدلالية المصنوعة يدويا. نعرض أيضا أن استخدام الرسوم البيانية المحيطة بها أكثر من تلك المشروح يدويا ضرر بالإخراج. أخيرا، يشير تحليل مدى أهمية أنواع المعلومات المختلفة لعملية التلخيص إلى أن استخدام ميزات تحليل المعرفات لم يحسن جودة ملخص.
من الصعب معالجة وسائل التواصل الاجتماعي لأدوات معالجة اللغة الطبيعية القائمة، بسبب الأخطاء الإملائية، والكلمات غير القياسية، والتقصاصات، والرسملة غير القياسية وعلامات الترقيم.إحدى الطرق للتحايل على هذه المشكلات هي تطبيع بيانات الإدخال قبل المعالجة.رك زت معظم الأعمال السابقة بلغة واحدة فقط، والتي هي في الغالب الإنجليزية.في هذه الورقة، نحن أول من يقترح نموذجا للتطبيع المتبادل، الذي نشارك فيه في مهمة WNUT 2021 المشتركة.تحقيقا لهذه الغاية، نستخدم Monoise كنقطة انطلاق، وإجراء تكييف بسيط للتطبيق عبر اللغات.ينفأ النموذج الخاص بنا المقترح على خط الأساس في الإجازة التي يوفرها المنظمون الذين نسخ المدخلات.علاوة على ذلك، نستكشف نموذجا مختلفا تماما يحول المهمة إلى مهمة وضع علامة تسلسل.أداء هذا النظام الثاني منخفض، لأنه لا يأخذ القيمة في الاعتبار في تنفيذنا.
مجردة أننا نعتمد وجهة نظر تطورية حول تغيير اللغة التي تؤثر العوامل المعرفية (بالإضافة إلى الخدمات الاجتماعية) على لياقة الكلمات ونجاحها في النظام الإيكولوجي اللغوي.على وجه التحديد، نقترح مجموعة متنوعة من العوامل النفسية --- الدلالية، التوزيع، والفونو لوجي --- أننا نفترض أنها تنبؤية للانخفاض المعجمي، والكلمات تنخفض كثيرا في التردد مع مرور الوقت.باستخدام البيانات التاريخية عبر ثلاث لغات (الإنجليزية والفرنسية والألمانية)، نجد أن معظم عواملنا المقترحة تظهر فرقا كبيرا في الاتجاه المتوقع بين كل مجموعة من جميع الكلمات المنوية وكلماتها المستقرة المتطابقة.علاوة على ذلك، تظهر تحليل الانحدار اللوجستي أن العوامل الدلالية والتوزيع مهمة في التنبؤ بالكلمات المتنوعة.يكشف المزيد من التحليل DIACHRONIC أن انخفاض الكلمات يميل إلى الانخفاض في تنوع سياقاتهم المعجمية بمرور الوقت، وتضييق منافذهم البيئية تدريجيا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا