ترغب بنشر مسار تعليمي؟ اضغط هنا

فهم الفضاء الدلالي: كيف تعاني كلمة تتكيف ديناميكيا في سياق الجملة

Understanding the Semantic Space: How Word Meanings Dynamically Adapt in the Context of a Sentence

317   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

كيف يفهم الناس معنى كلمة صغيرة "عند استخدامها لوصف البعوض أو الكنيسة أو كوكب؟في حين أن البشر لديهم قدرة رائعة على تشكيل معاني من خلال الجمع بين المفاهيم القائمة، فإن نمذجة هذه العملية تحديا.تتناول هذه الورقة هذا التحدي من خلال Cerebra (تمثيلات المعنى المعنى المعني بالسياق في الدماغ) نموذج الشبكة العصبية.يميز Cerebra كيف يتكيف معاني الكلمات بشكل ديناميكي في سياق جملة من خلال الحكم المتحلل في جمهورية FMRI إلى الكلمات والكلمات في ميزات الدلالية المجدولة في الدماغ.يوضح أن الكلمات في سياقات مختلفة لها تمثيلات مختلفة والكلمة التي تعني التغييرات بطريقة ذات معنى إلى الموضوعات البشرية.يمكن أن تستخدم التمثيلات القائمة على سياق Cerebra لجعل تطبيقات NLP أكثر تشبه الإنسان.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

عندما ينتشر خطاب الكراهية على وسائل التواصل الاجتماعي والمجتمعات عبر الإنترنت، يستمر البحث في العمل على الكشف التلقائي.في الآونة الأخيرة، كان أداء الاعتراف يتزايد بفضل التقدم في التعلم العميق وإدماج ميزات المستخدم.يحقق هذا العمل في الآثار التي يمكن أ ن تحتوي هذه الميزات على نموذج للكشف.على عكس البحث السابق، نظهر أن مقارنة الأداء البسيطة لا تعرض التأثير الكامل لضمان معلومات السياق والمستخدمية.من خلال الاستفادة من تقنيات الشرط، نعرض (1) يلعب ميزات المستخدم دورا في قرار النموذج و (2) كيف تؤثر على مساحة الميزة المستفادة من النموذج.إلى جانب الكشف عن ذلك --- وتوضيح أيضا لماذا --- ميزات المستخدم هي سبب مكاسب الأداء، نوضح كيف يمكن دمج هذه التقنيات إلى فهم النموذج بشكل أفضل والكشف عن التحيز غير المقصود.
غالبا ما تشمل توصيات المرادف التقليدية اقتراحات غير مناسبة للسياقات المحددة للكاتب.نقترح نهج بسيط لتوصية مرادف السياق من خلال الجمع بين الرسوم البيانية القائمة على الإنسان، على سبيل المثالWordnet، مع نماذج اللغة المدربة مسبقا.نقوم بتقييم تقنيةنا عن ط ريق برعاية مجموعة من أزواج الجملة بكلمة الكلمة متوازنة عبر كوربورا وأجزاء الكلام، ثم قم بتسليم كل زوج جملة الكلمة مع مجموعة من المرادفات المناسبة للسياق.وجدنا أن نهج نموذج اللغة الأساسية لها دقة أعلى.الأساليب الاستفادة من سياق الجملة لها استدعاء أعلى.بشكل عام، كانت النهج السياقي الأخير لديه أعلى درجة F.
تم اعتماد الأساليب القائمة على الرسم البياني مؤخرا لتلخيص نص مبادرة.ومع ذلك، فإن الأساليب القائمة على الرسم البياني الموجودة فقط تنظر فقط في علاقات الكلمات أو معلومات الهيكل، والتي تهمل الارتباط بينهما.في وقت واحد التقاط علاقات الكلمة ومعلومات الهيكل من الجمل، نقترح شبكة الرسم البياني المزدوج الرواية لتلخيص جملة الاختيارات.على وجه التحديد، نقوم أولا بإنشاء رسم بياني للسيناريو الدلالي والكلمة الدلالية الرسم البياني على أساس FRAMENET، وبالتالي تعلم تمثيلاتها وطريقة الانصهار الرسم البياني للتصميم لتعزيز ارتباطها والحصول على تمثيل دلالي أفضل لجيل الملخص.تظهر النتائج التجريبية النموذج لدينا تفوق الأساليب الموجودة في مجموعة بيانات قياسية شعبية، I.E.، GIGAWORD و DUC 2004.
ندرس مشكلة توليد مشاكل كلمة الرياضيات الحسابية (MWPS) بالنظر إلى معادلة الرياضيات التي تحدد الحساب الرياضي والسياق الذي يحدد سيناريو المشكلة.الأساليب الحالية عرضة لتوليد MWPS والتي هي إما غير صالحة للرياضيات أو لها جودة لغة غير مرضية.كما أنها إما تتج اهل السياق أو تتطلب مواصفات يدوية لقالب مشكلة، والتي تساوم، تنوع mwps التي تم إنشاؤها.في هذه الورقة، نحن نطور نهج جيل MWP الجديد الذي يرفع طرازات اللغة المدربة مسبقا ونموذج اختيار الكلمات الرئيسية السياق لتحسين جودة اللغة من MWPS المولدة والثاني) لقيود اتساق المعادلة لمعادلات الرياضيات لتحسين الصلاحية الرياضيةmwps التي تم إنشاؤها.تجارب كمية واسعة من الكمية والنوعية على ثلاثة مجموعات بيانات MWP العالمية الحقيقية توضح الأداء الفائق لنهجنا مقارنة مع خطوط الأساس المختلفة.
غالبا ما تستخدم Lemmatization من اللغات الغنية المورفولوجية لمعالجة القضايا الناجمة عن التعقيد المورفولوجي، التي أجريتها Lemmatizers القائم على القواعد.نقترح بديلا لهذا، في شكل أداة تقوم بتنفيذ Lemmatization في مساحة Word Embeddings.تضيء كلمة كتمثيل موزز أصلي بعض المعلومات حول العلاقة بين الأساس والنماذج المؤذية، وإظهار أنه من الممكن تعلم التحول الذي يوصي ما يقرب من تضييق أشرطة النماذج التي تم تأصيلها إلى Admass of the المقابلة.يؤدي هذا إلى تسهيل خط أنابيب معالجة بديل يحل محل الليمات التقليدية مع التحول الليمون في معالجة المصب لأي تطبيق.نوضح الطريقة في اللغة الفنلندية، مما يتفوق على Lemmatizers التقليدية على سبيل المثال مهمة مقارنة تشابه الوثيقة، ولكن النهج مستقلة للغة ويمكن تدريب لغات جديدة مع متطلبات خفيفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا