ترغب بنشر مسار تعليمي؟ اضغط هنا

النماذج التوزيعية الصعبة مع شبكة مفاهيمية من المصطلحات الفلسفية

Challenging distributional models with a conceptual network of philosophical terms

97   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

ألهمت البحوث اللغوية الحسابية على تغيير اللغة من خلال نماذج التوزيع الدلالي (DS) باحثين من مجالات مثل الفلسفة والدراسات الأدبية، الذين يستخدمون هذه الأساليب لاستكشاف ومقارنة مجموعات البيانات الصغيرة النسبية نسبيا تحليلها تقليديا عن طريق القراءة الدقيقة.لا يزال البحث في أساليب البيانات الصغيرة في المراحل المبكرة وليس من الواضح الطرق التي تحقق أفضل النتائج.نحن نبحث في إمكانيات وقيود استخدام النماذج الدلالية التوزيعية لتحليل البيانات الفلسفية عن طريق حالة استخدام واقعية.نحن نقدم حقيقة أرضية للتقييم التي أنشأتها خبراء الفلسفة ومخطط لاستخدام نماذج DS في إعداد منهجي سليم.نقارن ثلاث طرق لإنشاء نماذج متخصصة من مجموعات البيانات الصغيرة.على الرغم من أن النماذج لا تؤدي بشكل جيد بما يكفي لدعم الفلاسفة مباشرة، إلا أننا نجد أن النماذج المصممة لإنتاج البيانات الصغيرة واعدة في العمل في المستقبل.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

استكشف البحث المسبق قدرة النماذج الحسابية للتنبؤ بكلمة ملائمة للكلمة مع مسند معين. في حين تم تخصيص الكثير من العمل لنمذجة العلاقة النموذجية بين الأفعال والحجج بمعزل، في هذه الورقة، نأخذ منظور أوسع من خلال تقييم ما إذا كانت النهج الحسابية أو إلى أي مد ى يمكن للمناهج الحسابية الوصول إلى المعلومات حول نموذجي الأحداث والمواقف بالكامل الموصوفة اللغة (معرفة الحدث المعمم). بالنظر إلى النجاح الأخير لنماذج لغة المحولات (TLMS)، قررنا اختبارها على معيار لتقدير ديناميكي للملاءمة المواضيعية. تم إجراء تقييم هذه النماذج مقارنة مع SDM، وهو إطار مصمم خصيصا لإدماج الأحداث في الجملة التي تعني التمثيلات، وجرينا تحليل خطأ مفصل للتحقيق في العوامل التي تؤثر على سلوكهم. تظهر نتائجنا أن TLMS يمكن أن تصل إلى العروض المقارنة لأولئك الذين حققتهم SDM. ومع ذلك، يقترح تحليل إضافي باستمرار أن TLMS لا تلتقط جوانب مهمة من المعرفة الحدث، وغالبا ما تعتمد تنبؤاتها على الميزات اللغوية السطحية، مثل الكلمات المتكررة والترحيل والأنماط الأساسية، مما يظهر قدرات التعميم دون المستوى الأمثل.
في هذه الورقة مقارنة أداء ثلاث نماذج: SGNS (أخذ العينات السلبية Skip-Gram) والإصدارات المعززة من SVD (تحلل القيمة المفرد) و PPMI (معلومات متبادلة إيجابية) على مهمة تشابه كلمة.نحن نركز بشكل خاص على دور ضبط فرط التشعيم من أجل الهندية القائمة على التوصي ات المقدمة في العمل السابق (على اللغة الإنجليزية).تظهر نتائجنا أن هناك تفضيلات محددة للغة لهذه الفرط.نحن نقدم أفضل إعدادات للهيكلية إلى مجموعة من اللغات ذات العلاقة: البنجابية، الغوجاراتية والمريثي مع نتائج مواتية.نجد أيضا أن نموذج SVD يتم ضبطه بشكل مناسب يتفوق على SGNS لمعظم لغاتنا وهو أيضا أكثر قوة في إعداد الموارد المنخفضة.
تبسيط النص هو حقل متزايد مع العديد من التطبيقات المفيدة المحتملة.تتطلب خوارزميات تبسيط النص التدريب عموما الكثير من البيانات المشروحة، ومع ذلك لا توجد العديد من الشركات المناسبة لهذه المهمة.نقترح طريقة جديدة غير مخالفة لمحاذاة النص بناء على تضمين Doc 2vec وخوارزمية محاذاة جديدة، قادرة على محاذاة النصوص على مستويات مختلفة.يوضح التقييم الأولي نتائج واعدة للنهج الجديد.استخدمنا النهج المطور الذي تم تطويره حديثا لإنشاء كوربلا متوازيا أحادية طيور أحادية جديدة تتألف من أعمال الفلاسفة الحديث الإنجليزي وإصداراتهم المبسطة المقابلة.
تهدف استخراج العلاقات القائم على الحوار (إعادة) إلى استخراج العلاقة بين الحججتين التي تظهر في حوار. نظرا لأن الحوارات لديها خصائص حوادث الضمير الشخصية العالية وكثافة المعلومات المنخفضة، وبما أن معظم الحقائق العلائقية في الحوارات لا تدعمها أي جملة واح دة، فإن استخراج العلاقات القائمة على الحوار يتطلب فهم شامل للحوار. في هذه الورقة، نقترح Network Network Commany Commany Computal Network (Tucore-GCN) على غرار الاهتمام بالطريقة التي يفهم بها الناس الحوارات. بالإضافة إلى ذلك، نقترح نهج رواية يعامل مهمة الاعتراف بالمحادثات في المحادثات (ERC) كإعادة حوار قائما. تثبت التجارب في DataSet مقصورة الحوار وثلاث مجموعات بيانات ERC أن طرازنا فعال للغاية في مهام فهم اللغة الطبيعية القائمة على الحوار. في هذه التجارب، تتفوق Tucore-GCN على النماذج الحديثة على معظم مجموعات البيانات القياسية. يتوفر الكود الخاص بنا في https://github.com/blacknoodle/tucore-gcn.
لترجيل اللغة المنطوقة إلى المتوسطة المكتوبة، تمكن معظم الحروف الهجائية قاعدة صوتية لا لبس فيها.ومع ذلك، فقد نأت بعض أنظمة الكتابة أنفسهم من هذا المفهوم البسيط والعمل القليل من العمل في معالجة اللغة الطبيعية (NLP) على قياس المسافة.في هذه الدراسة، نستخ دم نموذج شبكة عصبي اصطناعي (آن) لتقييم الشفافية بين الكلمات المكتوبة ونطقها، وبالتالي تسميته تقدير الشفافية الذاتية مع آن (Oteann).بناء على مجموعات البيانات المستمدة من قواميس ويكيميديا، ندربنا هذا النموذج واختبر هذا النموذج لتسجيل النسبة المئوية للتنبؤات الخاطئة في مهام الترجمة من PhoneMe-to-grapheme و grapheme-to-phoneme.كانت الدرجات التي تم الحصول عليها على 17 تقييدا تتماشى مع تقديرات الدراسات الأخرى.ومن المثير للاهتمام، أن النموذج قدم أيضا نظرة ثاقبة أخطاء نموذجية مصنوعة من المتعلمين الذين ينظرون فقط في الحكم الصوتي في القراءة والكتابة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا