ترغب بنشر مسار تعليمي؟ اضغط هنا

تمثيل الأرقام في NLP: مسح ورؤية

Representing Numbers in NLP: a Survey and a Vision

249   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نادرا ما تعطي أنظمة NLP اعتبارا خاصا للأرقام الموجودة في النص.هذا يتناقض بشكل صارخ مع توافق الآراء في علم الأعصاب، في الدماغ، يتم تمثيل الأرقام بشكل مختلف عن الكلمات.نحن نقوم بترتيب أعمال NLP الأخيرة على الحساب في تصنيف شامل للتصنيف والأساليب.نقوم بفحص الفكرة الشخصية للعسمة في 7 مجموعات فرعية، مرتبة على طول الأبعاد: الحبيبية (التقريبي الدقيق التقريبي) والوحدات (مجردة مقابل مؤسسة).نقوم بتحليل الخيارات التمثيلية لا تعد ولا تحصى التي قامت بأكثر من عشرة أرقام منشورة سابقا وروائح الكشف.نتوضع أفضل الممارسات لتمثيل الأرقام في النص والتعبير عن رؤية للحساب الشمولي في NLP، تتألف من مفاضات التصميم وتقييم موحد.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصحيح الأخطاء المجردة نموذج تعلم الجهاز أمر صعب للغاية حيث يشمل الخطأ عادة بيانات التدريب وعملية التعلم.يصبح هذا أكثر صعوبة بالنسبة لطراز التعلم العميق غير المشفح إذا لم يكن لدينا أدنى فكرة عن كيفية عمل النموذج بالفعل.في هذا الاستطلاع، نراجع الأوراق التي تستغلها تفسيرات لتمكين البشر من تقديم ملاحظات وتصحيح نماذج NLP.نسمي هذه المشكلة تصحيح الأخطاء البشرية القائم على التفسير (EBHD).على وجه الخصوص، نقوم بتصنيف وناقش العمل الحالي على طول ثلاثة أبعاد من EBHD (سياق الأخطاء، وسير العمل، والإعداد التجريبي)، تجميع النتائج حول كيفية تأثير مكونات EBHD على مقدمي التعليقات، وتسليط الضوء على المشاكل المفتوحة التي يمكن أن تكون اتجاهات بحثية في المستقبل.
يجعل معالجة اللغة الطبيعية الحديثة (NLP) استخداما مكثفا لأساليب التعلم العميق بسبب الدقة التي تقدمها لمجموعة متنوعة من التطبيقات.نظرا للتأثير البيئي الكبير للبيئة للتعلم العميق، تم اقتراح تحليل التكلفة والفائدة بما في ذلك بصمة الكربون وكذلك تدابير ال دقة لتحسين توثيق استخدام أساليب NLP للبحث أو النشر.في هذه الورقة، نراجع الأدوات المتاحة لقياس استخدام الطاقة وانبعاثات ثاني أكسيد الكربون لأساليب NLP.نحن تصف نطاق التدابير المقدمة ومقارنة استخدام ستة أدوات (تعقب الكربون، تعقب تأثير التجريب، الخوارزميات الخضراء، تأثير ثاني أكسيد الكربون، واستخدام الطاقة والاستزمي) على تجارب التعرف على الكيان المسماة المنجزة على إعدادات حسابية مختلفة (الخادم المحليمقابل مرفق الحوسبة).بناء على هذه النتائج، نقترح توصيات قابلة للتنفيذ لقياس الأثر البيئي بدقة تجارب NLP.
لقد حقق مجال NLP تقدما كبيرا في بناء تعويضات المعنى.ومع ذلك، تم تجاهل جانب مهم من المعنى اللغوي، والمعنى الاجتماعي، إلى حد كبير.نقدم مفهوم المعنى الاجتماعي ل NLP ومناقشة كيفية إبلاغ رؤى Sociolinguics بالعمل على التعلم في التمثيل في NLP.نحدد أيضا التحديات الرئيسية لهذا الخط الجديد من البحث.
يلعب اختلاف المجال دورا مهما في تقدير أداء نموذج في مجالات جديدة. في حين أن هناك أدب كبيرا على تدابير الاختلاف، يجد الباحثون صعوبة في اختيار الاختلاف المناسب لتطبيق NLP معين. نحن نتطلع إلى هذا القصور من قبل كل من المسح الأدبيات ومن خلال دراسة تجريبية . نحن نطور تصنيفا من تدابير الاختلاف التي تتكون من ثلاث فصول --- إجراءات نظرية ونشرية هندسية وترتيب أعلى وتحديد العلاقات بينهما. علاوة على ذلك، لفهم حالات الاستخدام المشترك لهذه التدابير، نحن ندرك ثلاث تطبيقات جديدة - 1) اختيار البيانات، 2) تمثيل التعلم، و 3) القرارات في البرية - واستخدامها لتنظيم أدبنا. من هذا، نحدد أن التدابير النظريية للمعلومات منتشرة لمدة 1) و 3)، وتدابير ذات ترتيب أعلى أكثر شيوعا لمدة 2). لمزيد من المساعدة في مساعدة الباحثين في اختيار التدابير المناسبة للتنبؤ بالانخفاض في الأداء - وهو جانب مهم في القرارات في البرية، نقوم بإجراء تحليل العلاقة الممتدة 130 سيناريوهات تكيف المجال، و 3 مهام NLP متنوعة و 12 تدابير مختلفة تم تحديدها من مسحنا. لحساب هذه الاختلافات، نعتبر تمثيلات الكلمات السياقية الحالية (CWR) والتباين من التمثيلات الموزعة الأكبر سنا. نجد أن التدابير التقليدية على توزيعات الكلمات لا تزال تعمل كأساس قواعد قوية، في حين أن تدابير ذات طلب أعلى مع CWR فعالة.
كيف يمكننا تصميم أنظمة معالجة اللغة الطبيعية (NLP) التي تتعلم من ردود الفعل البشرية؟هناك هيئة بحثية متزايدة من أطر NLP البشرية (HITL) التي تدمج بشكل مستمر ردود الفعل الإنسانية لتحسين النموذج نفسه.Hitl NLP Research NLP NATCENT ولكن MultiriSious - حل م شاكل NLP المختلفة، وجمع تعليقات متنوعة من أشخاص مختلفين، وتطبيق أساليب مختلفة للتعلم من ردود الفعل الإنسانية.نقدم دراسة استقصا لمجتمعات Hitl NLP من كل من مجتمعات التعلم الآلي (ML) وتفاديا الإنسان (HCI) التي تسلط الضوء على تاريخها القصير الذي يلهم، ويلخص تماما الأطر الأخيرة التي تركز على مهامها وأهدافها والتفاعلات البشرية وتعلم ردود الفعلطرق.أخيرا، نناقش الدراسات المستقبلية لإدماج ردود فعل إنسانية في حلقة تطوير NLP.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا