نادرا ما تعطي أنظمة NLP اعتبارا خاصا للأرقام الموجودة في النص.هذا يتناقض بشكل صارخ مع توافق الآراء في علم الأعصاب، في الدماغ، يتم تمثيل الأرقام بشكل مختلف عن الكلمات.نحن نقوم بترتيب أعمال NLP الأخيرة على الحساب في تصنيف شامل للتصنيف والأساليب.نقوم بفحص الفكرة الشخصية للعسمة في 7 مجموعات فرعية، مرتبة على طول الأبعاد: الحبيبية (التقريبي الدقيق التقريبي) والوحدات (مجردة مقابل مؤسسة).نقوم بتحليل الخيارات التمثيلية لا تعد ولا تحصى التي قامت بأكثر من عشرة أرقام منشورة سابقا وروائح الكشف.نتوضع أفضل الممارسات لتمثيل الأرقام في النص والتعبير عن رؤية للحساب الشمولي في NLP، تتألف من مفاضات التصميم وتقييم موحد.
NLP systems rarely give special consideration to numbers found in text. This starkly contrasts with the consensus in neuroscience that, in the brain, numbers are represented differently from words. We arrange recent NLP work on numeracy into a comprehensive taxonomy of tasks and methods. We break down the subjective notion of numeracy into 7 subtasks, arranged along two dimensions: granularity (exact vs approximate) and units (abstract vs grounded). We analyze the myriad representational choices made by over a dozen previously published number encoders and decoders. We synthesize best practices for representing numbers in text and articulate a vision for holistic numeracy in NLP, comprised of design trade-offs and a unified evaluation.
المراجع المستخدمة
https://aclanthology.org/
تصحيح الأخطاء المجردة نموذج تعلم الجهاز أمر صعب للغاية حيث يشمل الخطأ عادة بيانات التدريب وعملية التعلم.يصبح هذا أكثر صعوبة بالنسبة لطراز التعلم العميق غير المشفح إذا لم يكن لدينا أدنى فكرة عن كيفية عمل النموذج بالفعل.في هذا الاستطلاع، نراجع الأوراق
يجعل معالجة اللغة الطبيعية الحديثة (NLP) استخداما مكثفا لأساليب التعلم العميق بسبب الدقة التي تقدمها لمجموعة متنوعة من التطبيقات.نظرا للتأثير البيئي الكبير للبيئة للتعلم العميق، تم اقتراح تحليل التكلفة والفائدة بما في ذلك بصمة الكربون وكذلك تدابير ال
لقد حقق مجال NLP تقدما كبيرا في بناء تعويضات المعنى.ومع ذلك، تم تجاهل جانب مهم من المعنى اللغوي، والمعنى الاجتماعي، إلى حد كبير.نقدم مفهوم المعنى الاجتماعي ل NLP ومناقشة كيفية إبلاغ رؤى Sociolinguics بالعمل على التعلم في التمثيل في NLP.نحدد أيضا التحديات الرئيسية لهذا الخط الجديد من البحث.
يلعب اختلاف المجال دورا مهما في تقدير أداء نموذج في مجالات جديدة. في حين أن هناك أدب كبيرا على تدابير الاختلاف، يجد الباحثون صعوبة في اختيار الاختلاف المناسب لتطبيق NLP معين. نحن نتطلع إلى هذا القصور من قبل كل من المسح الأدبيات ومن خلال دراسة تجريبية
كيف يمكننا تصميم أنظمة معالجة اللغة الطبيعية (NLP) التي تتعلم من ردود الفعل البشرية؟هناك هيئة بحثية متزايدة من أطر NLP البشرية (HITL) التي تدمج بشكل مستمر ردود الفعل الإنسانية لتحسين النموذج نفسه.Hitl NLP Research NLP NATCENT ولكن MultiriSious - حل م