ترغب بنشر مسار تعليمي؟ اضغط هنا

عند كتابة كتاب مدرسي في معالجة اللغة الطبيعية

On Writing a Textbook on Natural Language Processing

281   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

هناك الآلاف من الأوراق حول معالجة اللغة الطبيعية واللغويات الحاسوبية، ولكن عدد قليل جدا من الكتب المدرسية.أصف الدافع والعملية لكتابة كتاب مدرسي في كلية حول معالجة اللغة الطبيعية، وتقديم المشورة والتشجيع للقراء الذين قد يهتمون بكتابة كتاب مدرسي خاص بهم.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يتغير مجال معالجة اللغة الطبيعية (NLP) بسرعة، مما يتطلب عروض الدورة التدريبية للتكيف مع تلك التغييرات، و NLP ليس فقط لعلماء الكمبيوتر؛إنه مجال يجب أن يكون متاحا لأي شخص لديه خلفية كافية.في هذه الورقة، أشرح كيف يمكن إعداد الطلاب الذين لديهم خلفيات علو م الكمبيوتر وعلوم البيانات جيدا لدورة NLP الشعبة العليا في جامعة ولاية كبيرة.تغطي الدورة نظرية الاحتمالات ونظرية المعلومات، واللطاقات الأولية، والآلة والتعلم العميق، مع محاولة لتحقيق التوازن بين الأفكار والمفاهيم النظرية مع التطبيقات العملية.أشرح أهداف الدورة والمواضيع والواجبات، والتفكير في التعديلات على الدورة خلال السنوات الأربع الماضية، وكذلك ردود الفعل من الطلاب.
في هذه الورقة، نقدم دورة جديدة مفتوحة مفتوحة على الإنترنت على معالجة اللغة الطبيعية، وتستهدف الطلاب غير الإنجليزيين.تستمر الدورة 12 أسبوعا، كل أسبوع يتكون من محاضرات وجلسات عملية واعتيادات مسابقة.ثلاثة أسابيع من أصل 12 تليها الاعتمادات الترميز على غر ار Kaggle.حدة الدورة لدينا لخدمة أغراض متعددة: (ط) العائلة الطلاب مع المفاهيم الأساسية والأساليب في NLP، مثل نمذجة اللغة أو تمثيلات الكلمة أو الكلمة، (II) إظهار أن التطورات الحديثة، بما في ذلك النماذج القائمة على المحولات المدربة مسبقا، هيبناء على هذه المفاهيم؛(3) تقديم هياكنا للحصول على معظم التطبيقات الحقيقية الأكثر طلبا، (3) تطوير مهارات عملية لمعالجة النصوص بلغات متعددة.تم إعداد الدورة المسجلة وتسجيلها خلال عام 2020 وحتى الآن تلقت ردود فعل إيجابية.
تستكشف هذه المقالة إمكانية معالجة اللغات الطبيعية (NLP) لتمكين نموذج شرطة مركزة وأقل فعالية وأقل من المواجهة التي كانت تستهلك حتى الآن من الموارد لتنفيذ الحجم. الشرطة المنحى للمشاكل (البوب) هي استبدال محتمل، على الأقل جزئيا، بالنسبة للشرطة التقليدية التي تعتمد نهجا تفاعلا، تعتمد اعتمادا كبيرا على نظام العدالة الجنائية. على النقيض من ذلك، يسعى البوب ​​لمنع الجريمة من خلال التلاعب بالظروف الأساسية التي تسمح بالارتكاب الجرائم. يتطلب تحديد هذه الشروط الأساسية فهما مفصلا لأحداث الجريمة - معرفة ضمنية تعقد غالبا من قبل ضباط الشرطة ولكن يمكن أن تكون صعبة للغاية للاستمتاع ببيانات الشرطة المهيكلة. يوجد أحد المصدر المحتمل للنصية في بيانات نصية مجانية غير منظمة تجمعها الشرطة لأغراض التحقيق أو الإدارة. ومع ذلك، فإن وكالات الشرطة لا تحتوي عادة على المهارات أو الموارد لتحليل هذه البيانات على نطاق واسع. في هذه المقالة، نقول أن NLP يقدم القدرة على فتح هذه البيانات غير المنظمة وبالتالي السماح للشرطة بتنفيذ المزيد من مبادرات البوب. ومع ذلك، نحذر أن استخدام نماذج NLP دون معرفة كافية قد يسمح إما بإدخال التحيز داخل البيانات التي تؤدي إلى نتائج غير مواتية.
في هذه الورقة، نقترح تعريف وتعريفي من أنواع مختلفة من المحتوى النصي غير القياسي - يشار إليها عموما باسم الضوضاء "- في معالجة اللغة الطبيعية (NLP). في حين أن معالجة البيانات المسبقة هي بلا شك مهم بلا شك في NLP، خاصة عند التعامل مع المحتوى الذي تم إنشا ؤه من قبل المستخدم، فإن فهم أوسع لمصادر الضوضاء المختلفة وكيفية التعامل معها هو جانب تم إهماله إلى حد كبير. نحن نقدم قائمة شاملة للمصادر المحتملة للضوضاء، وتصنيفها ووصفها، وتظهر تأثير مجموعة فرعية من استراتيجيات المعالجة القياسية المعدلة على مهام مختلفة. هدفنا الرئيسي هو زيادة الوعي بالمحتوى غير المعتاد - والذي لا ينبغي اعتباره دائما ضوضاء "- والحاجة إلى المعالجة المسبقة التي تعتمد على المهام. هذا بديل إلى بطانية، مثل الحلول الشاملة التي تطبقها الباحثون بشكل عام من خلال "خطوط أنابيب معالجة مسبقا مسبقا". النية هي لهذا التصنيف بمثابة نقطة مرجعية لدعم الباحثين NLP في وضع الاستراتيجيات لتنظيف أو تطبيع أو احتضان المحتوى غير المعتاد.
كيف يمكننا تصميم أنظمة معالجة اللغة الطبيعية (NLP) التي تتعلم من ردود الفعل البشرية؟هناك هيئة بحثية متزايدة من أطر NLP البشرية (HITL) التي تدمج بشكل مستمر ردود الفعل الإنسانية لتحسين النموذج نفسه.Hitl NLP Research NLP NATCENT ولكن MultiriSious - حل م شاكل NLP المختلفة، وجمع تعليقات متنوعة من أشخاص مختلفين، وتطبيق أساليب مختلفة للتعلم من ردود الفعل الإنسانية.نقدم دراسة استقصا لمجتمعات Hitl NLP من كل من مجتمعات التعلم الآلي (ML) وتفاديا الإنسان (HCI) التي تسلط الضوء على تاريخها القصير الذي يلهم، ويلخص تماما الأطر الأخيرة التي تركز على مهامها وأهدافها والتفاعلات البشرية وتعلم ردود الفعلطرق.أخيرا، نناقش الدراسات المستقبلية لإدماج ردود فعل إنسانية في حلقة تطوير NLP.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا