بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

قوالب وأدلة قابلة لإعادة الاستخدام لتوثيق مجموعات البيانات والنماذج لمعالجة اللغة الطبيعية والجيل: دراسة حالة لبيانات المعانقة وبطاقات النماذج GEM

Reusable Templates and Guides For Documenting Datasets and Models for Natural Language Processing and Generation: A Case Study of the HuggingFace and GEM Data and Model Cards

600 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

تنمية إرشادات الوثائق والقوالب سهلة الاستخدام لمجموعات البيانات والنماذج مهمة صعبة، خاصة بالنظر إلى مجموعة متنوعة من الخلفيات والمهارات وحوافز الأشخاص المشاركين في بناء أدوات معالجة اللغة الطبيعية (NLP). ومع ذلك، فإن اعتماد ممارسات الوثائق القياسية في مجال NLP يعزز أوصاف أكثر سهولة ومفصلة عن مجموعات البيانات والنماذج NLP، مع دعم الباحثين والمطورين في التفكير في عملهم. للمساعدة في توحيد الوثائق، نقدم دراستين بحالتين للجهود التي تهدف إلى تطوير قوالب الوثائق القابلة لإعادة الاستخدام - بطاقة بيانات المعانقة، بطاقة للأغراض العامة لمجموعات البيانات في NLP، والبيانات القياسية Gem البطاقات النموذجية مع التركيز توليد اللغة الطبيعية. نحن نصف عمليتنا لتطوير هذه القوالب، بما في ذلك تحديد مجموعات أصحاب المصلحة المعنيين، وتعريف مجموعة من المبادئ التوجيهية، واستخدام القوالب الحالية كأساس لدينا، ومراجعات تكرارية تستند إلى ردود الفعل.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

1464 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

على الرغم من كفاءتها المثبتة في المجالات الأخرى، فإن تكبير البيانات أقل شعبية في سياق معالجة اللغة الطبيعية (NLP) بسبب تعقيدها ونتائج محدودة.أظهرت دراسة حديثة (Longpre et al.، 2020) على سبيل المثال أن تعزز بيانات المهمة غير المرغوية تفشل في تعزيز أدا ء المحولات مسبقا حتى في أنظمة البيانات المنخفضة.في هذه الورقة، نحقق في ما إذا كان جدولة التكبير التي يحركها البيانات وإدماج مجموعة أوسع من التحولات يمكن أن تؤدي إلى تحسين الأداء حيث كانت السياسات الثابتة والمحدودة غير ناجحة.تشير نتائجنا إلى أنه، في حين أن هذا النهج يمكن أن يساعد عملية التدريب في بعض الإعدادات، فإن التحسينات غير صحيحة.هذه النتيجة السلبية تهدف إلى مساعدة الباحثين فهم أفضل قيود تكبير البيانات من أجل NLP.

مورفولوجي العصبي data augmentation schedules جداول تكبير البيانات صناعة حمض الفوسفور

ميكرومودال لأنظمة فعالة وتفسير وقابلة لإعادة الاستخدام: دراسة حالة حول الصحة العقلية

753 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

العديد من النماذج الإحصائية لها دقة عالية على معايير الاختبار، ولكنها ليست تفسيرها، لا يمكن إعادة استخدام النضال في سيناريوهات الموارد المنخفضة، ولا يمكن إعادة استخدامها لمهام متعددة، ولا يمكن دمج خبرات المجال بسهولة.هذه العوامل تحد من استخدامها، لا سيما في إعدادات الصحة العقلية، حيث من الصعب التعليق على مجموعات البيانات والنواتج النموذجية لها تأثير كبير.نقدم بنية micromodel لمعالجة هذه التحديات.يسمح نهجنا الباحثين ببناء تمثيلات قابلة للتفسير تضمين معرفة المجال وتقديم توضيحات خلال عملية قرار النموذج.نوضح الفكرة على مهام الصحة العقلية المتعددة: تصنيف الاكتئاب، تصنيف PTSD، وتقييم المخاطر الانتحارية.تنتج أنظمتنا باستمرار نتائج قوية، حتى في سيناريوهات الموارد المنخفضة، وهي أكثر تفسيرا من الأساليب البديلة.

مجال غير رسمي غير محدد reusable systems أنظمة قابلة لإعادة الاستخدام صناعة حمض الفوسفور

معالجة اللغة الطبيعية لعلماء الكمبيوتر وعلماء البيانات في جامعة ولاية كبيرة

701 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتغير مجال معالجة اللغة الطبيعية (NLP) بسرعة، مما يتطلب عروض الدورة التدريبية للتكيف مع تلك التغييرات، و NLP ليس فقط لعلماء الكمبيوتر؛إنه مجال يجب أن يكون متاحا لأي شخص لديه خلفية كافية.في هذه الورقة، أشرح كيف يمكن إعداد الطلاب الذين لديهم خلفيات علو م الكمبيوتر وعلوم البيانات جيدا لدورة NLP الشعبة العليا في جامعة ولاية كبيرة.تغطي الدورة نظرية الاحتمالات ونظرية المعلومات، واللطاقات الأولية، والآلة والتعلم العميق، مع محاولة لتحقيق التوازن بين الأفكار والمفاهيم النظرية مع التطبيقات العملية.أشرح أهداف الدورة والمواضيع والواجبات، والتفكير في التعديلات على الدورة خلال السنوات الأربع الماضية، وكذلك ردود الفعل من الطلاب.

بايس ساذجة مقابل. large state university جامعة ولاية كبيرة صناعة حمض الفوسفور

K- التوصيل: نموذج اللغة المحقونة المعرفة مسبقا لفهم اللغة الطبيعية والجيل في التجارة الإلكترونية

800 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أظهرت نماذج اللغة الموجودة مسبقا مسبقا (PLMS) فعالية التعلم الإشراف على الذات لمجموعة واسعة من مهام معالجة اللغة الطبيعية (NLP). ومع ذلك، فإن معظمهم لا يدركون بشكل صريح المعرفة الخاصة بالمجال، وهو أمر ضروري لمهام المصب في العديد من المجالات، مثل المه ام في سيناريوهات التجارة الإلكترونية. في هذه الورقة، نقترح K- المكونات، نموذج لغة محقوم المعرفة مسبقا بناء على محول تشفير التشفير التي يمكن تحويلها إلى كل من فهم اللغة الطبيعية ومهام الجيل. على وجه التحديد، نقترح خمسة أهداف مسبقة الإشراف على علم المعرفة على المعرفة في تصميم تعلم المعرفة الخاصة بالمجال، بما في ذلك قواعد المعرفة الخاصة بالمجال التجاري، وجوانب كيانات المنتج، وفئات من كيانات المنتجات، ومقترحات البيع الفريدة من كيانات المنتج. نتحقق من طريقتنا في مجموعة متنوعة من سيناريوهات التجارة الإلكترونية التي تتطلب معرفة خاصة بالمجال، بما في ذلك إكمال قاعدة معارف المنتج، وخصم منتج مبيعات، والحوار متعدد الدوران. تتفوق K- التوصيل بشكل كبير على خطوط الأساس في جميع المجالات، والتي توضح أن الطريقة المقترحة تتعلم بفعالية مجموعة متنوعة متنوعة من المعرفة الخاصة بالمجال لكل من مهام الفم والجيل اللغوي. رمز لدينا متاح.

pre-trained language model knowledge-injected pre-trained language نموذج اللغة المدرب مسبقا المعرفة المحقونة اللغة المدربة مسبقا صناعة حمض الفوسفور

دورة تحطم على الأخلاقيات لمعالجة اللغة الطبيعية

1238 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتم الاتفاق بشكل عام في مجتمع معالجة اللغة الطبيعية (NLP) على أنه ينبغي دمج الأخلاقيات في أي منهج.إدراك وفهم المفاهيم الأساسية ذات الصلة هو شرط أساسي فيما يتعلق بالمشاركة والمشاركة في الخطاب على NLP الأخلاقية.نقدم هنا مواد تعليمية جاهزة في شكل شرائح وتمارين عملية على القضايا الأخلاقية في NLP، والتي تهدف في المقام الأول إلى دمجها في دورات تمهيدية أو دورات اللغويات الحسابية الحسابية.من خلال جعل هذه المواد متاحة بحرية، نهدف إلى خفض العتبة لإضافة الأخلاق إلى المنهج الدراسي.نأمل أن تتيح زيادة الوعي الطلاب من تحديد السلوك غير الأخلاقي المحتمل.

اللغة التطبيقية صناعة حمض الفوسفور

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2114 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

المعهد الوطني الجزائري للبحث الزراعي

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

قوالب وأدلة قابلة لإعادة الاستخدام لتوثيق مجموعات البيانات والنماذج لمعالجة اللغة الطبيعية والجيل: دراسة حالة لبيانات المعانقة وبطاقات النماذج GEM

Reusable Templates and Guides For Documenting Datasets and Models for Natural Language Processing and Generation: A Case Study of the HuggingFace and GEM Data and Model Cards

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة