بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

التعلم التعريف لتصنيف مصدر البيانات غير المرئي سابقا في الفئة العاطفية غير المرئية سابقا

Meta-learning for Classifying Previously Unseen Data Source into Previously Unseen Emotional Categories

979 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

في هذه الورقة، نضع أنفسنا في سيناريو التصنيف الذي لا يمكن الوصول إليه الطبقات المستهدفة ونوع البيانات أثناء التدريب.نستخدم نهج التعلم التلوي لتحديد ما إذا كانت المعلومات التي تم تدريبها على التلوي من بيانات الشبكة الاجتماعية المشتركة مع ملصقات عاطفة من الرعازة يمكن أن تحقق أداء تنافسي على الرسائل المسمى بفئات العاطفة المختلفة.نستفيد القليل من اللقطة التعلم لتتناسب مع سيناريو التصنيف والنظر في التعلم التعلم القائم على التعلم المتري عن طريق إعداد الشبكات النموذجية النموذجية مع تشفير محول، مدربة في أزياء بيئية.يثبت هذا النهج فعالا لالتقاط المعلومات المعوضة من مجموعة من الوسم العاطفي المصدر للتنبؤ علامات عاطفية غير مرئية مسبقا.على الرغم من أن تحويل نوع البيانات يؤدي إلى انخفاض الأداء المتوقع، فإن نهجنا التعلم التلوي يحقق نتائج لائقة عند مقارنته بالآخر تحت الإشراف بالكامل.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

759 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

مطلوبة كميات كبيرة من العمل لتنظيف مجموعات كبيرة من الكتب الرقمية لتحليل NLP، بسبب وجود أخطاء في النص الممسوح ضوئيا ووجود أحجام مكررة في كورسا. في هذه الورقة، نعتبر مسألة deCuplication في وجود أخطاء التعرف على الأحرف البصرية (OCR). نقدم طرق للتعامل م ع هذه الأخطاء، والتي تم تقييمها على مجموعة من 19347 نصية من مشاريع Gutenberg DataSet و 96،635 نصية من مكتبة Hathitrest. نوضح أن التحسينات في النماذج اللغوية الآن تمكن الآن من اكتشاف وأصحام أخطاء التعرف الضوئي على الحروف دون النظر في صورة المسح نفسه. توفر التناقضات التي عثرت عليها محاذاة أزواج من عمليات فحص نفس العمل الأساسي من نفس البيانات التدريبية لإنشاء نماذج للكشف عن الأخطاء وتصحيحها. نحدد الإصدار الكنسي لكل من الكتب 17،136 مرارا وتكرارا من الفحص من 58888 يوم. أخيرا، نحقق في طرق الكشف عن الأخطاء وتصحيحها في نصوص نسخة واحدة. نظهر أنه في المتوسط، تقوم طريقةنا بتصحيح أكثر من ستة أضعاف العديد من الأخطاء كما تقدم. كما نقدم تحليلا مثيرا للاهتمام بشأن العلاقة بين جودة المسح والعوامل الأخرى مثل الموقع والنشر.

cleaning dirty books previously scanned texts processing for previously تنظيف الكتب القذرة الصور الممسوحة ضوئيا سابقا معالجة سابقا صناعة حمض الفوسفور المزيد..

التعلم التعريف لتعميم المجال في التحليل الدلالي

601 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

لقد تم الاعتراف بأهمية بناء المحللين الدلاليين الذين يمكن تطبيقهم على مجالات جديدة وإنشاء برامج غير مرئية في التدريب لفترة طويلة، وقد تم الاعتراف لفترة طويلة، وتصبح مجموعات البيانات اختبار الأداء خارج النطاق متاحة بشكل متزايد. ومع ذلك، فقد تم تخصيص ا هتمام ضئيل أو معدوني لتعلم الخوارزميات أو الأهداف التي تعزز تعميم المجال، حيث تعتمد جميع الأساليب الموجودة تقريبا على التعلم المعياري الإشرافي. في هذا العمل، نستخدم إطارا للتعلم من التعريف الذي يستهدف تعميم المجال الصفرية للتحليل الدلالي. نحن نطبق خوارزمية التدريب النموذجية المرجعية التي تحاكي تحليل اللقطة الصفرية من خلال بناء القطار الافتراضي ومجموعات الاختبار من مجالات Disfoint. يستحق الهدف التعلم عن الحدس الذي يجب عليه اتخاذ خطوات التدرج التي تعمل على تحسين أداء مجال المصدر أيضا على تحسين أداء المجال المستهدف، وبالتالي تشجيع المحلل المحلل على تعميم المجالات المستهدفة غير المرئية. النتائج التجريبية على (الإنجليزية) عن مجموعات البيانات العنكبوت والصينية الصينية تظهر أن هدف التعلم التلوي يعزز بشكل كبير أداء محلل الأساس.

domain generalization تعميم المجال صناعة حمض الفوسفور

MMTL: التعلم Meta متعدد المهام لتحليل المعنويات الفئة في الفئة

763 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تحليل المعنويات الفئة في الأساس (ACSA)، والتي تهدف إلى تحديد أساور المشاعر المحبوبة من فئات الارتفاع المناقشات في مراجعات المستخدمين. ACSA صعبة ومكلفة عند إجراءها في تطبيقات عالمية حقيقية، والتي ترجع بشكل رئيسي إلى الأسباب التالية: 1.) وعلم بيانات AC SA الفاخرة غالبا ما تكون كثيفة العمالة. 2.) سيتم تحديث فئات الارتفاع بشكل ديناميكي وتعديلها بتطوير سيناريوهات التطبيق، مما يعني أن البيانات يجب أن تنعيم بشكل متكرر. 3.) نظرا لزيادة فئات الارتفاع، يجب إعادة تدريب النموذج بشكل متكرر للتكيف السريع مع بيانات فئة الجانب الإضافية حديثا. للتغلب على المشكلات المذكورة أعلاه، نقدم نهجا جديدا للتعلم من التعلم متعددة المهام (MMTL)، هذه المهام ACSA بمثابة مشكلة في التعلم التلوي (أي فيما يتعلق بمشاكل تصنيف قطباء القطبية في الفئة في الفئة مثل المهام التدريبية المختلفة لل meta - التعلم) لتعلم تهيئة مثالية وقابلة للتخصيرة نموذج التعلم متعدد المهام التي يمكن تكييفها مع مهام ACSA الجديدة بكفاءة وفعالية. تشير نتائج التجربة إلى أن النهج المقترح يتفوق بشكل كبير على النموذج الأساسي القائم على المحولات القائم على المحولات القوية مسبقا، خاصة، في حالة وجود بيانات تدريبية على غرامة أقل وصفها.

category sentiment analysis aspect category sentiment الفئة تحليل المشاعر شعور الفئة في الآراء صناعة حمض الفوسفور

تحسين الترجمة آلة حواس الكلمة النادرة وغير المرئية

638 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تحسنت أداء أنظمة NMT بشكل كبير في السنوات القليلة الماضية ولكن ترجمة الكلمات متعددة الإحساس لا تزال تشكل تحديا. نظرا لأن حواس الكلمات ليست ممثلة بشكل موحد في الشركة الموازية المستخدمة للتدريب، فهناك استخدام مفرط من المعنى الأكثر شيوعا في إخراج MT. في هذا العمل، نقترح CMBT (الترجمة ذات الاحتياط بالسياقة)، وهو نهج لتحسين ترجمة كلمة متعددة الشعور بالاستفادة من تمثيل الكلمات السياقية المتبادلة المدربة مسبقا (CCWRS). بسبب حساسية السياق الخاصة بهم وبياناتها السابقة للتدريب الكبيرة، يمكن ل CCWRS الوصول بسهولة إلى حواس الكلمات المفقودة أو نادرة جدا في ولاية فورانيا المستخدمة لتدريب MT. على وجه التحديد، تطبق CMBT تحريض معجم ثنائي اللغة على CCWRS الجمل المستهدفة ذات المحور المنطقي من مجموعة بيانات أحادية الأحادية، ثم يترجم هذه الجمل لإنشاء كورب موازية زائفة كبيانات تدريبية إضافية لنظام MT. نحن نختبر جودة الترجمة من الكلمات الغامضة على جناح اختبار المخاط المخاطي، والتي تم بناؤها لاختبار فعالية حذف كلمة معنى الكلمة لأنظمة MT. نظهر أن نظامنا يتحسن على ترجمة حواس كلمة متعددة الترددات الصعبة والثانية.

improving machine translation improving machine تحسين ترجمة الآلة تحسين آلة صناعة حمض الفوسفور

التعلم التعريف لعدد قليل من طلقة التعرف على الكيان

726 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تم اقتراح التعلم التلوي مؤخرا لتعلم النماذج والخوارزميات التي يمكن أن تعميمها من حفنة من الأمثلة.ومع ذلك، فإن تطبيقات التنبؤ الهيكلية والمهام النصية تشكل تحديات لخوارزميات التعلم التلوي.في هذه الورقة، نحن نطبق اثنين من خوارزميات التعلم التلوي، والشبك ات النموذجية والزواحف الزواحف، إلى عدد قليل من الرصاص التعرف على الكيان (NER)، بما في ذلك طريقة لإدماج نموذج اللغة قبل التدريب والحقول العشوائية الشرطية (CRF).نقترح خطة توليد المهام لتحويل مجموعات بيانات NER الكلاسيكية إلى إعداد القليل من الرصاص، لكل من التدريب والتقييم.باستخدام ثلاث مجموعات بيانات عامة، نظهر أن خوارزميات التعلم التلوي هذه تفوق خطاس بخبراء ذو صقل معقول.بالإضافة إلى ذلك، نقترح مزيجا جديدا من الشبكات النموذجية والزواحف.

النماذج القائمة على المحولات متعددة اللغات few-shot named entity عدد قليل من القليل من الكيان صناعة حمض الفوسفور

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2114 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

معهد تكنولوجيا المعلومات ITI

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

التعلم التعريف لتصنيف مصدر البيانات غير المرئي سابقا في الفئة العاطفية غير المرئية سابقا

Meta-learning for Classifying Previously Unseen Data Source into Previously Unseen Emotional Categories

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة