ترغب بنشر مسار تعليمي؟ اضغط هنا

تعلم السمات المعالجة من Audiobooks من خلال تحويل الصوت

Learning Paralinguistic Features from Audiobooks through Style Voice Conversion

192   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن المشكلات، والمكونات غير المعجمية في الكلام، تلعب دورا حاسما في التفاعل البشري البشري.من الصعب التدريب على النماذج المصممة للاعتراف بالمعلومات المشكلية، وخاصة مشاعر الكلام والأسلوب، بسبب مجموعات البيانات المحدودة المسمى المتاحة.في هذا العمل، نقدم إطارا جديدا يمكن شبكة عصبية لتعلم استخراج السمات المعالجة من الكلام باستخدام البيانات غير المشروح للعاطفة.نقوم بتقييم فائدة المدينات المستفادة على مهام المصب في الاعتراف بالمشاعر والكشف عن أسلوب التحدث، مما يدل على تحسينات كبيرة على الميزات الصوتية السطحية وكذلك على المدينات المستخرجة من مناهج أخرى غير مخالفة.يتيح عملنا أنظمة المستقبل الاستفادة من النازع التضمين المستفاد كمكون منفصل قادر على تسليط الضوء على المكونات المعيارية في الكلام.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تتداول هذه الورقة عن عملية بناء أول أداة تحويل الدائرة إلى التبعية التركية. نقطة الانطلاق لهذا العمل هي دراسة سابقة التي تحولت فيها 10 آلاف من أشجار هيكل العبارة يدويا إلى تركية من Corpus الأصلي Penntreebank. ضمن نطاق هذا المشروع، تم تحويل هذه العبار ات التركية هذه الأشجار تلقائيا إلى هياكل التبعية على غرار UD، باستخدام خوارزمية تستند إلى القواعد وخوارزمية لتعلم الآلة محددة لمتطلبات اللغة التركية. تمت مقارنة نتائج الخوارزمية وكلاهما أن نهج التعلم الآلي أثبت أنه أكثر دقة من الخوارزمية القائمة على القواعد. تم تنقيح الناتج من قبل فريق من اللغويين. اتخذت الإصدارات المكررة عباحيات قياسية ذهبية لتقييم الخوارزميات. بالإضافة إلى مساهمتها في مشروع UD مع مجموعة بيانات كبيرة من 10،000 شجرة التبعية التركية، فإن هذا المشروع يفي أيضا فجوة مهمة للأداة التحويل التركية، مما يتيح التعدد السريع من شركة التبعية التي يمكن استخدامها لتدريب محلل التبعية الأفضل وبعد
نقدم نهجا للتعلم اكتشاف سقالة لإدخال مفاهيم في دورة معالجة اللغة الطبيعية تهدف إلى طلاب علوم الكمبيوتر في مؤسسات الفنون الليبرالية.نحن نصف بعض أهداف هذا النهج، بالإضافة إلى تقديم طرق محددة أن أربعة من المهام التي تعتمد على اكتشافها تجمع بين مفاهيم مع الجة اللغة الطبيعية المحددة مع مهارات تحليلية أوسع.نقول أن هذا النهج يساعد في إعداد الطلاب للحصول على العديد من المسارات المستقبلية الممكنة التي تنطوي على تطبيق وابتكار تكنولوجيا NLP من خلال التركيز على الملاحة التجريبية للبيانات، وتصميم التجريب، والوعي في تعقيدات وتحديات التحليل.
نحن نعتبر مشكلة تعلم إصلاح برامج ج خاطئة عن طريق تعلم المحاذاة المثلى مع البرامج الصحيحة. نظرا لأن الأساليب السابقة إصلاح خطأ واحد في السطر، فمن المحتمل أنه لا مفر منه لتكرار عملية التثبيت حتى لا تبقى أخطاء. في هذا العمل، نقترح إطارا تعليمي تسلسل تسل سل جديد لتحديد أخطاء برنامج متعددة في وقت واحد. نقدم نهج وضع العلامات على البيانات المسافة من المسافة لتصحيح خطأ البرنامج. بدلا من وصف مثال إصلاح البرنامج عن طريق إقران برنامج خاطئ مع إصلاح خط، نعلم المثال عن طريق تحديد برنامج خاطئ مع محاذاة مثالية إلى البرنامج الصحيح المقابل الناتج عن حساب التحرير المسافة. نقيم نهجنا المقترح في مجموعة بيانات متاحة للجمهور (Deepfix DataSet) التي تتكون من برامج C الخاطئة المقدمة من طلاب البرمجة المبتدئين. على مجموعة من 6،975 برنامجا خاطئا من بيانات DataSet Deepfix، فإن نهجنا يحقق النتيجة الحديثة من حيث معدل الإصلاح الكامل على DeepFix DataSet (بدون بيانات إضافية مثل رسالة خطأ التحويل البرمجي أو رموز مصدر إضافية مسبقا -تمرين).
بناء أنظمة NLP التي تخدم الجميع يتطلب محاسبة اختلافات اللهجة. ولكن اللهجات ليست كيانات متجانسة: بالأحرى، يتم التقاط الفروق بين اللهجات وداخلها من خلال وجود وغياب العشرات من ميزات اللهجة في الكلام والنص، مثل حذف كوبولا في إنه ∅ قيد التشغيل ". في هذه ا لورقة، نقدم مهمة الكشف عن ميزة اللهجة، وتقديم نهج تعليمي متعدد الأيتاكي، بناء على المحولات المحددة مسبقا. بالنسبة لمعظم اللهجات، لا تتوفر كوربورا المشروح على نطاق واسع لهذه الميزات، مما يجعل من الصعب تدريب التعرف عليها. نحن ندرب نماذجنا على عدد صغير من أزواج صغيرة، والبناء على كيفية تحديد اللغويين عادة ميزات اللهجة. التقييم في مجموعة اختبار من 22 ميزات لهجيات للهنديون يدل على أن هذه النماذج تتعلم كيفية التعرف على العديد من الميزات بدقة عالية، وأن عدد قليل من أزواج الحد الأدنى يمكن أن تكون فعالة للتدريب مع الآلاف من الأمثلة المسمى. ونحن نوضح أيضا إمكانية تطبيق ميزة الهياكل على حد سواء كإجراء من كثافة اللهجة وكمعشر لهجة اللهجة.
مجرر أن نقدم نمذجة اللغة المنطوقة الإندنية، ومهمة تعلم الخصائص الصوتية واللغوية للغة من الصوت الخام (لا توجد نص، لا ملصقات)، ومجموعة من المقاييس لتقييم التمثيلات المستفادة تلقائيا على المستويات الصوتية واللغوية لكلا الترميزوالجيل.أنشأنا أنظمة أساسية تتكون من تشفير خطاب منفصل (وحدات النص الزائفة العائدين)، وهي نموذج لغة تابعة له (تدرب على النص الزائف)، وحديد فك الكلام (توليد موجة موجلة من النص الزائف) جميعها مدربة دون إشراف والتحقق من صحةالمقاييس المقترحة مع التقييم البشري.عبر 3 تشفير الكلام (CPC، WAV2VEC 2.0، HUBERT)، نجد أن عدد الوحدات المنفصلة (50 أو 100 أو أو 200) مسائل في طريقة تعتمد على المهام والتشييد، وأن بعض المجموعات نهج النظم القائمة على النصوص.1.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا