ترغب بنشر مسار تعليمي؟ اضغط هنا

تنبؤ معرف اللغة من الكلام باستخدام تجمع اليقظة الذاتية

Language ID Prediction from Speech Using Self-Attentive Pooling

494   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

توضح هذه المذكرة إرسال NTR-TSU المهمة المشتركة SIGTYP 2021 بشأن التنبؤ معرفات اللغة من الكلام.تعد تحديد اللغة المنطوقة (غطاء) خطوة مهمة في خط أنابيب نظام التعرف الآلي متعدد اللغات (ASR).بالنسبة للعديد من اللغات المنخفضة واللغات المهددة بالانقراض، قد تكون التسجيلات المفردة المفردة فقط متاحة، مطالبة بالحاجة إلى أنظمة معرف اللغة للمجال ومكبر الصوت.في هذه المذكرة، نوضح أن الشبكة العصبية التنافسية مع طبقة تجمع ذاتي اليقظة تظهر نتائج واعدة لمهمة تحديد اللغة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة النموذج المدمج للمهمة المشتركة SIGTYP 2021 التي تهدف إلى تحديد 18 لغة مختلفة عن تسجيلات الكلام.يتم تحويل معاملات CEPSTRAL Mel-تردد Mel المستمدة من الملفات الصوتية إلى طفرات، ثم تغذيها بعد ذلك في بنية CNN المستند إلى 50.حصل النموذج النه ائي على التحقق من الصحة واختبار بدلة 0.73 و 0.53، على التوالي.
تعد خلط التعليمات البرمجية (CM) ظاهرة ملحوظة في كثير من الأحيان تستخدم لغات متعددة في الكلام أو الجملة. لا توجد قيود نحوية صارمة لاحظت في خلط التعليمات البرمجية، وتتألف من أشكال الإملاء غير القياسية. إن التعقيد اللغوي الناتج عن العوامل المذكورة أعلاه جعل التحليل الحسابي للغة المختلطة من التعليمات البرمجية مهمة صعبة. تعد تحديد الهوية اللغوية (LI) وجزء الكلام (POS) الخطوات الأساسية التي تساعد في تحليل هيكل النص المختلط من التعليمات البرمجية. في كثير من الأحيان، تعتبر مهام وضع العلامات LI و POS في سيناريو خلط التعليمات البرمجية. نحن نعلم مشكلة التعامل مع تعدد اللغات والهيكل النحوي أثناء تحليل الجملة المختلطة من التعليمات البرمجية باعتبارها مهمة تعليمية مشتركة. في هذه الورقة، قمنا بالتعاون بشكل مشترك وتحسين اكتشاف اللغة وجزء من نماذج وضع علامات الكلام في السيناريو المختلط من التعليمات البرمجية. استخدمنا محول مع بنية الشبكة العصبية التنافعية. نحن ندرب طريقة التعلم المشترك من خلال الجمع بين طرامات نقاط البيع ونماذج LI على نص الوسائط الاجتماعية المختلطة من التعليمات البرمجية التي تم الحصول عليها من المهمة المشتركة أيقونة.
نحن نصف نظامنا الذي تم تصنيفه في المرتبة الأولى في مهمة الكشف عن الكلام في الأمل (HSD) ورابعا في مهمة تشارك في الهجوم (OLI)، سواء في لغة التاميل.الهدف من HSD و OLI هو تحديد ما إذا كان تعليق أو منشور مختلط من التعليمات البرمجية يحتوي على خطاب نأمل أو محتوى مسيحي على التوالي.نقوم مسبقا بتدريب نموذج روبرتا المستندة إلى المحولات باستخدام البيانات المختلطة التي تم إنشاؤها بشكل عام واستخدامها في مجموعة جنبا إلى جنب مع نموذج Ulmfit المدرب مسبقا متاحا من Inltk.
إن أحد التطبيقات الرئيسية للمنطق الضبابي هو تصميم نظام تحكم, إن متحكمات المنطق الضبابي (Fuzzy Logic Controllers) اختصارا (FLC) يمكن أن تستعمل لتصميم أنظمة التحكم حيث يكون من الصعوبة استخدام تقنيات التحكم التقليدية. في هذه المقالة تم تصنيع (FLC) مطبق على بطاقة مصفوفة البوابات المنطقية القابلة للبرمجة بشكل حقلي (Field Programmable Gate Array) المعروفة اختصارا (FPGA) لتعقب الشمس لزيادة كفاءة الخلايا الشمسية في توليد الطاقة. اختبر المتحكم باستخدام برنامج سيميلونك التابع لبرنامج الماتلاب. أخيرا تم إجراء مقارنة مع متحكم (perturbation and observation) التقليدي حيث أظهرت المحاكاة و التجارب العملية أن أداء المتحكم الضبابي باستخدام FPGA أفضل من متحكم (Perturbation and observation).
في هذا المشروع نقوم بدراسة المويجات و تحويل المويجة، و بيان إمكانية توظيفه في معالجة و تحليل الإشارة الكلامية و ذلك بهدف تحسينها و إزالة الضجيج منها، حيث سنطرح بعض الخوارزميات التي تعتمد على تحويل المويجة و آلية تطبيقها من أجل التخلص من الضجيج في ا لإشارة الكلامية، و نقارن نتائج تطبيق هذه الخوارزميات مع بعض الخوارزميات التقليدية التي تستخدم في تحسين الإشارة الكلامية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا