ترغب بنشر مسار تعليمي؟ اضغط هنا

AND-LITE ASR للتنبؤ المشترك بالتنبؤ بالشروح والشروح اللغوية

End-to-end ASR to jointly predict transcriptions and linguistic annotations

465   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح نموذج تسلسل متعدد التسلسل للمحولات للتعرف على الكلام التلقائي (ASR) قادر على نسخ الصوت التلقائي (ASR) من نسخ الصوت في وقت واحد والشروحة مع المعلومات اللغوية مثل النصوص الصوتية أو علامات جزء من الكلام (POS). نظرا لأن المعلومات اللغوية مهمة في معالجة اللغة الطبيعية (NLP)، فإن ASR المقترح مفيد بشكل خاص لتطبيقات واجهة الكلام، بما في ذلك أنظمة الحوار المنطوقة والترجمة الكلامية، والتي تجمع بين ASR و NLP. لإنتاج التعليقات التوضيحية اللغوية، ندرب نظام ASR باستخدام أهداف تدريبية معدلة: يتبع كل وحدة جرفية أو متعددة الجرافيم في النص المستهدف تسلسل صوت محاذاة و / أو علامة نقاط البيع. نظرا لأن طريقتنا قد تمكن من الوصول إلى البيانات الصوتية الأساسية، فيمكننا تقدير التعليقات التوضيحية اللغوية بشكل أكثر دقة من نهج خطوط الأنابيب التي يتم فيها تطبيق الأساليب القائم على NLP على نص ASR الفرضية. تظهر النتائج التجريبية على مجموعات البيانات اليابانية والإنجليزية أن نظام ASR المقترح قادر على إنتاج نسخ عالية الجودة في وقت واحد والشروح اللغوية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف محلول Nuig لمهمة IWPT 2021 بمهمة التعبير المعزز (ED) معزز بلغات متعددة.بالنسبة لهذه المهمة المشتركة، نقترح وتقييم محلل إد المحلي المستند SEQ2SEQ SEQ2SEQ ومقرها SEQ2SEQ الذي يتنبأ بمجموعة ED-Parse من جملة مدخلات معينة كأسلسلة موضعية موضعية للن موذج النسبي.نموذجنا المقترح هو شبكة عصبية متعددة الاستخدامات تؤدي خمس مهام رئيسية في وقت واحد وهي وضع علامات UPOS، ووضع العلامات UFEAT، والليمون، والتحليل التبعية والحد من التحليل.علاوة على ذلك، نستخدم النموذج اللغوي المتاح في قاعدة بيانات Wals لتحسين قدرة محللنا المحترفين المقترحين على الانتقال عبر اللغات.تشير النتائج إلى أن SEQ2SEQ ED-Parser المقترح لدينا يؤدي على قدم المساواة مع محلل ED-Art-Art على الرغم من وجود علامة أبسط.
تفترض أن معظم الدراسات السابقة حول حالة المعلومات (IS) تصنيف وتجسير التعرف anaphora أن ذكر الذهب أو معلومات شجرة النحوية يتم إعطاء (Hou et al.، 2013؛ Roesiger et al.، 2018؛ هو، 2020؛ يو ويوسيو، 2020) وبعد في هذه الورقة، نقترح نهج عصبي نهاية إلى نهج ل تصنيف حالة المعلومات. يتكون نهجنا من مكون استخراج الأوراق ومكون مهمة لحالة المعلومات. خلال وقت الاستدلال، يأخذ نظامنا نصا الخام حيث أن المدخلات ويولد يشرح مع وضع المعلومات الخاصة بهم. على Corpus Isnotes (Markert et al.، 2012)، نوضح أن مكون تعيين حالة معلوماتنا يحقق نتائج جديدة من الفنادق الجديدة على الحبيبات الجميلة التصنيف بناء على طلب الذهب. علاوة على ذلك، يؤدي نظامنا أفضل بكثير من خطوط الأساس الأخرى لكلا من الاستخراج والحبوب الدقيق التصنيف في الإعداد النهائي. أخيرا، نطبق نظامنا على باشي (Roesiger، 2018) و SCICORP (Roesiger، 2016) للتعرف على الحسارة المرجعية. نجد أن نظامنا المنتهي بنا مدروسا على ISNOT يحقق نتائج تنافسية بشأن تجسيد التعرف على الحساب مقارنة بالنظام السابق الذي يعتمد على معلومات النحوية وتدرب على مجموعات البيانات داخل المجال (YU و Poesio ، 2020).
تصف هذه الورقة طريقة لاسترداد الأدلة والتنبؤ بعثور على مزاعم واقعية، على مجموعة البيانات المحمولة.تتكون الأدلة من كل من الجمل وخلايا الطاولة.الطريقة المقترحة هي جزء من المهمة المشتركة للحمى.يستخدم درجات التشابه بين متجهات TF-IDF لاسترداد الأدلة النصي ة ودرجات التشابه بين ناقلات كثيفة التي تم إنشاؤها بواسطة نماذج Tapas التي تم ضبطها بشكل جيد لاسترجاع الأدلة الجدولية.يتم تمرير الأدلة من خلال شبكة عصبية كثيفة لإنتاج تسمية صحية.النتيجة الحميرة للنظام المقترح 0.126.
يدقق هذا البرنامج التعليمي أحدث التقدم التقني في التحليل النحوي ودور بناء الجملة في مهام معالجة اللغة الطبيعية المناسبة (NLP)، حيث يتمثل الترجمة الدلالية في الدورات الدلالية (SRL) والترجمة الآلية (MT) المهام التي لديهاكان دائما مفيدا من أدلة النحوية الإعلامية منذ فترة طويلة، على الرغم من أن التقدم من طرازات التعلم العميق المنتهي في النهاية يظهر نتائج جديدة.في هذا البرنامج التعليمي، سنقدم أولا الخلفية وأحدث التقدم المحرز في التحليل النحوي و SRL / NMT.بعد ذلك، سنلخص الأدلة الرئيسية حول التأثيرات النحوية على هذين المهامين المتعلقين، واستكشاف الأسباب وراء كل من الخلفيات الحسابية واللغوية.
تتمثل منطقة البحث الشعبية حاليا في الترجمة الانتهاء من الكلام في النهاية باستخدام تقنورة المعرفة من مهمة ترجمة آلية (MT) لتحسين مهمة ترجمة الكلام (ST).ومع ذلك، من الواضح أن مثل هذا السيناريو يسمح فقط بنقل طريقة واحدة، وهو محدود من أداء نموذج المعلم.ل ذلك، نحن فرضية أن الأساليب القائمة على تقطر المعرفة هي الأمثل.في هذه الورقة، نقترح بديلا - سيناريو تعليمي متبادل قابل للتدريب، حيث تم تدريب MT ونماذج ST بشكل تعاوني وتعتبر أقرانها، بدلا من المعلم / الطالب.هذا يسمح لنا بتحسين أداء الشك الواحد إلى نهاية أكثر فعالية من نموذج معلم طالب.كمنفعة جانبية، يتحسن أداء نموذج MT أيضا.تظهر النتائج التجريبية أنه في سيناريو التعلم المتبادل لدينا، يمكن أن تستخدم النماذج بشكل فعال المعلومات المساعدة من نماذج الأقران وتحقيق نتائج مقنعة على مجموعة بيانات MUST-C.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا