أوراق بحثية, رسائل ماجستير ودكتوراه حول Recognition

إدراك خطابي شبكة عصبية للتعرف على العاطفة في محادثة متعددة الأحزاب

757 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أصبح التعرف على العاطفة في محادثة متعددة الأحزاب (ermc) شعبية بشكل متزايد كقاعدة بحثية ناشئة في معالجة اللغة الطبيعية.يركز البحث المسبق على استكشاف معلومات متتابعة ولكن يتجاهل هياكل المحادثات.في هذه الورقة، يمكننا التحقيق في أهمية هياكل الخطاب في الت عامل مع الإشارات السياقية الإعلامية والمعلومات الخاصة بالمتكلات الخاصة ب armc.تحقيقا لهذه الغاية، نقترح علما رسميا في رسم بياني (ERMC-DISGCN) ل ERMC.على وجه الخصوص، نقوم بتصميم الأزلاء العلائقية إلى رافعة تبعية المتكلم الذاتي للواقعاء نشر معلومات سياقية.علاوة على ذلك، فإننا نستنفذ عن مراقبة بوابات لاختيار إشارات أكثر إفادة ل armc من التحويلات المعالين.تظهر النتائج التجريبية طريقة أن أسلوبنا تتفوق على خطوط أساس متعددة، مما يوضح أن هياكل الخطاب ذات قيمة كبيرة ل armc.

الكولا الإيطالي recognition in multi-party الاعتراف في الحزب متعدد الأحزاب صناعة حمض الفوسفور

عدد قليل من العاطفة التعرف على المحادثة مع شبكات النماذج النموذجية المتسلسلة

754 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تم إجراء عدة دراسات حديثة حول التفاعلات البشرية الدينية على المحادثات دون أهداف تجارية محددة. ومع ذلك، قد تستفيد العديد من الشركات من الدراسات المخصصة لبيئات أكثر دقة مثل خدمات ما بعد البيع أو استطلاعات رضا العملاء. في هذا العمل، نضع أنفسنا في نطاق خ دمة عملاء الدردشة الحية التي نريد اكتشاف العواطف وتطورها في تدفق المحادثة. يؤدي هذا السياق إلى تحديات متعددة تتراوح من استغلال مجموعات البيانات المحظورة والصغيرة والغلبية غير المستمرة لإيجاد وتكيف مع طرق هذا السياق. نحن نتعامل مع هذه التحديات باستخدام عدد قليل من التعلم أثناء صنع الفرضية التي يمكن أن تخدم تصنيف المشاعر المحادثة لغات مختلفة وتسميات متفرق. نحن نساهم باقتراح تباين من الشبكات النموذجية للحصول على تسلسل وضع العلامات في المحادثة التي نسمينا protoseq. نحن نختبر هذه الطريقة على رقمين مع لغات مختلفة: المحادثات اليومية في محادثات الدردشة الإنجليزية وخدمة العملاء في الفرنسية. عند تطبيقها على تصنيف العاطفة في المحادثات، أثبتت طريقنا أنها تنافسية حتى مقارنة بأخرى أخرى.

sequential prototypical networks few-shot emotion recognition sequential prototypical شبكات النماذج النموذجية المتسلسلة عدد قليل من العاطفة الاعتراف النماذج النموذجية المتسلسلة صناعة حمض الفوسفور المزيد..

تجانس عشوائي متسلسل للتعرف على الكلام قوية

914 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في حين أن التعرف التلقائي على الكلام قد أظهر عرضة لهجمات الخصومة، فإن الدفاعات ضد هذه الهجمات لا تزال متأخرة.يمكن كسر الدفاعات الحالية والساذجة جزئيا مع هجوم على التكيف.في مهام التصنيف، تبين أن نموذج التجانس العشوائي فعال في النماذج الدفاعية.ومع ذلك، من الصعب تطبيق هذه النموذج لمهام ASR، بسبب تعقيدها والطبيعة المتسلسلة لمخرجاتها.تتغلب الورق لدينا على بعض هذه التحديات من خلال الاستفادة من الأدوات الخاصة بالكلام مثل التحسين والتصويت Rover لتصميم نموذج ASR قوي للقلق.نحن نطبق الإصدارات التكيفية من الهجمات الحديثة، مثل هجوم ASR غير المحدد، ونموذجنا، وإظهار أن أقوى دفاعنا هو قوي لجميع الهجمات التي تستخدم الضوضاء غير المسموعة، ولا يمكن كسرها إلا مع تشويه كبير للغايةوبعد

تحسين مدرب مسبقا adversarially robust speech robust speech recognition اعتراف خطاب قوي صناعة حمض الفوسفور

WAV-BERT: التعلم التعاوني الصوتي واللغوي التعلم للتعرف على الكلام منخفض الموارد

646 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أصبح توحيد التعلم الصوتي واللغوي أمرا مهما بشكل متزايد بنقل المعرفة المستفادة بشأن وفرة بيانات لغة الموارد عالية الموارد للحصول على التعرف على الكلام المنخفض الموارد. الأساليب الحالية ببساطة تتالي النماذج الصوتية واللغة المدربة مسبقا لتعلم النقل من ا لكلام إلى النص. ومع ذلك، فإن كيفية حل تناقض التمثيل في الكلام والنص غير مستكشفة، مما يعيق استخدام المعلومات الصوتية واللغوية. علاوة على ذلك، يعمل الأمر السابق ببساطة استبدال طبقة تضمين نموذج اللغة المدربة مسبقا مع الميزات الصوتية، والتي قد تتسبب في مشكلة نسيان الكارثي. في هذا العمل، نقدم WAV-Bert، وهي طريقة تعليمية تعاونية وصوتية وممثلة على الصمامات والاستفادة من المعلومات السياقية من الكلام والنص. على وجه التحديد، نقوم بتحديد نموذج صوت صوتي مدرب مسبقا (WAV2VEC 2.0) ونموذج لغة (Bert) في إطار قابل للتدريب من طرف إلى نهاية. تم تصميم وحدة تجميع التمثيل لتجميع التمثيل الصوتي واللغوي، ويتم تقديم وحدة الانتباه التضمين لإدماج المعلومات الصوتية في بيرت، والتي يمكن أن تسهل بفعالية تعاون نماذج مدربة مسبقا وبالتالي تعزيز تعلم التمثيل. تشير التجارب الواسعة إلى أن لدينا WAV-Bert تنفأ بشكل كبير على النهج الحالية وتحقيق الأداء الحديث في التعرف على الكلام المنخفض الموارد.

low-resource speech recognition linguistic representation learning التعرف على الكلام منخفض الموارد التمثيل اللغوي التعلم صناعة حمض الفوسفور

Parstwiner: كوربوس للتعرف على الكيان المسمى في الفارسية غير الرسمية

641 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نتيجة للجمل غير المنظمة وبعض أخطاء أخطاء وإجراء أخطاء، فإن العثور على كيانات اسمه في بيئة صاخبة مثل وسائل التواصل الاجتماعي يستغرق المزيد من الجهد.يحتوي Parstwiner على أكثر من 250k Tokens، بناء على تعليمات قياسية مثل MUC-6 أو Conll 2003، تجمع من Twit ter الفارسي.باستخدام معامل كابا في كوهين، فإن اتساق المعلقين هو 0.95، درجة عالية.في هذه الدراسة، نوضح أن بعض النماذج الحديثة تتحلل على هذه الشركات، وتدريب نموذج جديد باستخدام تعلم التحويل الموازي بناء على بنية بيرت.تظهر النتائج التجريبية أن النموذج يعمل بشكل جيد في الفارسية غير الرسمية وكذلك في الفارسية الرسمية.

مقياس النطاق entity recognition named entity اسمه الكيان الاعتراف اعتراف الكيان كيان اسمه صناعة حمض الفوسفور المزيد..

الماضي، الحاضر، والمستقبل: عاطفة المحادثة الاعتراف من خلال النمذجة الهيكلية للمعرفة النفسية

719 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تعتبر التعرف على عاطلة المحادثة (CER) مهمة للتنبؤ بمشاعر الكلام في سياق محادثة. على الرغم من أن نمذجة سياق المحادثة والتفاعلات بين المتحدثين قد درست على نطاق واسع، إلا أنه من المهم النظر في الدولة النفسية للمتحدث، والتي تسيطر على عمل ومكبر الصوت. تقد م الطريقة التي من بين الفنون المعرفة المنطقية (CSK) نموذجا نفسيا بطريقة متتالية (إلى الأمام والخلف). ومع ذلك، فإنه يتجاهل التفاعلات النفسية الهيكلية بين الكلام. في هذه الورقة، نقترح رسم بياني تفاعل علمي المعرفة (Skaig). في الرسم البياني المرتبط محليا، سيتم تعزيز النطق المستهدف مع معلومات العمل التي استنتجها من السياق الماضي ونهايها الضمنية السياق المستقبلية. الكلام مرتبط بالنظر في الاعتبار التأثير الحالي من نفسه. علاوة على ذلك، نستخدم CSK لإثراء الحواف بتمثيل المعرفة وعمل Skaig مع محول الرسم البياني. تقوم طريقةنا بتحقيق الأداء الحكومي والتنافسي في أربعة مجموعات بيانات CRES.

conversational emotion recognition conversational emotion عاطفي المحادثة الاعتراف العاطفة المحادثة صناعة حمض الفوسفور

مدمجة الدلالية والفيديو بعد تصحيح التعرف على الكلام الصينية

643 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نظرا للتقدم المؤخرا لمعالجة اللغات الطبيعية، قامت عدة أعمال بتطبيق نموذج اللغة الملثم المدرب مسبقا (MLM) من Bert إلى ما بعد تصحيح التعرف على الكلام.ومع ذلك، فإن النماذج القائمة المدربة مسبقا فقط تنظر فقط في التصحيح الدلالي أثناء إهمال السمات الصوتية للكلمات.سوف يؤدي الإصلاح الدلالي الوحيد فقط إلى تقليل الأداء لأن الأخطاء هوموفونية شائعة إلى حد ما في الصيني العسكري.في هذه الورقة، اقترحنا نهجا جديدا لاستغلال التمثيل السياقي بشكل جماعي والمعلومات الصوتية بين الخطأ واستبدال المرشحين لتخفيف معدل الخطأ الصيني العسكري.أظهرت نتائج تجربتنا على مجموعات بيانات التعرف على الكلام العالمي الحقيقي أن طريقةنا المقترحة لها من الواضح أن خفضت من النموذج الأساسي، مما استخدم برت مزاملا مدربا مسبقا كصاصر.

chinese speech recognition world speech recognition اعتراف الكلام الصينية اعتراف الكلام العالمي صناعة حمض الفوسفور

التعرف على العاطفة الكلام بناء على نموذج CNN + LSTM

1232 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

بسبب شعبية خدمات مساعد الحوار الذكي، أصبح التعرف على عاطفي الكلام أكثر وأكثر أهمية.في التواصل بين البشر والآلات، يمكن للتعرف على العاطفة وتحليل العاطفة تعزيز التفاعل بين الآلات والبشر.تستخدم هذه الدراسة نموذج CNN + LSTM لتنفيذ معالجة العاطفة الكلام ( SER) والتنبؤ بها.من النتائج التجريبية، من المعروف أن استخدام نموذج CNN + LSTM يحقق أداء أفضل من استخدام نموذج NN التقليدي.

emotion recognition based speech emotion recognition emotion recognition العاطفة الاعتراف مقرها التعرف على العاطفة الكلام العاطفة الاعتراف صناعة حمض الفوسفور المزيد..

إدراك الوظيفة إدراك الحوار قانون الاعتراف

593 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقترح هذه الدراسة نهجا نطق في موقف الكلام لنموذج التعرف على قانون الحوار العصبي القائم على الشبكة (دار)، مما يشتمل على الترميز الموضعي للموقف المطلق أو النسبي للكلام.النهج المقترح مستوحى من الملاحظة أن بعض أعمال الحوار لها اتجاهات مناصب الحدوث.تبين ا لتقييمات على Corpus لوحة المفاتيح أن الترميز الموضعي المقترح للكلام يحسن إحصائيا بشكل كبير أداء دار.

dialogue act recognition act recognition position-aware dialogue act قانون الحوار الاعتراف الاعتراف بالعمل قانون إدراك الحوار صناعة حمض الفوسفور المزيد..

الاعتراف الدلالي المعجمي

755 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في دلالات معجمية، يتم علاج تجزئة الجملة الكاملة ووضع القطاع من الظواهر المختلفة بشكل عام بشكل منفصل، على الرغم من الترابط.نحن نفترض أن مهمة الاعتراف الدلالية المعتمدة الموحدة هي وسيلة فعالة لتغليف الأساليب التوضيحية سابقا من التوضيحية، بما في ذلك الت عبير / التصنيف التعبير المتعدد الكلمات والعلامات الفائقة.باستخدام Streusle Corpus، نربط تسلسل CRF العصبي Tagger وتقييم أدائه على طول محاور مختلفة من التوضيحية.نظرا لأن مجموعة العلامات تعميم تعميم المهام السابقة (PARSEME، DIMSUM)، فإننا نتقييم بالإضافة إلى ذلك مدى جودة تعميم النموذج إلى مجموعات الاختبار هذه، وإيجاد أنها تقترب أو تجاوز النماذج الحالية على الرغم من التدريب فقط على Streusle.ينشئ عملنا أيضا نماذج أساسية ومقاييس التقييم لنمذجة متكاملة ودقيقة للدلالات المعجمية، مما يسهل العمل في المستقبل في هذا المجال.

lexical semantic recognition semantic recognition lexical semantic الاعتراف الدلالي المعجمي الاعتراف الدلالي lexical الدلالات صناعة حمض الفوسفور المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد