يحدد اكتشاف الموقف ما إذا كان مؤلف النص مؤهلا لصالح أو محايد هدف معين ويوفر رؤى قيمة في أحداث مهمة مثل تقنين الإجهاض. على الرغم من التقدم الكبير في هذه المهمة، فإن أحد التحديات المتبقية هو ندرة التعليقات التوضيحية. علاوة على ذلك، ركزت معظم الأعمال ال
سابقة على تدريبا ثابتا على التسمية التي يتم فيها التخلص منها تشابه ذات معنى بين الفئات أثناء التدريب. لمعالجة هذه التحديات أولا، نقيم هدف متعدد المستهدف وإعدادات تدريب متعددة البيانات من خلال تدريب نموذج واحد على كل مجموعة بيانات ومجموعات من المجالات المختلفة، على التوالي. نظهر أن النماذج يمكن أن تتعلم المزيد من التمثيلات العالمية فيما يتعلق بالأهداف في هذه الإعدادات. ثانيا، يمكننا التحقيق في تقطير المعرفة في اكتشاف الموقف ومراقبة أن نقل المعرفة من نموذج المعلم إلى نموذج الطالب يمكن أن يكون مفيدا في إعدادات التدريب المقترحة. علاوة على ذلك، نقترح طريقة تقطير المعرفة التكيفية (AKD) تطبق تحجيم درجة الحرارة الخاصة بالمثيلات إلى المعلم والتنبؤات الطلابية. تشير النتائج إلى أن نموذج متعدد البيانات يعمل بشكل أفضل على جميع مجموعات البيانات ويمكن تحسينه من قبل AKD المقترح، مما يتفوق على أحدث حالة من الهامش الكبير. نحن نطلق علنا كودنا.
تحديد المشاعر من النص أمر حاسم لمجموعة متنوعة من مهام العالم الحقيقي.نحن نعتبر أكبر فورسورا المتوفر الآن لتصنيف العاطفة الآن: جيموتونات، مع رسائل 58 ألفا تسمى القراء، والتنفيس، مع رسائل 33 مترا مصممة الكاتب.نقوم بتصميم معيارا وتقييم العديد من المساحا
ت الميزة وخوارزميات التعلم، بما في ذلك نموذجين بسيطين ولكن الرواية أعلى بيرت التي تتفوق على خطوط الأساس القوية السابقة على GAEMOTION.من خلال تجربة مع مشاركين بشريين، نحلل أيضا الاختلافات بين كيفية التعبير عن المشاعر وكيفية إدراك القراء لهم.تشير نتائجنا إلى أن العواطف التي أعرب عنها الكتاب أصعب تحديدها من العواطف التي ينظر إليها القراء.نحن نشارك واجهة الويب العامة للباحثين لاستكشاف نماذجنا.
تأثرت الكشف عن الحدث منذ فترة طويلة بسبب لعنة الزناد: التجاوز الزنجي سيضر بالقدرة على مستوى التعميم أثناء تقديره سيضر بأداء الكشف.هذه المشكلة أكثر حدة في سيناريو أقل لقطة.في هذه الورقة، نحدد وحل مشكلة لعنة المشغل في اكتشاف حدث قليل الطواف (FSED) من و
جهة نظر سببية.من خلال صياغة FSED مع نموذج سببي هيكلي (SCM)، وجدنا أن الزناد هو مواجهة السياق والنتيجة، مما يجعل أساليب FSED السابقة أسهل بكثير على المشغلات المبكرة.لحل هذه المشكلة، نقترح التدخل في السياق عن طريق تعديل الخلفية أثناء التدريب.تبين التجارب أن طريقتنا تحسن بشكل كبير من FSED على كل من مجموعة بيانات ACE05 و Maven.
اكتشاف التغيير الدلالي المعجمي في مجموعات بيانات أصغر، على سبيل المثالفي اللغويات التاريخية والعلوم الإنسانية الرقمية، تحديا بسبب نقص القوة الإحصائية.يتم تفاقم هذه المشكلة عن طريق نماذج التضمين غير السياقية التي تنتج واحدة من التضمين لكل كلمة، وبالتا
لي، قم بإخفاء التباين الحاضر في البيانات.في هذه المقالة، نقترح نهجا لتقدير التحول الدلالي من خلال الجمع بين تضمين الكلمات السياقية مع الاختبارات الإحصائية القائمة على التقاطات.نحن نستخدم إجراء معدل الاكتشاف الخاطئ لمعالجة العدد الكبير من اختبارات الفرضيات التي يجري تنفيذها في وقت واحد.نوضح أداء هذا النهج في المحاكاة حيث تحقق بدقة عالية باستمرار عن طريق قمع إيجابيات كاذبة.كلفنا تحليل بيانات العالم الحقيقي من مهمة Semeval-2020 1 و Liverpool FC SubRedDit Corpus.نظرا لأنه من خلال أخذ التباين العينة في الاعتبار، يمكننا تحسين متانة تقديرات التحول الدلالي الفردي دون مهينة الأداء العام.
تركز أنظمة الكشف عن الساركاز الموجودة على استغلال العلامات اللغوية أو السياق أو البثور على مستوى المستخدم. ومع ذلك، تشير الدراسات الاجتماعية إلى أن العلاقة بين المؤلف والجمهور يمكن أن تكون ذات صلة بنفس القدر لاستخدام السخرية وتفسيرها. في هذا العمل، ن
قترح إطارا بالاستفادة المشتركة (1) سياق مستخدم من تغريداتهم التاريخية مع (2) المعلومات الاجتماعية من حي المستخدم في رسم بياني تفاعل، إلى السياق تفسير المنشور. نحن نميز بين الهوية المتصورة والمبلغ عنها الذاتي. نستخدم شبكات انتباه الرسوم البيانية (GAT) عبر المستخدمين والتويت في مؤشر ترابط محادثة، جنبا إلى جنب مع العديد من تمثيلات سجل المستخدم كثيفة. بصرف النظر عن تحقيق نتائج حديثة على مجموعة البيانات التي تم نشرها مؤخرا من مستخدمي Twitter مؤخرا مع تغريدات ثلاثية العدد 30K، قم بإضافة تغريدات 10M Unabeled كسياق، تشير تجاربنا إلى أن شبكة الرسم البياني تساهم في تفسير النوايا الساخرة للمؤلف أكثر من للتنبؤ بتصور السخرية من قبل الآخرين.
ندرس مشكلة أداء تصنيف الموقف التلقائي على وسائل التواصل الاجتماعي مع البنية العصبية مثل بيرت. على الرغم من أن هذه المهنة تقدم نتائج مثيرة للإعجاب، إلا أن مستواها لم يقرص بعد مع أحد البشر وقد ينتجون أخطاء له تأثير كبير على المهمة المصب (على سبيل المثا
ل، فحص الحقائق). لتحسين الأداء، نقدم الهندسة المعمارية العصبية الجديدة حيث تتضمن المدخلات أيضا وجهات نظر مفاجئة تلقائيا بسبب مطالبة معينة. يتم تعلم النموذج بشكل مشترك إجراء توقعات متعددة في وقت واحد، والتي يمكن استخدامها إما لتحسين تصنيف المنظور الأصلي أو لتصفية التنبؤات المشكوك فيها. في الحالة الأولى، نقترح طريقة خاضعة للإشراف ضعيفا للجمع بين التنبؤات في نهائي. في الحالة الثانية، نوضح أن استخدام درجات الثقة لإزالة التنبؤات المشكوك فيه يسمح لطريقنا لتحقيق أداء يشبه الإنسان على المعلومات المحتجزة، والتي لا تزال جزءا كبيرا من المدخلات الأصلية.
تعتمد أبحاث الكشف عن الشخصية القائمة على النصوص الموجودة في الغالب على النهج التي يحركها البيانات لالتقاط إشارات شخصية ضمنيا في الوظائف عبر الإنترنت، تفتقر إلى إرشادات المعرفة النفسية. يلعب الاستبيان النفسي، الذي يحتوي على سلسلة من الأسئلة المخصصة ال
مرتبطة بشدة إلى سمات الشخصية، دورا حاسما في تقييم شخصية التقرير الذاتي. نقول أن المشاركات التي أنشأها المستخدم تحتوي على محتويات مهمة يمكن أن تساعد في الإجابة على الأسئلة في استبيان، مما أدى إلى تقييم لشخصيته من خلال ربط النصوص والاستبيان. تحقيقا لهذه الغاية، نقترح نموذجا جديدا باسم شبكة الاستبيان النفسي المحسن (PQ-NET) لتوجيه اكتشاف الشخصية عن طريق تتبع المعلومات الهامة في النصوص مع استبيان. على وجه التحديد، يحتوي PQ-NET على جاريان: دفق سياق لتشفير كل جزء من النص في تمثيل نص سياقي، وتيار استبيان لالتقاط المعلومات ذات الصلة في تمثيل النص السياقي لإنشاء تمثيلات إجابات محتملة للاستبيان. يتم استخدام تمثيل الإجابات المحتملة لتعزيز تمثيل النص السياقي وفائدة التنبؤ بالشخصية. تظهر النتائج التجريبية على مجموعة بيانات اثنين من تفوق PQ-NET في التقاط إشارات مفيدة من المشاركات للكشف عن الشخصية.
للمساعدين الصوتيين مثل Alexa ومساعد Google و SIRI ويزويف نوايا المستخدمين بشكل صحيح أهمية قصوى.ومع ذلك، يعاني المستخدمون في بعض الأحيان الاحتكاك مع هؤلاء المساعدين، بسبب الأخطاء من مكونات النظام المختلفة أو أخطاء المستخدمين مثل زلات اللسان.يميل المست
خدمون إلى إعادة صياغة استفساراتهم حتى يحصلون على استجابة مرضية.يستخدم الكشف عن صياغة إعادة صياغة لتحديد إعادة التسلياع وتم التعامل معها منذ فترة طويلة كمهمة مع مدخلات الزوجية، والتي لا تستخدم بالكامل المعلومات السياقية (E.G. المستخدمين الضمنية).تحقيقا لهذه الغاية، نقترح نموذج اكتشاف صياغة صياغة حديثة لتحديد إعادة التسليح تلقائيا من الحوارات متعددة الدوران.نعرض كيفية الاستفادة من سياق الحوار وإشارات التفاعل وكيل المستخدم، بما في ذلك ملاحظات المستخدم الضمنية والفجوة الزمنية بين المنعطفات المختلفة، والتي يمكن أن تساعد بشكل كبير بشكل كبير في نماذج الكشف عن إعادة صياغة الزوجية.
يقتصر معظم العمل المسبق على أنظمة الحوار الموجهة نحو المهام على دعم واجهات برمجة التطبيقات في المجال.ومع ذلك، قد يكون لدى المستخدمين طلبات خارج نطاق واجهات برمجة التطبيقات هذه.يركز هذا العمل على تحديد طلبات المستخدمين هذه.تعتمد الطرق الحالية لهذه الم
همة بشكل أساسي على النماذج المدربة مسبقا بشكل صحيح على البيانات المشروحة الكبيرة.نقترح طريقة رواية، ريد، بناء على تقدير التعلم والكثافة التكيفية.يمكن تطبيق Rede على حالات الطابع الصفرية، ويتدرك بسرعة كاشف عالية الأداء مع بعض الطلقات فقط عن طريق تحديث أقل من المعلمات 3K.نوضح أداء Rede التنافسي في بيانات DSTC9 ومجموعة اختبار مجمعة حديثا.
نقدم نموذجا للتنبؤ بمشاعر غرامة على طول الأبعاد المستمرة من التكافؤ والإثارة والهيمنة (VAD) مع وجود شرح عاطفي قاطع. يتم تدريب طرازنا عن طريق تقليل فقدان EMD (مسافة تحالف الأرض) بين توزيع النتيجة VAD المتوقعة وتوزيع العاطفة الفئوية التي تم فرزها على ط
ول VAD، ويمكن أن تصنف في وقت واحد فئات العاطفة وتتنبؤ بعشرات VAD للحصول على عقوبة معينة. نحن نستخدم Roberta-Large Roberta المدربة مسبقا على ثلاثة كوربورا مختلفة مع ملصقات واضحة وتقييم على Emobank Corpus مع درجات VAD. نظهر أن نهجنا يصل إلى أداء قابلا للمقارنة مع وجود أحدث من المصنفات في تصنيف العاطفة الفئوية ويظهر ارتباطا إيجابيا كبيرا مع درجات فاد للحقيقة الأرضية. أيضا، يؤدي المزيد من التدريب مع الإشراف على تسميات VAD إلى تحسين الأداء خاصة عندما تكون مجموعة البيانات الصغيرة. نقدم أيضا أمثلة على تنبؤات كلمات العاطفة المناسبة التي ليست جزءا من التعليقات التوضيحية الأصلية.