يتنبأ تحليل المعنويات المستندة إلى جانب الجسيم (ABASA) بقبولية المعنويات نحو مصطلح معين معين في جملة، وهي مهمة مهمة في تطبيقات العالم الحقيقي. لأداء ABSA، يلزم النموذج المدرب أن يكون له فهم جيد للمعلومات السياقية، وخاصة الأنماط الخاصة التي تشير إلى ق
طبية المعنويات. ومع ذلك، تختلف هذه الأنماط عادة في جمل مختلفة، خاصة عندما تأتي الجمل من مصادر مختلفة (المجالات)، مما يجعل ABSA لا يزال صعبا للغاية. على الرغم من الجمع بين البيانات المسمى عبر مصادر مختلفة (المجالات) هو حل واعد لمعالجة التحدي، في التطبيقات العملية، عادة ما يتم تخزين هذه البيانات المسمى في مواقع مختلفة وقد لا يمكن الوصول إليها لبعضها البعض بسبب الخصوصية أو المخاوف القانونية (مثل البيانات مملوكة لشركات مختلفة). لمعالجة هذه المشكلة واستخدم أفضل استخدام لجميع البيانات المسمى، نقترح نموذج ABSA الجديد مع التعلم الفيدرالي (FL) المعتمد للتغلب على قيود عزل البيانات وإدماج ذاكرة الموضوع (TM) المقترح اتخاذ حالات البيانات من مصادر متنوعة (المجالات) في الاعتبار. خاصة، تهدف TM إلى تحديد مصادر البيانات المختلفة المعزولة بسبب عدم إمكانية الوصول إلى البيانات من خلال توفير معلومات فئة مفيدة للتنبؤات المحلية. توضح النتائج التجريبية على بيئة محاكاة لثلاثة عقد مع ثلاث عقود فعالية نهجنا، حيث تتفوق TM-FL على خطوط أساس مختلفة بما في ذلك بعض أطر FL مصممة جيدا.
الرسوم البيانية المعرفة ضرورية للعديد من تطبيقات معالجة اللغة الطبيعية المصب، ولكنها غير مكتملة عادة مع العديد من الحقائق المفقودة. ينتج عن هذا الجهود البحثية في مهمة التفكير المتعدد القفزات، والتي يمكن صياغة كعملية بحث ونماذج حالية تؤدي عادة منطق بع
يد المنال. ومع ذلك، فإن السبب البعيد الطويل أمر حيوي أيضا بالقدرة على توصيل الكيانات غير المرتبطة بسطحية. بأفضل من علمنا، يفتقر إلى وجود إطار عام يقترب من التفكير المتعدد القفز في سيناريوهات التفكير المسؤولة لفترة طويلة مختلطة. نقول أن هناك مشكلتان رئيسيتان لنموذج التفكير المتعدد القفز العام: ط) أين تذهب، والثاني) عند التوقف. لذلك، نقترح نموذج عام يحدد المشكلات ذات ثلاث وحدات: 1) وحدة المعرفة المحلية المحلية لتقدير المسارات المحتملة، 2) وحدة التسرب الإجراءات المختلفة لاستكشاف مجموعة متنوعة من المسارات، و 3) التوقف التكيفي وحدة البحث لتجنب البحث عنها. توضح النتائج الشاملة على ثلاث مجموعات بيانات تفوق نموذجنا مع تحسينات كبيرة ضد خطوط الأساس في سيناريوهات التفكير المسافة القصيرة والطويلة.
تهدف الاستدلال العاطفة في المحادثات متعددة الدورات إلى التنبؤ بمشاعر المشارك في الدور التالي المقبل دون معرفة استجابة المشارك بعد، وهي خطوة ضرورية للتطبيقات مثل تخطيط الحوار. ومع ذلك، فإن التحدي الشديد لإدراك وسبب مشاعر المشاركين في المستقبل، بسبب عد
م وجود معلومات عن المستقبل من المستقبل. علاوة على ذلك، فمن الضروري استنتاج المشاعر لالتقاط خصائص الانتشار العاطفي في المحادثات، مثل الثبات والمعاجين. في هذه الدراسة، نركز على التحقيق في مهمة استنتاج المشاعر في محادثات متعددة الدورات من خلال نمذجة انتشار الدول العاطفية بين المشاركين في تاريخ المحادثة، واقتراح وحدة نمط تدرك المرسل إليه تلقائيا ما إذا كان المشارك يحتفظ الحالة العاطفية التاريخية أو تتأثر بالآخرين في المنعطف القادم المقبل. بالإضافة إلى ذلك، نقترح استراتيجية فرقة لتعزيز الأداء النموذجي. تظهر الدراسات التجريبية على ثلاث مجموعات محادثة محادثة مختلفة مختلفة فعالية النموذج المقترح على العديد من خطوط الأساس القوية.
تستكشف هذه الورقة تأثير استخدام التعلم المتعدد التواجد لتلخيص الجماع في سياق كورسا التدريب الصغيرة.على وجه الخصوص، نحن ندمج أربع مهام مختلفة (تلخيص استخراجي، ونمذجة اللغة، والكشف عن المفهوم، والكشف عن الصياغة على حد سواء بشكل فردي ومزيج، بهدف تعزيز ا
لمهمة المستهدفة المتمثلة في تلخيص الجماع عبر التعلم المتعدد.نظرا لأنه بالنسبة للعديد من مجموعات المهام، فإن نموذج مدرب في إعداد متعدد الأيتاكف يتفوق على نموذج مدرب فقط في تلخيص الجماع، مع عدم تقديم بيانات تلخيص إضافية.بالإضافة إلى ذلك، نقوم بعمل بحث شامل والعثور على أن بعض المهام (E.G. الكشف عن الصياغة) تستفيد باستمرار تلخيص الجماعي، ليس فقط عند الجمع مع المهام الأخرى ولكن أيضا عند استخدام بهيئات مختلفة وتدريب كورسا.
تهدف اللغة الزمنية الأرضية في مقاطع الفيديو إلى توطين الفترة الزمنية ذات الصلة بالسجن الاستعلام المحدد. الطريقة السابقة تعاملها إما بمهمة الانحدار للحدود أو مهمة استخراج تمتد. ستقوم هذه الورقة بصياغة لغة زمنية تأريض في فهم قراءة الفيديو واقتراح شبكة
إعلانات العلاقة (Ranet) لمعالجتها. يهدف هذا الإطار إلى تحديد خيار لحظة فيديو من مجموعة الإجابة المحددة مسبقا بمساعدة Incrse-and-Fine-Query-Query-Quicies Infraction و China- يقترح Interactor Interactor من الاختيار مطابقة المعلومات المرئية والنصية في وقت واحد في مستويات لحظة الجملة ومستويات لحظة الرمز المميز، مما يؤدي إلى تفاعل عبر مشروط خشن وغرامة. علاوة على ذلك، يتم تقديم منشئ علاقة متعددة الخيارات الرواية من خلال الاستفادة من الأزلاء الرسم البياني لالتقاط التبعيات بين خيارات لحظات الفيديو للحصول على أفضل اختيار الخيار. تجارب واسعة النطاق على تصنيف ActivityNet-Campative و Tacos و Charades-Sta تثبت فعالية حلنا. ستكون الرموز متاحة في https://github.com/huntersxsx/ranet.
يعد تطبيع المفهوم للنصوص السريرية للتصنيفات الطبية القياسية والاتجاهات مهمة ذات أهمية عالية للبحث الطبي للرعاية الصحية. نحاول حل هذه المشكلة من خلال ترميز CT التلقائي CT، حيث يعد CT Snomed CT أحد أونولوجيات المصطلحات السريرية الأكثر استخداما وشاملة ع
لى نطاق واسع. ومع ذلك، فإن تطبيق نماذج التعلم العميق الأساسية يؤدي إلى نتائج غير مرغوب فيها بسبب الطبيعة غير المتوازنة للبيانات والعدد المتطرف من الفصول الدراسية. نقترح إجراء التصنيف الذي يحتوي على سير عمل متعدد الخطوات يتكون من تجميع الملصقات، والتصنيف متعدد الكتلة، ورسم الخرائط عن المجموعات إلى الملصقات. بالنسبة للتصنيف متعدد المجموعات، BioBert يتم ضبطه بشكل جيد على مجموعة بياناتنا المخصصة. يتم إجراء تعيين مجموعات إلى التسميات من قبل A One-VS-All Mederifier (SVC) المطبق على كل كتلة واحدة. نقدم أيضا خطوات لتوليد البيانات التلقائي من الأوصاف النصية المشروحة مع رموز CT Conomed بناء على البيانات العامة والبيانات المفتوحة المرتبطة. من أجل التعامل مع المشكلة أن DataSet لدينا غير متوازنة للغاية، يتم تطبيق بعض طرق تكبير البيانات. تظهر النتائج من التجارب التي أجريت دقة عالية وموثوقية نهجنا للتنبؤ برموز CT Conomed ذات الصلة بنص سريري.
يمكن استخدام الألعاب القائمة على النصوص لتطوير وكلاء نص موجه نحو المهام لإنجاز المهام ذات التعليمات اللغوية رفيعة المستوى، والتي لها تطبيقات محتملة في المجالات مثل تفاعل الإنسان الروبوت. بالنظر إلى تعليمات نصية، يستخدم تعلم التعزيز عادة لتدريب الوكلا
ء لإكمال المهمة المقصودة بسبب راحتها في سياسات التعلم تلقائيا. ومع ذلك، بسبب مساحة كبيرة من الإجراءات النصية للكبار، تعلم شبكة السياسة التي تنشئ كلمة عمل من Word مع تعلم التعزيز أمر صعب. تظهر أعمال البحث الحديثة أن التعلم التقليد يوفر طريقة فعالة لتدريب شبكة السياسة القائمة على الجيل. ومع ذلك، فإن الوكلاء المدربين مع التعلم المقلم يصعب إتقان مجموعة واسعة من أنواع المهام أو المهارات، ومن الصعب عليهم التعميم أيضا مع البيئات الجديدة. في هذه الورقة، نقترح طريقة تعزز التعزيز التيلة لتدريب وكلاء النص من خلال التعلم إلى الاستكشاف. على وجه الخصوص، يستكشف وكيل النص أولا البيئة لجمع المعلومات الخاصة بالفصل، ثم تتكيف مع سياسة التنفيذ لحل المهمة مع هذه المعلومات. على ALFWorld المتاحة للجمهور، أجرينا دراسة مقارنة مع التعلم التقليد وإظهار تفوق طريقنا.
نقدم طريقة لتوليد ملخصات مقارنة تسليط الضوء على أوجه التشابه والتناقضات في وثائق المدخلات. التحدي الرئيسي في إنشاء هذه الملخصات هو عدم وجود بيانات تدريبية متوازية كبيرة مطلوبة لتدريب أنظمة التلخيص النموذجية. تحقيقا لهذه الغاية، نقدم نهج جيل مختلفي مس
توحى من أنظمة المفاهيم التقليدية إلى النص. لتمكين المقارنة الدقيقة بين المصادر المختلفة، يتعلم النموذج أولا استخراج العلاقات ذات الصلة من وثائق المدخلات. يستخدم مكون تخطيط المحتوى المشغلين المحددين لتجميع هذه العلاقات بعد تحديد مجموعة فرعية للإدماج في ملخص. مكون إدراك السطح Lexicalizes هذه المعلومات باستخدام نموذج لغة تسقط النص. من خلال اختيار محتوى النمذجة بشكل منفصل وإدراكه، يمكننا تدريبها بشكل فعال مع التعليقات التوضيحية المحدودة. نفذنا واختبرنا النموذج في مجال التغذية والصحة - تنتشر بالتناسيل. مقارنة بالأساليب التقليدية، يؤدي إطارنا إلى تلخيص أكثر مخلصة وثيقة ومهمة الحساسة للتجميع - بينما يجري بطلاقة بنفس القدر.
نقدم دخولنا إلى تصنيف سياق استشهاد المهام المشترك 2021 3C بناء على منافسة الغرض.الهدف من المسابقة هو تصنيف الاقتباس في مادة علمية بناء على هدفها.هذه المهمة مهمة لأنه من المحتمل أن تؤدي إلى طرق أكثر شمولا لتلخيص الغرض واستخدامات المقالات العلمية، ولكن
من الصعب أيضا، ويرجع ذلك أساسا إلى كمية محدودة من البيانات التدريبية المتاحة التي كانت فيها أغراض كل الاقتباس يدوياالمسمى، جنبا إلى جنب مع الذاتية لهذه الملصقات.إن دخولنا في المسابقة هو نموذج متعدد المهام يجمع بين وحدات متعددة مصممة للتعامل مع المشكلة من وجهات نظر مختلفة، بما في ذلك الميزات اللغوية التي تم إنشاؤها يدويا، وميزات TF-IDF، ونموذج LSTM- مع الانتباه.كما نقدم دراسة الاجتثاث والتحليل الميزات التي يمكن أن تؤدي رؤيتها إلى العمل في المستقبل.
أظهر العمل الأخير على تصنيف المعنويات على مستوى جانب جانب الجسبي فعالية دمج الهياكل النحوية مثل أشجار الاعتمادية مع شبكات عصبية رسم بيانية (GNN)، ولكن هذه الأساليب عادة ما تكون عرضة للخطأ في التحليل. لتحسين الاستفادة من المعلومات الأساسية في مواجهة ا
لأخطاء التي لا مفر منها، نقترح تقنية رسم بياني بسيطة ولكنها فعالة، Grapmerge، للاستفادة من التنبؤات من المحللين المختلفين. بدلا من تعيين مجموعة واحدة من المعلمات النموذجية إلى كل شجرة التبعية، نقدم أولا علاقات التبعية من يوزعات مختلفة قبل تطبيق GNNS على الرسم البياني الناتج. يسمح هذا نماذج GNN قوية بتحليل الأخطاء دون أي تكلفة حسابية إضافية، ويساعد على تجنب التغلب على التغلب والتجول من تكديس طبقة GNN عن طريق إدخال المزيد من التوصيلية في الرسم البياني للفرقة. تظهر تجاربنا في مهمة Semeval 2014 Task 4 و ACL 14 Twitter أن نموذج Graphmerge الخاص بنا ليس فقط تفوق النماذج مع شجرة الاعتماد الفردي، ولكن أيضا يدق نماذج فرقة أخرى دون إضافة معلمات النموذج.