تهدف استخراج العلاقات الزمنية الفائقة (FINETEMPRL) إلى الاعتراف بتذكير فترات الزمن والجدول الزمني في النص.جزء مفقود في نماذج التعلم العميقة الحالية ل Finetemprel هو فشلهم في استغلال الهياكل النحوية لجمل المدخلات لإثراء ناقلات التمثيل.في هذا العمل، نق
ترح ملء هذه الفجوة من خلال إدخال طرق جديدة لإدماج الهياكل النحوية في نماذج التعلم العميق ل Finetemprel.يركز النموذج المقترح على نوعين من المعلومات النحوية من أشجار التبعية، أي عشرات الأهمية التي تستند إلى بناء الجملة لتعلم تمثيل الكلمات والاتصالات النحوية لتحديد كلمات السياق الهامة لذكر الحدث.نقدم أيضا تقنيات جديدة لتسهيل نقل المعرفة بين المهام الفرعية في Finetempr، مما يؤدي إلى نموذج جديد مع الأداء الحديث لهذه المهمة.
تهدف الكشف عن العلاقات متعددة القفزات في أسئلة المعرفة الإجابة (KBQA) إلى استرجاع مسار العلاقة بدءا من كيان الموضوع إلى عقدة الإجابة بناء على سؤال معين، حيث قد يشتمل مسار العلاقة على علاقات متعددة. تعامل معظم الأساليب الموجودة بمثابة مشكلة في تعلم ال
علامة الفردية مع تجاهل حقيقة أنه بالنسبة لبعض الأسئلة المعقدة، توجد مسارات علاقة صحيحة متعددة في قواعد المعرفة. لذلك، في هذه الورقة، يعتبر اكتشاف العلاقة المتعددة القفز مشكلة في التعلم متعدد العلامات. ومع ذلك، فإن إجراء اكتشاف علاقة متعددة الأقفز متعددة الملصقات يمثل تحديا لأن أعداد كل من الملصقات والقفزات غير معروفة. لمعالجة هذا التحدي، يتم صياغة الكشف المتعدد الملصقات متعددة القفز كهجوم توليد التسلسل. يقترح نموذج توليد علاقات العلاقة بين العلاقة على حل المشكلة بطريقة نهاية إلى نهاية. تظهر النتائج التجريبية فعالية الطريقة المقترحة للكشف عن العلاقة و KBQA.
استخراج العلاقات الإشراف على نطاق واسع يستخدم على نطاق واسع في بناء قواعد المعرفة بسبب كفاءته العالية.ومع ذلك، فإن الحالات التي تم الحصول عليها تلقائيا ذات جودة منخفضة مع العديد من الكلمات غير ذات الصلة.بالإضافة إلى ذلك، يؤدي الافتراض القوي للإشراف ا
لبعيد إلى وجود جمل صاخبة في أكياس الجملة.في هذه الورقة، نقترح شبكة مراجعة متعددة الطبقات رواية (MLRN) التي تخفف من آثار ضوضاء مستوى الكلمات من خلال التأكيد على علاقات الجملة الداخلية قبل استخراج المعلومات ذات الصلة داخل الجمل.بعد ذلك، نركز طريقة تعليمية متعددة الاستخدامات متعددة الاستخدامات ومقاومة للضوضاء مقاومة للضوضاء لتصفية الجمل الصاخبة وكذلك تعيين الأوزان المناسبة إلى تلك ذات الصلة.تجارب واسعة على مجموعة بيانات اثنين نيويورك تايمز (NYT) تثبت أن نهجنا يحقق تحسينات كبيرة على الأساس.
شروط الارتفاع استخراج (أكلت) وتصنيف معنويات الجانب (ASC) هي مهمتان أساسيتان من المهام الفرعية الأساسية والغرامة في تحليل المعنويات على مستوى الجانب (ALSA). في التحليل النصي، تم استخراج المشترك استخراج كل من شروط الارتفاع وأقطاب المعنويات كثيرا بسبب ط
لبات أفضل من المهمة الفرعية الفردية. ومع ذلك، في السيناريو متعدد الوسائط، تقتصر الدراسات الحالية على التعامل مع كل مهمة فرعية بشكل مستقل، والتي تفشل في نموذج العلاقة الفطرية بين الأهدافين أعلاه وتتجاهل التطبيقات الأفضل. لذلك، في هذه الورقة، نحن أول من يؤدي ذلك بشكل مشترك أداء أكلت متعددة الوسائط (ماتي) ومتعدد الوسائط (MASC)، ونقترح نهج التعلم المشترك متعدد الوسائط مع اكتشاف العلاقات عبر الوسائط المساعد للمتوسطة تحليل المعنويات على مستوى الجانب (Malsa). على وجه التحديد، نقوم أولا بإنشاء وحدة اكتشاف علاقة نصية إضافية للكشف عنها للتحكم في الاستغلال المناسب للمعلومات المرئية. ثانيا، نعتمد إطار التسلسل الهرمي لسجل الاتصال متعدد الوسائط بين رفيقه ومتك اليومي، بالإضافة إلى توجيه بصري منفصل لكل وحدة فرعية. أخيرا، يمكننا الحصول على جميع أطريات المعنويات على مستوى جانب الجسبي تعتمد على الجوانب المحددة المستخرجة بشكل مشترك. تظهر تجارب واسعة فعالية نهجنا مقابل الأساليب النصية المشتركة والخط الأنابيب ونهج متعددة الوسائط.
استخراج العلاقات غير المدعومة من قبل أزواج كيان التجمع التي لها نفس العلاقات في النص. تقوم بعض الأساليب المتنوعة (VAE) المتنوعة (VAE) بتدريب نموذج استخراج العلاقة كترفيه يولد تصنيفات العلاقة. يتم تدريب وحدة فك الترميز جنبا إلى جنب مع التشفير لإعادة ب
ناء إدخال التشفير بناء على تصنيفات العلاقة التي يتم إنشاؤها المشن. هذه التصنيفات هي متغير كامن حتى يطلب منهم اتباع توزيع مسبق محدد مسبقا يؤدي إلى تدريب غير مستقر. نقترح تقنية استخراج العلاقات التي تعتمد عليها VAE تقوم بتغيير هذا القيد باستخدام التصنيفات كمتغير متوسط بدلا من متغير كامن. على وجه التحديد، تكون التصنيفات مشروطة بإدخال الجملة، في حين أن المتغير الكامن مشروط على كل من التصنيفات وإدخال الجملة. يتيح ذلك نموذجنا لتوصيل وحدة فك الترميز مع التشفير دون وضع قيود على توزيع التصنيف؛ الذي يحسن استقرار التدريب. يتم تقييم نهجنا على بيانات DataSet NYT وتفوق الطرق الحديثة.
في السنوات الأخيرة، تم تطبيق نماذج قليلة بالرصاص بنجاح في مجموعة متنوعة من مهام NLP.هان وآخرون.(2018) أدخل إطارا متعدد الطلقات التعلم لتصنيف العلاقة، ومنذ ذلك الحين، تجاوزت عدة نماذج الأداء البشري في هذه المهمة، مما يؤدي إلى الانطباع بأن التصنيف القل
يل من الطلقات يتم حلها.في هذه الورقة، نلقي نظرة أعمق على فعالية نماذج التصنيف القليلة القليلة في إعداد استخراج العلاقات الأكثر شيوعا، وإظهار أن مقاييس التقييم القليلة النموذجية تحجب تقلب واسع في الأداء عبر العلاقات.على وجه الخصوص، نجد أن نماذج تصنيف العلاقات بين الفنون القليلة تعتمد بشكل مفرط على معلومات نوع الكيان، واقتراح تعديلات على روتين التدريب لتشجيع النماذج على التمييز بشكل أفضل بين العلاقات التي تنطوي على أنواع كيانات مماثلة.
يركز استخراج علاقات قليلة (FSRE) على الاعتراف بعلاقات جديدة من خلال التعلم مع مجرد حفنة من الحالات المشروح.تم اعتماد التعلم التلوي على نطاق واسع لمثل هذه المهمة، والتي تتدرب على إنشاء مهام قليلة من الرصاص بشكل عشوائي لتعلم تمثيلات بيانات عامة.على الر
غم من النتائج المثيرة للإعجاب التي تحققت، لا تزال النماذج الحالية تؤدي دون التفاادم عند التعامل مع مهام FSRE الثابتة، حيث تكون العلاقات محببة ومتشابهة لبعضها البعض.نقول هذا إلى حد كبير لأن النماذج الحالية لا تميز المهام الثابتة من سهلة في عملية التعلم.في هذه الورقة، نقدم نهجا جديدا يعتمد على التعلم المتعاقل الذي يتعلم تمثيلات أفضل من خلال استغلال معلومات الملصقات العلاقة.نحن أيضا تصميم طريقة تسمح للنموذج بتعلم تكيف كيفية التركيز على المهام الثابتة.تجارب على مجموعة بيانات قياسية توضح فعالية طريقتنا.
يعاني العمل السابق على علاقة Crosslingual واستخراج الأحداث (REE) من قضية التحيز أحادي الأحادي بسبب تدريب النماذج على بيانات اللغة المصدر فقط. تتمثل نهج التغلب على هذه المسألة في استخدام البيانات غير المستهلكة في اللغة المستهدفة لمساعدة محاذاة تمثيلات
crosslingual، أي عن طريق خداع تمييز لغة. ومع ذلك، نظرا لأن هذا النهج غير بشرط على معلومات الفصل، فإن مثال لغوي مستهدف يمكن أن يتماشى بشكل غير صحيح إلى مثال لغة مصدر لفئة مختلفة. لمعالجة هذه المشكلة، نقترح طريقة محاذاة Crosslingual الجديدة التي ترفد معلومات الفئة من مهام REE لتعلم التمثيل. على وجه الخصوص، نقترح تعلم نسختين من ناقلات التمثيل لكل فصل في مهمة ري بناء على أمثلة اللغة أو الهدف المستهدف. سيتم بعد ذلك محاذاة ناقلات التمثيل للفصول المقابلة لتحقيق محاذاة علم الفئة للتمثيلات crosslingual. بالإضافة إلى ذلك، نقترح مواصلة مواءمة مقالات التمثيل لفئات الكلمات العالمية للألوج (أي أجزاء من العلاقات بين الكلام والاعتماد). على هذا النحو، يتم تقديم آلية تصفية جديدة لتسهيل تعلم تمثيلات فئة Word من تمثيلات السياق على نصوص الإدخال بناء على التعلم المشددي. نقوم بإجراء تجارب متشددة واسعة النطاق مع اللغة الإنجليزية والصينية والعربية على مهام ري. توضح النتائج فوائد الطريقة المقترحة التي تقدم بشكل كبير الأداء الحديث في هذه الإعدادات.
تهدف استخراج العلاقات المنخفضة الموارد (LRE) إلى استخراج حقائق العلاقة من كورسا محدودة المسمى عندما تشريح الإنسان نادرة. تعمل الأعمال الموجودة إما استخدام مخطط التدريب الذاتي لتوليد ملصقات زائفة ستتسبب في مشكلة الانجراف التدريجي، أو نظام التعلم التلو
ي الاستفادي الذي لا يتطلب التغيلات بشكل صريح. لتخفيف التحيز الاختيار بسبب عدم وجود حلقات ردود الفعل في نماذج التعلم الحالية، قمنا بتطوير طريقة تعليمية لتعزيز التعزيز التدرج لتشجيع بيانات الملصقات الزائفة لتقليد اتجاه نزول التدرج على البيانات المسمى و Bootstrap إمكانية التحسين من خلال التجربة والخطأ. نقترح أيضا إطارا يسمى Gradlre، الذي يتعامل مع سيناريوهات رئيسيين في استخراج علاقة الموارد المنخفضة. إلى جانب السيناريو حيث تكون البيانات غير المسبقة كافية، يتعامل Gradlre الموقف حيث لا تتوفر بيانات غير قابلة للتحقيق، من خلال استغلال طريقة تكبير سياقيا لتوليد البيانات. النتائج التجريبية على مجموعات بيانات عامة تثبت فعالية الخريجين في استخراج العلاقات المنخفضة للموارد عند مقارنة مع الأساس.
تركز أساليب استخراج العلاقة الحالية (إعادة) عادة على استخراج الحقائق العلائقية بين أزواج الكيان داخل جمل أو مستندات واحدة.ومع ذلك، لا يمكن استنتاج كمية كبيرة من الحقائق العلائقية في قواعد المعرفة إلا في جميع الوثائق في الممارسة.في هذا العمل، نقدم مشك
لة إعادة الوثيقة العملية، مما يجعل خطوة أولية نحو اكتساب المعرفة في البرية.لتسهيل البحث، نقوم ببناء أول مجموعة بيانات عبر الوثيقة المشروح البشرية.مقارنة مع مجموعات البيانات الحالية، تقدم Codred تحديين رئيسيين: بالنظر إلى كيانين، (1) يتطلب إيجاد المستندات ذات الصلة التي يمكن أن توفر أدلة لتحديد علاقاتها؛(2) يتطلب التفكير في مستندات متعددة لاستخراج الحقائق العلائقية.نقوم بإجراء تجارب شاملة لإظهار أن Codred هو تحدي أساليب إعادة الخدمات القائمة بما في ذلك النماذج القاعدة القائمة على بيرت.