ترغب بنشر مسار تعليمي؟ اضغط هنا

شبكة تصفية القسم لاستخراج الكيان المشترك والعلاقة

A Partition Filter Network for Joint Entity and Relation Extraction

348   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في استخراج الكيان المشترك والعلاقة، العمل الحالي إما ترميز الميزات الخاصة بمهام المهام بالتتابع، مما يؤدي إلى عدم التوازن في تفاعل الميزات المشتركة بين المهام حيث لا يكون للميزات المستخرجة لاحقا اتصالا مباشرا مع تلك التي تأتي أولا. أو ترميز ميزات الكيان وميزات العلاقة بطريقة متوازية، مما يعني أن التعلم التمثيل الميزات لكل مهمة مستقلة إلى حد كبير عن بعضها البعض باستثناء مشاركة الإدخال. نقترح شبكة تصفية القسم لنموذج التفاعل في اتجاهين بين المهام بشكل صحيح، حيث تحلل ترميز الميزة في خطوتين: القسم والتصفية. في تشفيرنا، نحن نستفيد بوابات اثنين: كيان وبوابة العلاقة، إلى الخلايا العصبية بالقطاع إلى قسمين مهمتين وتقسيم مشترك واحد. يمثل القسم المشترك معلومات مشتركة بين المهام القيمة لكل من المهام ويتم تقاسمها بالتساوي عبر مهمتين لضمان التفاعل السليم في اتجاهين. تمثل أقسام المهام معلومات مهمة داخلية ويتم تشكيلها من خلال الجهود المتضاحية لكل من البوابات، مما يتأكد من أن ترميز ميزات المهام الخاصة يعتمد على بعضها البعض. تظهر نتائج التجربة على ستة مجموعات بيانات عامة أن طرازنا يؤدي أفضل بكثير من النهج السابقة. بالإضافة إلى ذلك، على عكس ما ادعى العمل السابق، تشير تجاربنا الإضافية إلى أن التنبؤ بالعلامة مساهمة في تنبؤ الكيان المسمى بطريقة غير مهم. يمكن العثور على شفرة المصدر في https://github.com/coopercoper/pfn.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن كيان مشترك واستخراج العلاقات يمثل تحديا بسبب التفاعل المعقد للتفاعل بين التعرف على الكيان المسمى واستخراج العلاقة. على الرغم من أن معظم الأعمال القائمة تميل إلى تدريب هذه المهامتين المشتركين من خلال شبكة مشتركة، إلا أنها تفشل في الاستفادة الكاملة من الترابط بين أنواع الكيان وأنواع العلاقات. في هذه الورقة، نقوم بتصميم شبكة مزدوجة متزامنة رواية (SDN) مع اهتمام عبر النوع عبر الانتباه بشكل منفصل وتفاعي تفاعلي أنواع الكيان وأنواع العلاقات. من ناحية، يعتمد SDN اثنين من النوع BI اتجاهي ISOMORPHIC LSTM لترميز التمثيلات المحسنة نوع الكيان والتمثيلات المحسنة نوع العلاقة، على التوالي. من ناحية أخرى، نماذج SDN صراحة الترابط بين أنواع الكيان وأنواع العلاقات عبر آلية الاهتمام عبر النوع. بالإضافة إلى ذلك، نقترح أيضا استراتيجية تعليمية متعددة المهام الجديدة عبر النمذجة تفاعل نوعين من المعلومات. تجارب مجموعات بيانات NYT و WEBNLG تحقق من فعالية النموذج المقترح، وتحقيق الأداء الحديث في الفن.
تم دراسة التعرف على الكيان المسمى Nestate (NNER) على نطاق واسع، تهدف إلى تحديد جميع الكيانات المتداخلة من تمديدات محتملة (I.E.، واحد أو أكثر من الرموز المستمرة). ومع ذلك، فإن الدراسات الحديثة لأي نانر إما التركيز على مخططات العلامات الشاقة أو الاستفا دة من الهياكل المعقدة، والتي تفشل في تعلم تمثيلات فعالة من جملة المدخلات مع كيانات متداخلة للغاية. بمعنى حدسي، ستساهم تمثيلات صريحة في نانر بسبب معلومات السياق الغنية التي تحتوي عليها. في هذه الدراسة، نقترح شبكة محول هرمية (HITRANS) للمهمة NNER، والتي تتحلل جملة الإدخال إلى تمثال متعدد الحبوب وتعزز التعلم التمثيل بطريقة هرمية. على وجه التحديد، نستخدم أول وحدة من المرحلة الأولى لتوليد تمثيلات تمتد عن طريق معلومات السياق التجميعية بناء على شبكة محول من أسفل إلى أعلى وهبوطا. ثم تم تصميم طبقة التنبؤ الملصق للتعرف على الكيانات المتداخلة هرمية، والتي تستكشف بشكل طبيعي التبعيات الدلالية بين تمديد مختلفة. تثبت تجارب مجموعات بيانات Genia و ACE-2004 و ACE-2005 و NNE أن طريقةنا المقترحة تحقق أداء أفضل بكثير من النهج التي من بين الفني.
اعتمدت نهج استخراج المعلومات الحديثة على تدريب النماذج العصبية العميقة. ومع ذلك، يمكن أن تتجاوز هذه النماذج بسهولة الملصقات الصاخبة وتعاني من تدهور الأداء. في حين أنه من المكلف للغاية تصفية الملصقات الصاخبة في موارد تعليمية كبيرة، فإن الدراسات الحديث ة تظهر أن مثل هذه الملصقات تتخذ المزيد من الخطوات التدريبية التي سيتم حفظها وتكون نسيانها بشكل أكثر تواترا من الملصقات النظيفة، وبالتالي يتم تحديدها في التدريب. بدافع من هذه الخصائص، نقترح إطارا بسيطا بانتظام بسيطة لاستخراج المعلومات التركز على الكيان، والذي يتكون من العديد من النماذج العصبية مع هياكل متطابقة ولكن تهيئة معلمة مختلفة. يتم تحسين هذه النماذج بشكل مشترك مع الخسائر الخاصة بالمهمة ويتم تنظيمها لتوليد تنبؤات مماثلة تستند إلى فقدان اتفاقية، تمنع التجديدات الخارجية على الملصقات الصاخبة. تظهر تجارب واسعة على نطاق واسع على نطاق واسع ولكن صاخبة لاستخراج المعلومات، Tacred و Conll03، فعالية إطار عملنا. نطلق سرد علاماتنا للمجتمع للبحث في المستقبل.
تدرس هذه الورقة مشكلة دقة Aquerence Aquerence Coursence (CDE) التي تسعى إلى تحديد ما إذا كان يذكر الحدث عبر مستندات متعددة تشير إلى نفس الأحداث في العالم الحقيقي.أظهر العمل المسبق فوائد معلومات الوسائد وسياق الوثيقة لحل فور معلومات الحدث.ومع ذلك، لم يتم التقاط هذه المعلومات بفعالية في العمل السابق ل CDECR.لمعالجة هذه القيود، نقترح نموذجا تعليميا عميقا جديدا ل CDEG الذي يقدم الرصاص الهرمي للشبكات العصبية التنافعية (GCN) إلى إشراف الكيان والحكام المشترك.على هذا النحو، تمكن GCNs مستوى الجملة من ترميز كلمات السياق المهمة لذكر الحدث وحججها بينما يهدف GCN على مستوى المستند إلى تذكر هياكل التفاعل الحدث والحجج لحساب تمثيلات الوثيقة لأداء CDU.يتم إجراء تجارب واسعة لإظهار فعالية النموذج المقترح.
للتخفيف من ندرة التسمية في مهمة التعرف على الكيان المسمى (NER)، يتم تطبيق أساليب NER التي أشرف بشكل كبير على نطاق واسع على البيانات التسمية تلقائيا وتحديد الكيانات.على الرغم من انخفاض الجهود البشرية، فإن التعليقات التوضيحية غير المكتملة والصعار النات جة تشكل تحديات جديدة لتعلم النماذج العصبية الفعالة.في هذه الورقة، نقترح طريقة تمديد القاموس الرواية التي تستخرج كيانات جديدة من خلال النموذج الموسع من النوع.علاوة على ذلك، نقوم بتصميم شبكة تدرك حدود متعددة التحبيب التي تكتشف حدود الكيان من وجهات النظر المحلية والعالمية.نقوم بإجراء تجارب على أنواع مختلفة من مجموعات البيانات، تظهر النتائج أن طرازنا تتفوق على الأنظمة السابقة للإشراف المستمرة، وحتى تجاوز النماذج الخاضعة للإشراف.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا