ترغب بنشر مسار تعليمي؟ اضغط هنا

شبكة مزدوجة متزامنة مع الاهتمام عبر النوع من أجل كيان مشترك واستخراج العلاقات

Synchronous Dual Network with Cross-Type Attention for Joint Entity and Relation Extraction

393   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

إن كيان مشترك واستخراج العلاقات يمثل تحديا بسبب التفاعل المعقد للتفاعل بين التعرف على الكيان المسمى واستخراج العلاقة. على الرغم من أن معظم الأعمال القائمة تميل إلى تدريب هذه المهامتين المشتركين من خلال شبكة مشتركة، إلا أنها تفشل في الاستفادة الكاملة من الترابط بين أنواع الكيان وأنواع العلاقات. في هذه الورقة، نقوم بتصميم شبكة مزدوجة متزامنة رواية (SDN) مع اهتمام عبر النوع عبر الانتباه بشكل منفصل وتفاعي تفاعلي أنواع الكيان وأنواع العلاقات. من ناحية، يعتمد SDN اثنين من النوع BI اتجاهي ISOMORPHIC LSTM لترميز التمثيلات المحسنة نوع الكيان والتمثيلات المحسنة نوع العلاقة، على التوالي. من ناحية أخرى، نماذج SDN صراحة الترابط بين أنواع الكيان وأنواع العلاقات عبر آلية الاهتمام عبر النوع. بالإضافة إلى ذلك، نقترح أيضا استراتيجية تعليمية متعددة المهام الجديدة عبر النمذجة تفاعل نوعين من المعلومات. تجارب مجموعات بيانات NYT و WEBNLG تحقق من فعالية النموذج المقترح، وتحقيق الأداء الحديث في الفن.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في استخراج الكيان المشترك والعلاقة، العمل الحالي إما ترميز الميزات الخاصة بمهام المهام بالتتابع، مما يؤدي إلى عدم التوازن في تفاعل الميزات المشتركة بين المهام حيث لا يكون للميزات المستخرجة لاحقا اتصالا مباشرا مع تلك التي تأتي أولا. أو ترميز ميزات الك يان وميزات العلاقة بطريقة متوازية، مما يعني أن التعلم التمثيل الميزات لكل مهمة مستقلة إلى حد كبير عن بعضها البعض باستثناء مشاركة الإدخال. نقترح شبكة تصفية القسم لنموذج التفاعل في اتجاهين بين المهام بشكل صحيح، حيث تحلل ترميز الميزة في خطوتين: القسم والتصفية. في تشفيرنا، نحن نستفيد بوابات اثنين: كيان وبوابة العلاقة، إلى الخلايا العصبية بالقطاع إلى قسمين مهمتين وتقسيم مشترك واحد. يمثل القسم المشترك معلومات مشتركة بين المهام القيمة لكل من المهام ويتم تقاسمها بالتساوي عبر مهمتين لضمان التفاعل السليم في اتجاهين. تمثل أقسام المهام معلومات مهمة داخلية ويتم تشكيلها من خلال الجهود المتضاحية لكل من البوابات، مما يتأكد من أن ترميز ميزات المهام الخاصة يعتمد على بعضها البعض. تظهر نتائج التجربة على ستة مجموعات بيانات عامة أن طرازنا يؤدي أفضل بكثير من النهج السابقة. بالإضافة إلى ذلك، على عكس ما ادعى العمل السابق، تشير تجاربنا الإضافية إلى أن التنبؤ بالعلامة مساهمة في تنبؤ الكيان المسمى بطريقة غير مهم. يمكن العثور على شفرة المصدر في https://github.com/coopercoper/pfn.
الطريقة التي يتم إنشاؤها ونشرها قد تغيرت بشكل كبير خلال العقد الماضي.إن تحديد المنظور السياسي يشكل طريقة مناقشة الأحداث المناقشة في وسائل الإعلام أكثر أهمية بسبب الزيادة الحادة في عدد منافذ الأخبار والمقالات.الأساليب السابقة عادة ما تستفيد فقط المعلو مات اللغوية.ومع ذلك، فإن المقالات الإخبارية تحاول الحفاظ على المصداقية ويبدو أنها محايدة.لذلك، يتم تقديم التحيز بطرق خفية، عادة من خلال التركيز على جوانب مختلفة من القصة.في هذه الورقة، نقترح إطارا جديدا يعتبر الكيانات المذكريات في المقالات الإخبارية والمعرفة الخارجية بها، مما أسفر عن التحيز فيما يتعلق بهذه الكيانات.نستكشف طرق مختلفة لحقن معلومات الكيان في نموذج النص.تظهر التجارب أن إطار عملنا المقترح يحقق تحسينات كبيرة على النماذج النصية القياسية، وهو قادر على تحديد الفرق في روايات الأخبار مع وجهات نظر مختلفة.
أصبحت الرسوم البيانية المعرفة (KGS) شعبية بشكل متزايد في السنوات الأخيرة. ومع ذلك، نظرا لأن المعرفة تنمو باستمرار وتغييرات، فمن المحتم أن تمتد KGS الموجودة مع الكيانات التي ظهرت أو أنها ذات صلة بنطاق كجم بعد إنشائها. تعتمد البحث في تحديث KGS عادة على استخراج الكيانات المسماة والعلاقات من النص. ومع ذلك، لا يمكن لهذه الأساليب استنتاج كيانات أو علاقات غير مذكورة صراحة. بدلا من ذلك، استغلال نماذج التضمين الانتظار الهيكلية الضمنية للتنبؤ بالعلاقات المفقودة، ولكن لا يمكن التنبؤ بالكيانات المفقودة. في هذه المقالة، نقدم طريقة جديدة لإثراء KG مع كيانات جديدة بالنظر إلى وصفها النصي. لدينا طريقة ترفع نماذج تضمين مشتركة، وبالتالي لا تتطلب كيانات أو علاقات يمكن تسميتها صراحة. نظرا لأن نهجنا يمكن أن تحدد مفاهيم جديدة في كوربوس وثيقة ونقلها إلى كجم، ونجد أن أداء طريقتنا يحسن بشكل كبير عند تمديده مع تقنيات من تعدين حكم الرابطة، والتعدين النصي، والتعلم النشط.
للتخفيف من ندرة التسمية في مهمة التعرف على الكيان المسمى (NER)، يتم تطبيق أساليب NER التي أشرف بشكل كبير على نطاق واسع على البيانات التسمية تلقائيا وتحديد الكيانات.على الرغم من انخفاض الجهود البشرية، فإن التعليقات التوضيحية غير المكتملة والصعار النات جة تشكل تحديات جديدة لتعلم النماذج العصبية الفعالة.في هذه الورقة، نقترح طريقة تمديد القاموس الرواية التي تستخرج كيانات جديدة من خلال النموذج الموسع من النوع.علاوة على ذلك، نقوم بتصميم شبكة تدرك حدود متعددة التحبيب التي تكتشف حدود الكيان من وجهات النظر المحلية والعالمية.نقوم بإجراء تجارب على أنواع مختلفة من مجموعات البيانات، تظهر النتائج أن طرازنا تتفوق على الأنظمة السابقة للإشراف المستمرة، وحتى تجاوز النماذج الخاضعة للإشراف.
يمكن أن تكون مشاكل تصنيف المستندات متعددة الملصقات (MLDC) تحديا، خاصة بالنسبة للمستندات الطويلة ذات مجموعة علامات كبيرة وتوزيع ذيل طويل على الملصقات. في هذه الورقة، نقدم شبكة اهتمام نفعية فعالة لمشكلة MLDC مع التركيز على تنبؤ الكود الطبي من الوثائق ا لسريرية. ابتكاراتنا هي ثلاثة أضعاف: (1) نستخدم تشفير عميق يستند إلى الارتفاع مع شبكات الضغط والإثارة والشبكات المتبقية لتجميع المعلومات عبر الوثيقة وتعلم تمثيلات وثيقة ذات مغزى تغطي نطاقات مختلفة من النصوص؛ (2) نستكشف الانتباه متعدد الطبقات ومجموعة إيلاء الاهتمام لاستخراج الميزات الأكثر تفاعيمية من هذه التمثيلات متعددة النطاق؛ (3) نجمع بين خسارة انتروبيا الصليب الثنائية وفقدان البؤري لتحسين الأداء للعلامات النادرة. نحن نركز دراسة تقييمنا على MIMIC-III، مجموعة بيانات واستخدامها على نطاق واسع في المجال الطبي. تتفوق نماذجنا على العمل السابق على الترميز الطبي وتحقيق نتائج جديدة من الفنون الجديدة على مقاييس متعددة. كما نوضح أيضا الطبيعة المستقلة للغة لنهجنا من خلال تطبيقها على مجموعة بيانات غير الإنجليزية. يتفوق النموذج الخاص بنا على أفضل نموذج مسبق ونموذج محول متعدد اللغات من هامش جوهري.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا