ترغب بنشر مسار تعليمي؟ اضغط هنا

استخراج العلاقة مع الرسوم البيانية Word من N-Grams

Relation Extraction with Word Graphs from N-grams

247   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أحدث دراسات لاستخراج العلاقات (إعادة) الاستفادة من شجرة التبعية من جملة الإدخال لإدماج المعلومات السياقية التي يحركها بناء الجملة لتحسين الأداء النموذجي، مع القليل من الاهتمام المدفوع للقيود حيث محلل التبعية عالية الجودة في معظم الحالات غير متوفرة، خاصة في سيناريوهات البناء. لمعالجة هذا القيد، في هذه الورقة، نقترح شبكات اتصال بياني اختصاصية (A-GCN) لتحسين الأساليب العصبية بطريقة غير مرئية لبناء الرسم البياني للسياق، دون الاعتماد على وجود محلل التبعية. على وجه التحديد، نقوم بإنشاء الرسم البياني من N-Grams المستخرجة من معجم مبني من المعلومات المتبادلة غير التاريخية (PMI) وتطبيق الانتباه عبر الرسم البياني. لذلك، يتم مرجح أزواج كلمة مختلفة من السياقات داخل وعبر N-Grams في النموذج وتسهيل إعادة استخدامها وفقا لذلك. النتائج التجريبية مع المزيد من التحليلات على مجموعات بيانات قياسية باللغة الإنجليزية لإظهار فعالية نهجنا، حيث يلاحظ أداء حديثة على كلا البيانات.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح أن نقترح تصميم الرسوم البيانية التي تم تفكيكها عن الكلمات الفائقة من الفئة الدلالية الفائقة بين استخدامات الكلمات مع صياغة Bayesian لنموذج Black Block المرجح، وهو نموذج عام لرسوم بيانية عشوائية شعبية في علم الأحياء والفيزياء والعلوم الاجتماعية. من خلال توفير نموذج احتمامي للكلمة المتقدمة مما يعني أننا نهدف إلى الاقتراب من الفكرة الزلقة وحتى الآن استخدامها على نطاق واسع من معنى كلمة بطريقة جديدة.يتيح لنا الإطار المقترح من مقارنة نماذج Word بصرامة فيما يتعلق بملائمها للبيانات.نحن نؤدي تجارب واسعة وتحديد النموذج الأكثر كفاءة تجريبيا.
أصبح نص قصير في الوقت الحاضر أشكالا أكثر عصرية من البيانات النصية، على سبيل المثال، منشورات Twitter، عناوين الأخبار ومراجعات المنتجات. يلعب استخراج الموضوعات الدلالية من النصوص القصيرة دورا مهما في مجموعة واسعة من تطبيقات NLP، ومصمم الموضوع العصبي ال آن أداة رئيسية لتحقيقها. بدافع من تعلم موضوعات أكثر متماسكا ودلاليا، في هذه الورقة نطور نموذج موضوع عصبي رواية يدعى طراز موضوع الرسم البياني المزدوج Word (DWGTM)، والذي يستخرج الموضوعات من الرسوم البيانية المرتبطة بالكلمة المتزامنة وترابط العلاقة الدلالية. لتكون محددة، نتعلم ميزات كلمة من الرسم البياني العالمي للكلمة المشتركة، وذلك لاستيعاب معلومات حدوث كلمة غنية؛ ثم نقوم بإنشاء ميزات نصية مع ميزات Word، وإطعامها في شبكة تشفير للحصول على نسب موضوعية لكل نص؛ أخيرا، نعيد إعادة بناء الرسوم البيانية الرسمية والكلمات الرسم البياني مع التوزيعات الموضعية وميزات Word، على التوالي. بالإضافة إلى ذلك، لالتقاط دلالات الكلمات، نقوم أيضا بتطبيق ميزات Word لإعادة بناء الرسم البياني للعلاقة الدلالية كلمة محسوبة بواسطة Adgeddings المدربة للكلمة المدربة مسبقا. بناء على هذه الأفكار، نقوم بصياغة DWGTM في نموذج الترميز التلقائي وتدريبه بكفاءة مع روح الاستدلال التباين العصبي. تتحقق النتائج التجريبية التي يمكنها توليد DWGTM موضوعات أكثر متماسكة من النماذج الأساسية من طرازات موضوع الأساس.
يتم إجراء جيل نصي من الرسوم البيانية الدلالية تقليديا مع الطرق الحتمية، والتي تولد وصفا فريدا نظرا رسم بياني للإدخال.ومع ذلك، تعترف مشكلة الجيل مجموعة من النواتج النصية المقبولة، وعرض الاختلاف المعجمي والمنظمات والدلية.لمعالجة هذا الفصل، نقدم مساهمتي ن رئيسيتين.أولا، نقترح نموذج رسم بياني مؤشر استوكاستكي، حيث يتضمن متغير كامنة في نموذج فك الترميز، واستخدامه في مجموعة.ثانيا، لتقييم تنوع الجمل التي تم إنشاؤها، نقترح مقياس التقييم التلقائي الجديد الذي يقيم بشكل مشترك تنوع المخرجات وجودة في إعداد متعدد المراجع.نقيم النماذج على مجموعات بيانات Webnlg باللغة الإنجليزية والروسية، وإظهار مجموعة من نماذج الاستوكاستك تنتج مجموعات متنوعة من الجمل التي تم إنشاؤها أثناء الاستفيؤ بجودة مماثلة لنماذج أحدث من النماذج.
الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن تكون بمثابة آلية ذاكرة الوكيل في مهام IMRC.نستكشف أربع فئات مختلفة من الرسوم البيانية التي يمكنها التقاط معلومات نصية على مختلف المستويات.نحن تصف الأساليب التي تقوم ببناء وتحديث هذه الرسوم البيانية هذه ديناميكيا أثناء جمع المعلومات، وكذلك النماذج العصبية لتشفير تمثيلات الرسم البياني في وكلاء RL.تشير تجارب واسعة النطاق على ISquad إلى أن تمثيلات الرسم البياني يمكن أن تؤدي إلى تحسينات كبيرة في الأداء لعوامل RL.
أصبحت الرسوم البيانية المعرفة (KGS) شعبية بشكل متزايد في السنوات الأخيرة. ومع ذلك، نظرا لأن المعرفة تنمو باستمرار وتغييرات، فمن المحتم أن تمتد KGS الموجودة مع الكيانات التي ظهرت أو أنها ذات صلة بنطاق كجم بعد إنشائها. تعتمد البحث في تحديث KGS عادة على استخراج الكيانات المسماة والعلاقات من النص. ومع ذلك، لا يمكن لهذه الأساليب استنتاج كيانات أو علاقات غير مذكورة صراحة. بدلا من ذلك، استغلال نماذج التضمين الانتظار الهيكلية الضمنية للتنبؤ بالعلاقات المفقودة، ولكن لا يمكن التنبؤ بالكيانات المفقودة. في هذه المقالة، نقدم طريقة جديدة لإثراء KG مع كيانات جديدة بالنظر إلى وصفها النصي. لدينا طريقة ترفع نماذج تضمين مشتركة، وبالتالي لا تتطلب كيانات أو علاقات يمكن تسميتها صراحة. نظرا لأن نهجنا يمكن أن تحدد مفاهيم جديدة في كوربوس وثيقة ونقلها إلى كجم، ونجد أن أداء طريقتنا يحسن بشكل كبير عند تمديده مع تقنيات من تعدين حكم الرابطة، والتعدين النصي، والتعلم النشط.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا