ترغب بنشر مسار تعليمي؟ اضغط هنا

تقييم جملة التعلم من الرسم البياني المرساة من التبعية للتنبؤ الضام

Learning Clause Representation from Dependency-Anchor Graph for Connective Prediction

357   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التمثيل الدلالي الذي يدعم اختيار الشبكة المناسبة بين أزواج من الطابور يتناول بطبيعته تماسك الخطاب، وهو أمر مهم للمهام مثل الفهم السردي والحجة وتحليل الخطاب. نقترح طريقة تضمين شرطة رواية تطبق تعلم الرسم البياني في تعلم بنية البيانات، نشير إليها كشركة بيانية مرساة بالاعتماد. يشتمل الرسم البياني أنشور التبعية على نوعين من المعلومات النحوية وبنية الدوائر الانتخابية وعلاقات التبعية، لتسليط الضوء على العلاقة بين الموضوعات والفعال. هذا يعزز جوانب التمثيل المرتبطة بالتماسك. نقوم بتصميم نموذج عصبي لتعلم تمثيل دلالي للحصول على بنود من Confolution Graph حول تمثيلات كامنة لموضوع العبارة الفعلية. نقيم طريقنا على مجموعة بيانات جديدة: مجموعة فرعية من كوربوس كبيرة حيث يتم نشر النصوص المصدر رواية، ومجموعة بيانات جديدة تم جمعها من مقالات الطلاب. توضح النتائج تحسنا كبيرا على النماذج القائمة على الأشجار، مما يؤكد أهمية التركيز على موضوع العبارة والفعل. يوضح فجوة الأداء بين مجموعة البيانات الخاصة بتحديات تحليل النص المكتوب للطالب، بالإضافة إلى مهمة تقييم محتملة لنمذجة التماسك وتطبيقا لاقتراح تنقيحات الطلاب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصنيف النص القصير هو مهمة أساسية في معالجة اللغة الطبيعية.من الصعب بسبب عدم وجود معلومات السياق والبيانات المسمى في الممارسة العملية.في هذه الورقة، نقترح طريقة جديدة تسمى SHINE، والتي تعتمد على الشبكة العصبية الرسم البيانية (GNN)، لتصنيف النص القصير. أولا، نقوم بنمذت مجموعة بيانات النص القصيرة كشركة بيانية غير متجانسة هرمية تتكون من رسومات مكونة على مستوى Word والتي تقدم معلومات أكثر دلالة ونقصية.بعد ذلك، نتعلم ديناميكيا رسم بياني مستند قصير يسهل نشر الملصقات الفعالة بين النصوص القصيرة المشابهات.وبالتالي، فإن المقارنة مع الأساليب القائمة على GNN القائمة، والتألق يمكن أن يستغل أفضل التفاعلات بين العقد من نفس الأنواع والقبض على أوجه التشابه بين النصوص القصيرة.تظهر تجارب واسعة النطاق على مختلف مجموعات البيانات القصيرة القصيرة المعجمية أن التألق يتفوق باستمرار على الأساليب الحديثة، خاصة مع عدد أقل من الملصقات.
أظهر العمل الأخير على تصنيف المعنويات على مستوى جانب جانب الجسبي فعالية دمج الهياكل النحوية مثل أشجار الاعتمادية مع شبكات عصبية رسم بيانية (GNN)، ولكن هذه الأساليب عادة ما تكون عرضة للخطأ في التحليل. لتحسين الاستفادة من المعلومات الأساسية في مواجهة ا لأخطاء التي لا مفر منها، نقترح تقنية رسم بياني بسيطة ولكنها فعالة، Grapmerge، للاستفادة من التنبؤات من المحللين المختلفين. بدلا من تعيين مجموعة واحدة من المعلمات النموذجية إلى كل شجرة التبعية، نقدم أولا علاقات التبعية من يوزعات مختلفة قبل تطبيق GNNS على الرسم البياني الناتج. يسمح هذا نماذج GNN قوية بتحليل الأخطاء دون أي تكلفة حسابية إضافية، ويساعد على تجنب التغلب على التغلب والتجول من تكديس طبقة GNN عن طريق إدخال المزيد من التوصيلية في الرسم البياني للفرقة. تظهر تجاربنا في مهمة Semeval 2014 Task 4 و ACL 14 Twitter أن نموذج Graphmerge الخاص بنا ليس فقط تفوق النماذج مع شجرة الاعتماد الفردي، ولكن أيضا يدق نماذج فرقة أخرى دون إضافة معلمات النموذج.
نقترح هندسة محول الرسم البياني المتكرر للرسوم البيانية التلقائي (Rngtr) من أجل تحسين الرسوم البيانية التعسفية من خلال التطبيق العسكري لمحول الرسم البياني غير التلقائي إلى الرسم البياني وتطبيقه على تحليل التبعية النحوية.نوضح قوة وفعالية Rngtr على العد يد من شركات التبعية، باستخدام نموذج التقييم المدرب مسبقا مع بيرت.نقدم أيضا محولات محول النحوية (Sytr)، وهي محلل غير متكرر مشابهة لنموذج التقييم الخاص بنا.يمكن Rngtr تحسين دقة مجموعة متنوعة من المحللين الأوليين في 13 لغة من التبعيات الشاملة TreeBanks والإنجليزية والصينية Benn Treebanks، والجوربوس الألماني Conll2009، وحتى تحسين النتائج الجديدة على النتائج الجديدة التي حققتها Systr، بشكل كبيرتحسين أحدث حديثة لجميع الشركات التي تم اختبارها.
تهدف مهمة اكتشاف الحدث (ED) إلى تصنيف الأحداث من خلال تحديد الحدث الرئيسي تصادف الكلمات المضمنة في جزء من النص. أثبتت الأبحاث السابقة صحة علاقات التبعية النحوية الصابورة في شبكات تشكيلة تشكيلة (GCN). في حين أن الأساليب القائمة على GCN الحالية تستكشف علاقات الاعتماد العقدة الكامنة وفقا لقطعة توتور بقيمة ثابتة، فإن العار الديناميكي القائم على الانتباه، والتي يمكن أن تؤدي الكثير من الاهتمام إلى العقدة الرئيسية مثل حفل الحدث أو العقد المجاورة، وبعد في وقت واحد، تعاني من ظاهرة معلومات الرسم البياني التلاشي الناجمة عن Tensor المتأخر المتماثل، نماذج GCN الحالية لا يمكن تحقيق أداء عموما أعلى. في هذه الورقة، نقترح نماذج رواية ناشئة عن النفس شبكات التنزل المتبقية (SA-GRCN) لعلاقات التبعية الكامنة لعدة عقدة من خلال آلية الاهتمام الذاتي وإدخال الشبكة المتبقية الرسم البياني (GRESNET) لحل مشكلة تخفيض المعلومات الرسم البيانية وبعد على وجه التحديد، يتم بناء وحدة انتباه ذاتي لتوليد موتر الاهتمام، مما يمثل عشرات اهتمام الاعتماد من جميع الكلمات في الجملة. علاوة على ذلك، يضاف مصطلح الرسم البياني المتبقي إلى خط الأساس SA-GCN لبناء GRESNET. بالنظر إلى الاتصال النحوي لإدخال الشبكة، نقوم بتهيئة موتر المشجعي الناشئ دون معالجة وحدة الاهتمام الذاتي باعتباره المصطلح المتبقي. نقوم بإجراء تجارب على مجموعة بيانات ACE2005 وتظهر النتائج تحسنا كبيرا بشأن أساليب خط الأساس التنافسية.
نحن نراجع ميزتين من مزيج من نماذج الخبراء (MOE) التي نسميها وتأثيرات التجميع في سياق محلل التبعية القائمة على الرسوم البيانية المستفادة في إطار احتمامي إشراف. يتوافق المتوسط ​​مع مزيج الفرقة من المحللين وهو مسؤول عن تخفيض التباين الذي يساعد على استقر ار وتحسين دقة التحليل. يصف التجميع طاقة نماذج وزارة التعليم لتعطي المزيد من الائتمان للخبراء يعتقد أنه أكثر دقة بالنظر إلى المدخلات. على الرغم من الواعدة، يصعب تحقيق ذلك، خاصة دون بيانات إضافية. نقوم بتصميم إعداد تجريبي لدراسة تأثير هذه الآثار. في حين أن المتوسط ​​مفيد دائما، فإن التجميع يتطلب تقنيات التهيئة والاستقرار جيدة، لكن مزاياها على مدى المتوسط ​​يبدو أنها تختفي في نهاية المطاف عندما يوجد عدد كاف من الخبراء. كمنتج حسب المنتج، نوضح كيف يؤدي ذلك إلى نتائج أحدث النتائج على PTB و Conll09 Treebank الصينية، مع انخفاض التباين عبر التجارب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا