ترغب بنشر مسار تعليمي؟ اضغط هنا

القوة في الأرقام: متوسط وتجميع تأثيرات التجميع في مزيج من الخبراء لتحليل التبعية القائمة على الرسم البياني

Strength in Numbers: Averaging and Clustering Effects in Mixture of Experts for Graph-Based Dependency Parsing

167   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نحن نراجع ميزتين من مزيج من نماذج الخبراء (MOE) التي نسميها وتأثيرات التجميع في سياق محلل التبعية القائمة على الرسوم البيانية المستفادة في إطار احتمامي إشراف. يتوافق المتوسط ​​مع مزيج الفرقة من المحللين وهو مسؤول عن تخفيض التباين الذي يساعد على استقرار وتحسين دقة التحليل. يصف التجميع طاقة نماذج وزارة التعليم لتعطي المزيد من الائتمان للخبراء يعتقد أنه أكثر دقة بالنظر إلى المدخلات. على الرغم من الواعدة، يصعب تحقيق ذلك، خاصة دون بيانات إضافية. نقوم بتصميم إعداد تجريبي لدراسة تأثير هذه الآثار. في حين أن المتوسط ​​مفيد دائما، فإن التجميع يتطلب تقنيات التهيئة والاستقرار جيدة، لكن مزاياها على مدى المتوسط ​​يبدو أنها تختفي في نهاية المطاف عندما يوجد عدد كاف من الخبراء. كمنتج حسب المنتج، نوضح كيف يؤدي ذلك إلى نتائج أحدث النتائج على PTB و Conll09 Treebank الصينية، مع انخفاض التباين عبر التجارب.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

المعردات التفسيرية مجردة للتوقعات النموذجية هي حاسمة في التطبيقات العملية.نحن نطور النماذج العصبية التي تمتلك عملية استنتاجية مفسضة لتحليل التبعية.تتبنى نماذجنا الاستدلال المستند إلى المثيل، حيث يتم استخراج حواف التبعية ومسمى من خلال مقارنةها بالحواف في مجموعة تدريبية.يتم استخدام حواف التدريب صراحة للتنبؤات؛وبالتالي، من السهل فهم مساهمة كل حافة إلى التنبؤات.تظهر تجاربنا أن النماذج القائمة على مثيل لدينا تحقق دقة تنافسية مع النماذج العصبية القياسية ولديها المعقول المعقولة من التفسيرات القائمة على المثيل.
النموذج المهيمن للتحلل الدلالي في السنوات الأخيرة هو صياغة تحليل كمركز تسلسل إلى تسلسل، وتوليد تنبؤات مع فك تراجع التسلسل التلقائي.في هذا العمل، نستكشف نموذجا بديلا.نقوم بصياغة تحليل دلالي كهامة تحليل التبعية، وتطبيق تقنيات فك التشفير المستندة إلى ال رسم البياني المتقدمة لتحليل النحوي.نحن نقارن مختلف تقنيات فك التشفير بالنظر إلى نفس التشفير المحول المدرب مسبقا في أفضل مجموعة البيانات، بما في ذلك الإعدادات التي تكون فيها بيانات التدريب محدودة أو تحتوي على أمثلة مشروح جزئيا فقط.نجد أن نهجنا القائم على الرسم البياني لدينا هو تنافسي مع فك ترميز الترميز على الإعداد المعياري، ويقدم تحسينات كبيرة في كفاءة البيانات والإعدادات حيث تتوفر البيانات المشروح جزئيا.
نقترح هندسة محول الرسم البياني المتكرر للرسوم البيانية التلقائي (Rngtr) من أجل تحسين الرسوم البيانية التعسفية من خلال التطبيق العسكري لمحول الرسم البياني غير التلقائي إلى الرسم البياني وتطبيقه على تحليل التبعية النحوية.نوضح قوة وفعالية Rngtr على العد يد من شركات التبعية، باستخدام نموذج التقييم المدرب مسبقا مع بيرت.نقدم أيضا محولات محول النحوية (Sytr)، وهي محلل غير متكرر مشابهة لنموذج التقييم الخاص بنا.يمكن Rngtr تحسين دقة مجموعة متنوعة من المحللين الأوليين في 13 لغة من التبعيات الشاملة TreeBanks والإنجليزية والصينية Benn Treebanks، والجوربوس الألماني Conll2009، وحتى تحسين النتائج الجديدة على النتائج الجديدة التي حققتها Systr، بشكل كبيرتحسين أحدث حديثة لجميع الشركات التي تم اختبارها.
AM تحليل التبعية هي طريقة لتحليل الرسم البياني الدلالي العصبي الذي يستغل مبدأ التركيبية.على الرغم من أن محلل التبعية، فقد تبين أن محلل التبعية سريعة ودقيقة عبر العديد من الرسوم البيانية، فإنها تتطلب عبائيات صريحة لهياكل الأشجار التركيبية للتدريب.في ا لماضي، تم الحصول على هؤلاء استخدام الاستدلال المعقدة من الرسوم المشتركة من قبل الخبراء.هنا نظهر كيف يمكن تدريبهم بدلا من ذلك مباشرة على الرسوم البيانية مع نموذج متغير كامنة عصبي، مما يقلل بشكل كبير من كمية وتعقيد الاستدلال اليدوي.نوضح أن نموذجنا يلتقط العديد من الظواهر اللغوية بمفرده وتحقق دقة مماثلة للتدريب الخاضع للإشراف، مما يسهل بشكل كبير استخدام تحليل التبعية لشبانس جديدة.
التمثيل الدلالي الذي يدعم اختيار الشبكة المناسبة بين أزواج من الطابور يتناول بطبيعته تماسك الخطاب، وهو أمر مهم للمهام مثل الفهم السردي والحجة وتحليل الخطاب. نقترح طريقة تضمين شرطة رواية تطبق تعلم الرسم البياني في تعلم بنية البيانات، نشير إليها كشركة بيانية مرساة بالاعتماد. يشتمل الرسم البياني أنشور التبعية على نوعين من المعلومات النحوية وبنية الدوائر الانتخابية وعلاقات التبعية، لتسليط الضوء على العلاقة بين الموضوعات والفعال. هذا يعزز جوانب التمثيل المرتبطة بالتماسك. نقوم بتصميم نموذج عصبي لتعلم تمثيل دلالي للحصول على بنود من Confolution Graph حول تمثيلات كامنة لموضوع العبارة الفعلية. نقيم طريقنا على مجموعة بيانات جديدة: مجموعة فرعية من كوربوس كبيرة حيث يتم نشر النصوص المصدر رواية، ومجموعة بيانات جديدة تم جمعها من مقالات الطلاب. توضح النتائج تحسنا كبيرا على النماذج القائمة على الأشجار، مما يؤكد أهمية التركيز على موضوع العبارة والفعل. يوضح فجوة الأداء بين مجموعة البيانات الخاصة بتحديات تحليل النص المكتوب للطالب، بالإضافة إلى مهمة تقييم محتملة لنمذجة التماسك وتطبيقا لاقتراح تنقيحات الطلاب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا