ترغب بنشر مسار تعليمي؟ اضغط هنا

تحسين تحريض الأشجار الكامنة مع الإشراف البعيد عبر قيود Span

Improved Latent Tree Induction with Distant Supervision via Span Constraints

535   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لأكثر من ثلاثين عاما، قام الباحثون بتطوير وتحليل طرق لتحريض الأشجار الكامنة كهدوث لنهج التحليل النحوي غير المقترح. ومع ذلك، لا تزال الأنظمة الحديثة لا تؤدي بشكل جيد بما فيه الكفاية مقارنة بنظيراتهم الخاضعة للإشراف للحصول على أي استخدام عملي باسم التعليق الهيكلية للنص. في هذا العمل، نقدم تقنية تستخدم إشراف بعيد في شكل قيود سبعة (أي عبارة قوية) لتحسين الأداء في تحليل الدوائر الانتخابية غير المزدوجة. باستخدام عدد قليل نسبيا من قيود الأمان، يمكننا تحسين الإخراج بشكل كبير من Diora، وهو نظام تحليل غير مناسب بالفعل منافسة. بالمقارنة مع التعليق التوضيحي في شجرة التحليل الكامل، يمكن الحصول على قيود Span مع الحد الأدنى من الجهد، كما هو الحال مع معجم مشتق من ويكيبيديا، للعثور على مباريات نصية دقيقة. تجاربنا تظهر قيود الأمان على أساس الكيانات على تحسين تحليل الدوائر الانتخابية على بنك WSJ Penn TreeBank الإنجليزية بأكثر من 5 F1. علاوة على ذلك، تمتد طريقنا إلى أي مجال يتم فيه تحقيق قيود سبعة بسهولة، وكدراسة حالة نوضح فعاليتها من خلال تحليل النص الطبي الطبيعي من مجموعة بيانات الحرفية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن نقدم Rackbert، وهي طريقة ما قبل التدريب التي تزيد من طرازات اللغة بالقدرة على السبب في العلاقات الطويلة المدى والسياقات المختلفة المحتملة. على عكس أساليب ما قبل التدريب الموجودة التي تحصدها فقط إشارات تعليمية فقط من السياقات المحلية للنصوص التي ت حدث بشكل طبيعي، نقترح فكرة عمومية للإشراف البعيد توصيل قطع النص والجداول متعددة تلقائيا لإنشاء أمثلة تدريبية مسبقا تتطلب منطق طويل المدى. يتم محاكاة أنواع مختلفة من المنطق، بما في ذلك تقاطع أجزاء متعددة من الأدلة، مدفوعة من قطعة واحدة من الأدلة إلى آخر، والكشف عن الحالات التي لا يمكن إجراؤها. نقوم بإجراء تقييم شامل حول مجموعة متنوعة من الأسئلة الاستخراجية التي تربط عن مجموعات البيانات التي تتراوح من قفزة واحدة من قفصات متعددة ومنصات فقط إلى الجدول فقط إلى الهجين والتي تتطلب إمكانيات التفكير المختلفة وإظهار أن Rackberber يحقق تحسنا ملحوظا على مجموعة من القوية خطوط الأساس. تظهر تجارب قليلة أكثر أن طريقتنا السابقة للتدريب على تحسين كفاءة عينة.
في تصنيف علاقة الخطاب الضمني، نريد التنبؤ بالعلاقة بين الجمل المجاورة في غياب أي اتصال خطاب علني. هذا أمر صعب حتى بالنسبة للبشر، مما يؤدي إلى نقص البيانات المشروح، وهي حقيقة تجعل المهمة أكثر صعوبة في نهج التعلم الآلي الإشراف. في الدراسة الحالية، نؤدي تصنيف علاقة الخطاب الضمني دون الاعتماد على أي علاقة ضمنية المسمى. نحن غاضب من عدم وجود بيانات من خلال تفسير العلاقات الضمنية لتقليل المهمة إلى مشكلتين فرعيين: نمذجة اللغة وتصنيف علاقة خطاب صريحة، مشكلة أسهل بكثير. تبين نتائجنا التجريبية أن هذه الطريقة يمكن أن تتفوق حتى الآن على الرغم من أن الحديث، على الرغم من أن تكون أبسط بكثير من النماذج البديلة لأداء مماثل. علاوة على ذلك، نوضح أن الأداء المحقق قوي عبر المجالات كما اقترحته التجارب الصفرية في مجال مختلف تماما. يشير هذا إلى أن التطورات الحديثة في النمذجة اللغوية جعلت نماذج لغة جيدة بما فيه الكفاية في التقاط علاقات بين الجملة دون مساعدة من علامات الخطاب الصريحة.
يحتاج تحليل الأدبيات العلمي إلى التعرف على الكيان المسمى بشكل جيد (NER) لتوفير مجموعة واسعة من المعلومات للاكتشاف العلمي. على سبيل المثال، يحتاج أبحاث الكيمياء إلى دراسة العشرات إلى مئات أنواع الكيانات المتميزة والجمالية المميزة، مما يجعل التعليق الت وضيحي ثابت ودقيقا صعبا حتى للحشود من خبراء المجال. من ناحية أخرى، يمكن الوصول بسهولة إلى أونتالولوجيات خاصة بالمجال وقواعد المعرفة (KBS) بسهولة، أو شيدت، أو متكامل، مما يجعل الإشراف البعيد واقعية للكيمياء النيذبة الناشئة. في الإشراف البعيد، يتم إنشاء تسميات التدريب عن طريق مطابقة تذكر في وثيقة مع المفاهيم في قواعد المعرفة (KBS). ومع ذلك، فإن هذا النوع من مطابقة KB يعاني من تحديين رئيسيين: التعليق التوضيحي غير الكامل والشروح الصاخبة. نقترح كيمنر، وهي طريقة توجيهية، تحت مضاد المسترد بها، تحت إشراف صاخبة للكيمياء النيذاري المحبوسين عن هذه التحديات. إنه يرفع هيكل OnTology لنوع الكيمياء لتوليد ملصقات بعيدة مع أساليب رواية من الغموض متعددة الأطراف متعددة الأطباق متعددة الأطباق. إنه يحسن بشكل كبير من توليد التسمية البعيدة للتدريب على تسلسل التسلسل اللاحق. نحن نقدم أيضا مجموعة بيانات من الخبراء، وكيمياء NER مع 62 نوعا من كيمياء كيمياء دقيقة (على سبيل المثال، المركبات الكيميائية والتفاعلات الكيميائية). تظهر النتائج التجريبية أن CHEMMNER فعالة للغاية، مما يتفوق بشكل كبير على أساليب NER-Artication NER (مع تحسن درجة F1 المطلقة).
أجريت الدراسة في مشفى الأسد الجامعي باللاذقية , في قسم التوليد و أمراض النساء في الفترة الممتدة بين 1/1/2013 و حتى 1/1/2014 و كان عدد مريضات الدراسة 190 حالة بينها 140 حالة تم اجراء تسليخ الأغشية لها و 50 حالة دون تسليخ الأغشية. • و قد أجري تسليخ لل أغشية عند مريضات الدراسة , و ذلك بعد تقييم درجة نضج عنق الرحم اعتماداً على مشعر بيشوب و كانت نسبة الاستجابة 79.28% في حالات تسليخ الأغشية و هي النسبة الأعلى , ثم 54% في الحالات دون تسليخ الأغشية. و كان إجراء التسليخ لمرتين متتاليتين كافياً عند أغلب المريضات, و كان عنق الرحم متوسط النضج (أي درجة 4-5 حسب مشعر بيشوب ) هو الأكثر استجابة لإجراء التسليخ. • و كانت نسبة الولادة الطبيعية في دراستنا 87.85% في حالات تسليخ الأغشية و 76% دون تسليخ الأغشية. • و قد كانت الاختلاطات محدودة جداً في مجموعة الدراسة و شملت : 1-الإنتان 0.58%. 2-النزف 0.58%. 3-انبثاق الأغشية 1.16%. أي أن تسليخ الأغشية كان إجراءاً آمناً إلى حد ما.
تتطلب شبكات العصبية العميقة الحديثة من بين الفن بيانات تدريبية ذات صلة واسعة النطاق غالبا ما تكون مكلفة للحصول على أو غير متوفرة للعديد من المهام. لقد ثبت أن الإشراف ضعيف في شكل قواعد خاصة بالمجال مفيدا في مثل هذه الإعدادات لإنشاء بيانات التدريب المس مى ضعيف. ومع ذلك، فإن التعلم مع القواعد الضعيفة يتحدى بسبب طبيعته المهمة والصاخبة المتأصلة. تحدي إضافي هو تغطية القاعدة والتداخل، حيث يعتبر العمل المسبق على الإشراف الضعيف فقط الحالات التي تغطيها قواعد ضعيفة، وبالتالي تاركة بيانات قيمة غير مسفدة وراءها. في هذا العمل، نطور إطارا ضعيفا للإشراف (Astra) الذي يرفع جميع البيانات المتاحة لمهمة معينة. تحقيقا لهذه الغاية، نستفيد البيانات الخاصة بمهارات العمل من خلال التدريب الذاتي مع نموذج (الطالب) الذي يعتبر تمثيلات السياق ويتوقع التسميات الزائفة على الحالات التي قد لا تغطيها قواعد ضعيفة. ونحن نضع كذلك شبكة انتباه القاعدة (المعلم) التي تتعلم كيفية إجمالي الملصقات الزائفة الطلابية مع ملصقات القاعدة الضعيفة، مشروطة بإخلاصها والسياق الأساسي للمثيل. أخيرا، نقوم بإنشاء هدف تعليمي شبه إشراف للتدريب المنتهي بالبيانات غير المستمرة والقواعد الخاصة بالمجال، وكمية صغيرة من البيانات المسمى. توضح تجارب واسعة على ستة مجموعات بيانات قياسية لتصنيف النص فعالية نهجنا مع تحسينات كبيرة على خطوط الأساس الحديثة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا