ترغب بنشر مسار تعليمي؟ اضغط هنا

تحليل تحسين باريتو متواضع لمحلل التبعية في عام 2021

A Modest Pareto Optimisation Analysis of Dependency Parsers in 2021

187   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقيم ثلاثة أنظمة محلل التبعية الرائدة من النماذج المختلفة في مجموعة فرعية صغيرة متناثرة من اللغات من حيث أمامي باريتو الكفاءة من دقتها.نظرا لأننا مهتمون بالكفاءة، فإننا نقيم المحللين الأساسيين دون نماذج لغة محددة (لأن هذه شبكات ضخمة وعادة ما تشكل معظم الوقت لحساب الوقت) أو غيرها من التعزيزات التي يمكن تطبيقها على أي منهم.تظهر تحليل BiAffine كاختيار افتراضي متوازن، مع تحليل وضع العلامات على التسلسل هو الأفضل إذا كانت سرعة الاستدلال (ولكن لا تكلفة الطاقة التدريبية) هي الأولوية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تهدف MeasessVal إلى تحديد الكميات إلى جانب الكيانات التي تقاس خصائص إضافية داخل الوثائق العلمية الإنجليزية.مجموعة متنوعة من الأساليب المستخدمة تجعل القياسات، الجانب الأكثر أهمية في الكتابة العلمية، صعبة الاستخراج.تقدم هذه الورقة دراسات الاجتثاثات في اتخاذ القضية لعدة خطوات مسبقة مسبق مثل قواعد التزخم المتخصصة.بالنسبة للهيكل اللغوي، نشيف أشجار التبعية في شبكة استئصال الرسم البياني العميق (DGCNN) لتصنيف المهام المتعدد.
نحن تصف تقديم DCU-EPFL إلى مهمة مشتركة IWPT 2021: من النص الخام لتعزيز التبعيات العالمية. تتضمن المهمة تحليل الرسوم البيانية UD المحسنة، والتي تعد امتدادا لأشجار التبعية الأساسية المصممة لتكون أكثر تسهيلا نحو تمثيل الهيكل الدلالي. يتم التقييم على 29 شجرة Treebanks في 17 لغة ومطلوبة للمشاركين لتحليل البيانات من كل لغة تبدأ من السلاسل الخام. يستخدم نهجنا خط أنابيب Stanza لمعالجة الملفات النصية، XLM-Roberta للحصول على تمثيلات رمزية في السياق، ونموذج تسجيل الحافة والعلامات للتنبؤ الرسم البياني المحسن. أخيرا، ندير نص PostProcessing لضمان جميع مخرجاتنا هي الرسوم البيانية UD المحسنة سارية المفعول. يضع نظامنا السادس من أصل 9 مشاركا مع درجة مرفق محسنة خشنة (ELAS) 83.57. نقوم بإجراء تجارب إضافية بعد الموعد النهائي والتي تشمل استخدام Trankit لمعالجة ما قبل المعالجة، XLM-Roberta Large Protectenation، وتعلم المتعدد التعلم بين محلل التبعية الأساسية والمعززة. جميع هذه التعديلات تحسن النتيجة الأولية ونظامنا النهائي لديه إيلاس خشن 88.04.
إن الانتعاش الدقيق لهيكل الوسائد الواسع من تحليل الاعتماد العالمي (UD) هو أساسي لمهام المصب مثل استخراج الأدوار الدلالية أو تمثيلات الأحداث. تقدم هذه الدراسة على المستحسن، تصنيف التسلسل الهرمي لعلاقات التبعية المستدلة الموجودة داخل تحليل UD. بمثابة د قة تصنيف Compchain بمثابة وكيل لقياس الانتعاش الدقيق لهيكل الوسائد المسند من الجمل مع التضمين. لقد قمنا بتحليل توزيع الملاحظة في Three Treebanks English English، EWT، اللثة والخطوط، وكشف أن هذه Treebanks متناثرة فيما يتعلق بالجمل مع هيكل الوسائد المسند يتضمن تضمين حجة مسند. قمنا بتقييم نماذج خط الأساس SPIPE (V1.2) Conll 2018 (V1.2) الأساس (COMPCHAIN) كمعقل كمبيوتر يعمل بنظام EWT و Gums and Lines UD Treebanks. تشير نتائجنا إلى أن هذه النماذج الأساسية الثلاثة تظهر الأداء الأكثر فقرا في الجمل مع هيكل الوسائد الواسع مع أكثر من مستوى من التضمين؛ استخدمنا Comprains لتوصيف الأخطاء التي تم إجراؤها بواسطة هذه المحللين وتقديم الأمثلة الحالية للضرائب الخاطئة التي تنتجها المحلل المحلل المحدد باستخدام المركبات. لقد قمنا أيضا بتحليل توزيع Comprains في 58 UDBanks UD UDBanks غير الإنجليزية ثم استخدمت Comprains لتقييم نموذج خط الأساس المشترك CONLL'18 لكل من هذه Treebanks. يوضح تحليلنا أن الأداء فيما يتعلق بتصنيف كمبيوتر يحترم ضعيفا ضعيفا فقط مع مقاييس التقييم الرسمية (LAS، MLAS و Blex). نحدد الثغرات في توزيع العقائد في العديد من UD Treebanks، وبالتالي توفير خارطة طريق لكيفية استكمال هذه Treebanks. نستنتج من خلال مناقشة كيفية توفر Comprains منظورا جديدا حول Sparsity بيانات التدريب لمحلل UD، وكذلك دقة تبييض UD الناتج.
المعردات التفسيرية مجردة للتوقعات النموذجية هي حاسمة في التطبيقات العملية.نحن نطور النماذج العصبية التي تمتلك عملية استنتاجية مفسضة لتحليل التبعية.تتبنى نماذجنا الاستدلال المستند إلى المثيل، حيث يتم استخراج حواف التبعية ومسمى من خلال مقارنةها بالحواف في مجموعة تدريبية.يتم استخدام حواف التدريب صراحة للتنبؤات؛وبالتالي، من السهل فهم مساهمة كل حافة إلى التنبؤات.تظهر تجاربنا أن النماذج القائمة على مثيل لدينا تحقق دقة تنافسية مع النماذج العصبية القياسية ولديها المعقول المعقولة من التفسيرات القائمة على المثيل.
تصف هذه الورقة نظام Duluth الذي شارك في مهمة Semeval-2021 11، الرسم البياني للمساهمة NLP.وتفصل في استخراج جمل المساهمة والكيانات العلمية وعلاقاتها من المقالات العلمية في مجال معالجة اللغة الطبيعية.يستخدم حلنا Deberta لتصنيف الجملة المتعدد الفوضى لاست خراج الجمل المساهمة ونوعها، وتحليل التبعية لتحديد كل جملة واستخراج ثلاثة أضعاف ثلاثة أضعاف.احتل نظامنا في المرتبة الخامسة من السبعة للمرحلة الأولى: خط أنابيب نهاية إلى نهاية، السادس من ثمانية للمرحلة 2 الجزء الأول: العبارات والثمانية، والخامس الثمانية للمرحلة 2 الجزء 2: استخراج ثلاثي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا