ترغب بنشر مسار تعليمي؟ اضغط هنا

مقارنة أساليب استخراج Span للحصول على وضع العلامات الدلالية

Comparing Span Extraction Methods for Semantic Role Labeling

325   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذا العمل، قارننا تجريبيا أساليب استخراج الفصول لمهمة الدور الدلالي (SRL).في حين أن التقدم الأخير الذي يشتمل على تمثيلات محكومة مدربة مسبقا في الترميز العصبية قد حسن بشكل كبير أداء SRL F1 بشأن المعايير الشعبية، فإن التكاليف المهمة وفوائد فك التشفير المنظم في هذه النماذج أصبحت أقل وضوحا.مع تجارب واسعة النطاق على مجموعات بيانات Propbank SRL، نجد أن طرق فك التشفير أكثر تنظيما تفوق العلامات الحيوية عند استخدام Asceddings ثابت (نوع الكلمات) عبر جميع الإعدادات التجريبية.ومع ذلك، عند استخدامها جنبا إلى جنب مع تمثيلات الكلمات السياقية المدربة مسبقا، يتم تقلص الفوائد.نقوم أيضا بتجربة الإعدادات عبر النوع والإعدادات عبر اللغات والعثور على اتجاهات مماثلة.ونحن نؤدي كذلك إلى مقارنات السرعة وتوفير التحليل حول مفاضات الكفاءة الدقة بين أساليب فك التشفير المختلفة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في حين أن Framenet تعتبر على نطاق واسع كمورد غني من الدلالات في معالجة اللغات الطبيعية، فإن النقد الرئيسي يتعلق بعدم وجود تغطية وندرة نسبية لبياناتها المسمدة مقارنة بالموارد المعمارية الأخرى المستخدمة مثل Propbank و Verbnet. تقارير الورقة هذه عن دراس ة تجريبية لمعالجة هذه الفجوات. نقترح نهج تكبير البيانات، والذي يستخدم التعليق التوضيحي الخاص بالإطار الحالي لإشراف الوحدات المعجمية الأخرى تلقائيا من نفس الإطار الذي يتم الكشف عنه. يحدد نهجنا القائم على القواعد فكرة الوحدة المعجمية الشقيقة ** وإنشاء بيانات معدنية خاصة بالإطار للتدريب. نقدم تجارب على وضع علامات الدور الدلالية الإطارية التي توضح أهمية تكبير البيانات هذا: نحصل على تحسن كبير في النتائج السابقة لتعريف الإطار وتحديد الوسيطة من أجل Framenet، والاستفادة من كل من النص التوضيحية والتعمادي بموجب Framenet. تسليط نتائج نتائجنا على زيادة البيانات بقيمة إنشاء الموارد التلقائي للنماذج المحسنة في تحليل الإطار الدلالي.
على الرغم من أن التطورات الأخيرة في الهندسة العصبية والتمثيلات المدربة مسبقا قد زادت بشكل كبير من الأداء النموذجي للحدث على وضع العلامات الدلالية الخاضعة للإشراف بالكامل (SRL)، فإن المهمة تظل تحديا لغات حيث تكون بيانات تدريب SRL الإشرافية غير وفيرة.ي مكن للتعلم عبر اللغات تحسين الأداء في هذا الإعداد عن طريق نقل المعرفة من لغات الموارد عالية الموارد إلى الموارد المنخفضة.علاوة على ذلك، فإننا نفترض أن شرطية التبعيات النحوية يمكن أن يتم الاستفادة منها لتسهيل نقل عبر اللغات.في هذا العمل، نقوم بإجراء عملية استكشاف تجريبي لمساعدة الإشراف النحوي عن Crosslingual SRL ضمن مخطط تعليمي بسيط متعدد الأيتاح.مع التقييمات الشاملة عبر عشرة لغات (بالإضافة إلى اللغة الإنجليزية) وثلاثة بيانات معيار SRL، بما في ذلك SRL على حد سواء SRL المستندة إلى التبعية والمقرها، فإننا نعرض فعالية الإشراف النحامي في سيناريوهات منخفضة الموارد.
تم عرض التعلم النشط للحد من متطلبات التوضيحية للعديد من مهام معالجة اللغة الطبيعية، بما في ذلك وضع العلامات الدلالية (SRL).تنطوي SRL على وسيطة وسيطة تمتد من أجل المحتمل أن يحتمل أن يتسرب المتعددة في جملة، مما يجعل من الصعب تجميع القرارات العديدة في د رجة واحدة لتحديد حالات جديدة للتعليق.في هذه الورقة، نطبق طريقتين للحصول على درجات تجميع عبر المسندات المتعددة من أجل اختيار جمل الاستعلام مع طريقتين تقدير اليقين النموذجي: استخدام مخرجات الشبكة العصبية واستخدام التعلم النشط في Bayesian في التسرب عن طريق الخلاف.قارنا هذه الأساليب بثلاثة أسماطية سلبية --- اختيار الجملة العشوائية، تحديد المستندات العشوائية بالكامل، واختيار الجمل مع معظم المتوقع --- وتحليل تأثير هذه الاستراتيجيات لديها على منحنى التعلم فيما يتعلق بتخفيض عدد المشروحالجمل والمسند لتحقيق الأداء العالي.
دفعت نماذج لغة واسعة النطاق مثل إلمو وفيرت أفق ما هو ممكن في وضع العلامات الدلالية (SRL)، وحل مشكلة خارج المفردات وتمكين النظم المناسبة، لكنها قدمت أيضا تحيزات كبيرة وبعد نقيم ثلاثة محللين SRL حول جمل متعدية بسيطة للغاية مع الأفعال عادة ما يرتبط عادة الموضوعات والكائنات، مثل، ماري بابيسات توم '': محلل حديثة على أساس بيرت، محيط كبير سنا بناء على القفازات، و محلل أكبر سنا من قبل أيام embeddings. عندما تستخدم الوسائط أشكالا في الغالب تستخدم كأسماء شخص، محاذاة توقعات الحس السليم في الرسوم المتحركة، فإن المحلل المحلل القائم على Bert غير متفائل. ومع ذلك، مع التجريدية أو الأسماء العشوائية، تظهر الصورة المعاكسة. نشير إلى هذا كحساس شعور مشترك، وتقديم مجموعة بيانات تحدي لتقييم مدى حساسية المحللين لهذا التحيز. قواعد البيانات الخاصة بنا والتحدي متوفرة هنا: github.com/coastalcph/comte
وقد حافظت العلامات الدلالية المتعددة اللغات واللغات الدلالية (SRL) مؤخرا عن الاهتمام المتزايد لأن تقنيات تمثيل النص متعدد اللغات أصبحت أكثر فعالية ومتاحة على نطاق واسع. في حين أن العمل الحديث قد حقق النجاح المتزايد، فإن النتائج على معايير الذهب متعدد ة اللغات لا تزال غير قابلة للمقارنة بسهولة عبر اللغات، مما يجعل من الصعب فهم حيث نقف. على سبيل المثال، في Conll-2009، تتأثر المقارنات القياسية لمعيار SRL متعدد اللغات، وهي مقارنات لغة إلى لغوية بحقيقة أن كل لغة لها مجموعة بيانات خاصة بها والتي تختلف عن الآخرين في الحجم والمجالات ومجموعات من التسميات والإرشادات التوضيحية. في هذه الورقة، نتعلم هذه المشكلة واقترح United-SRL، معيار جديد لعطلة SRL متعددة اللغات والتبادلة والاعتماد على التبعية. يوفر United-SRL شرحا متوازيا من الخبراء باستخدام مخزون هيكل الوسائد المشترك، مما يسمح بالمقارنات المباشرة عبر اللغات والدراسات المشجعة على النقل عبر اللغات في SRL. نقوم بإصدار United-SRL V1.0 في https://github.com/sapienzanlp/united-srl.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا