ترغب بنشر مسار تعليمي؟ اضغط هنا

تمثيلات المسند و Polysemy في تحليل Verbnet الدلالي

Predicate Representations and Polysemy in VerbNet Semantic Parsing

203   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

على الرغم من التطورات الحديثة في الدور الدوالي الذي يدفعه ترميز النص المدرب مسبقا مثل بيرت، فإن الأداء يتخلف عند تطبيقه على المسندات لاحظ بشكل غير منتظم أثناء التدريب أو إلى الجمل في مجالات جديدة. في هذا العمل، يمكننا التحقيق في كيفية تحسين أداء وضع العلامات على الدوران المنخفض التردد والبيانات خارج نطاق البيانات باستخدام Verbnet، معجم فعل يضم الأفعال إلى فئات هرمية تستند إلى سلوك النحوية والدلية المشتركة وتحدد التمثيل الدلالي وصف العلاقات بين الحجج. نجد أن فئات Verbnet توفر مستوى فعال من التجريد، وتحسين التعميم على المساكن المنخفض التردد من خلال السماح لهم بالتعلم من الأمثلة التدريبية للندوات الأخرى المنتمدة إلى نفس الفصل. نجد أيضا أن التدريب المشترك لعلامات الدور الحرفية والأزهار المسند للفئات الحرفية للأفعال البسيطة يؤدي إلى تحسينات في كلا المهام، مما يدعم بشكل طبيعي استخراج التمثيلات الدلالية في فيربيت.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعد دول كيان تتبع مهمة معالجة لغات طبيعية تفترض أن تتطلب شرحا بشريا. من أجل تقليل الوقت والنفقات المرتبطة بالتعليق التوضيحي، نقدم طريقة جديدة لاستخراج حالات الكيان تلقائيا، بما في ذلك الموقع والوجود حالة الكيانات، بعد Dalvi et al. (2018) وتاندون وآخر ون. (2020). لهذا الغرض، نعتمد في المقام الأول على التمثيل الدلالي الناتج عن حالة محلل الحرف الحرفي الفن (Gung، 2020)، واستخراج الكيانات (مشاركين الأحداث) ودولهم، بناء على المسندات الدلالية للتمثيل الدليلي الذي تم إنشاؤه، وهو في تنسيق المنطق المقترح. للتقييم، استخدمنا Propara (Dalvi et al.، 2018)، وهي مجموعة بيانات لفهم القراءة التي يتم تفاحها مع الدول الكيانية في كل جملة، وتتبع تلك الدول في فقرات النصوص الإجرائية ذات التأليف البشري الطبيعي. بالنظر إلى القيود المقدمة من الطريقة، فإن خصائص شروح DataSet Propara، وأن نظامنا، Lexis، لا تستخدم بيانات التدريب الخاصة بمهام المهام وتعتمد فقط على Verbnet، والنتائج واعدة، وعرض قيمة الموارد المعجمية.
المحللون الدلالي الإطار يتوقعون تقليديا التنبؤات والأطر والأدوار الدلالية في ترتيب ثابت.تستكشف هذه الورقة مشكلة الدجاج أو البيض للمشكلة بين هذه المكونات نظريا ومن الناحية النظرية.نقدم بنية تسلسل تسلسل تستند إلى بيرت مرنة تسمح بتنبؤ الإطارات والأدوار بشكل مستقل عن بعضها البعض أو الجمع بينها بعدة طرق.تبين نتائجنا أن الإعدادات لدينا يمكن أن تقريب أداء النماذج التقليدية أكثر تعقيدا، مع السماح بمنظر أكثر وضوحا للترابط بين مكونات خط الأنابيب، وكيف تجعل نماذج التنبؤ بالأطر والأدب استخدام طبقات بيرت مختلفة.
إن الانتعاش الدقيق لهيكل الوسائد الواسع من تحليل الاعتماد العالمي (UD) هو أساسي لمهام المصب مثل استخراج الأدوار الدلالية أو تمثيلات الأحداث. تقدم هذه الدراسة على المستحسن، تصنيف التسلسل الهرمي لعلاقات التبعية المستدلة الموجودة داخل تحليل UD. بمثابة د قة تصنيف Compchain بمثابة وكيل لقياس الانتعاش الدقيق لهيكل الوسائد المسند من الجمل مع التضمين. لقد قمنا بتحليل توزيع الملاحظة في Three Treebanks English English، EWT، اللثة والخطوط، وكشف أن هذه Treebanks متناثرة فيما يتعلق بالجمل مع هيكل الوسائد المسند يتضمن تضمين حجة مسند. قمنا بتقييم نماذج خط الأساس SPIPE (V1.2) Conll 2018 (V1.2) الأساس (COMPCHAIN) كمعقل كمبيوتر يعمل بنظام EWT و Gums and Lines UD Treebanks. تشير نتائجنا إلى أن هذه النماذج الأساسية الثلاثة تظهر الأداء الأكثر فقرا في الجمل مع هيكل الوسائد الواسع مع أكثر من مستوى من التضمين؛ استخدمنا Comprains لتوصيف الأخطاء التي تم إجراؤها بواسطة هذه المحللين وتقديم الأمثلة الحالية للضرائب الخاطئة التي تنتجها المحلل المحلل المحدد باستخدام المركبات. لقد قمنا أيضا بتحليل توزيع Comprains في 58 UDBanks UD UDBanks غير الإنجليزية ثم استخدمت Comprains لتقييم نموذج خط الأساس المشترك CONLL'18 لكل من هذه Treebanks. يوضح تحليلنا أن الأداء فيما يتعلق بتصنيف كمبيوتر يحترم ضعيفا ضعيفا فقط مع مقاييس التقييم الرسمية (LAS، MLAS و Blex). نحدد الثغرات في توزيع العقائد في العديد من UD Treebanks، وبالتالي توفير خارطة طريق لكيفية استكمال هذه Treebanks. نستنتج من خلال مناقشة كيفية توفر Comprains منظورا جديدا حول Sparsity بيانات التدريب لمحلل UD، وكذلك دقة تبييض UD الناتج.
أحد الجوانب المركزية لنماذج اللغة السياقية هو أنه ينبغي أن يكون قادرا على التمييز بين معنى الكلمات الغامضة من قبل سياقاتهم. في هذه الورقة، نقوم بالتحقيق في مدى تشكيلات الكلمات السياقية التي تشكل تعدد التعدد المعني بالضمان التقليدي من Polysemy ومجهلي. تحقيقا لهذه الغاية، نقدم مجموعة بيانات ممتدة ومشروحة للإنسان من التشابه بين الكلمة المعززة ومقبولية التعاونية، وتقييم مدى جودة تشابه المضبوط يتوقع التشابه في المعنى. تشير كلا النوعين من الأحكام البشرية إلى أن تشابه تفسيرات البلاثي يسقط في متواصل بين هوية المعنى والمجانسة. ومع ذلك، نلاحظ أيضا اختلافات كبيرة في تصنيفات التشابه من PolySemes، وتشكيل أنماط ثابتة لأنواع مختلفة من بديل الشعور بالسلاسة. وهكذا يبدو أن مجموعة البيانات الخاصة بنا هي التقاط جزء كبير من تعقيد الغموض المعجمي، ويمكن أن توفر سرير اختبار واقعي للمشروعات السياقية. من بين النماذج التي تم اختبارها، تظهر بيرت كبيرة أقوى ارتباطا مع تصنيفات تشابه تشابه الكلمة المجمعة، ولكن النضالات لتكرار أنماط التشابه الملاحظة باستمرار. عند تجميع نماذج كلمات غامضة تستند إلى ادباتهم، يعرض النموذج ثقة عالية في تماثيل متفائل وبعض أنواع بدائل البلاستيك، ولكن يفشل باستمرار للآخرين.
تقرر ما إذا كانت كلمة غامضة من الناحية الدلوية مجهبة أو polysemous تعادل إنشاء ما إذا كان لديه أي زوج من الحواس غير المرتبط بهليا.نقدم طرق جديدة لهذه المهمة التي تستفيد من المعلومات من الموارد المعجمية متعددة اللغات.نحن نثبت رسميا الخصائص النظرية الت ي توفر الأساس لأساليبنا.على وجه الخصوص، نوضح كيف يتبعه المراسل المركزي لكل فرضية للترجمة في Hauer و Kondrak (2020A) من خصائص Synet التي صاغها Hauer و Kondrak (2020B).يوضح التقييم التجريبي أن نهجنا يحدد حالة من الفن الجديد للكشف الجنسي.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا