ترغب بنشر مسار تعليمي؟ اضغط هنا

تحليل النحوية والدلية المشتركة

Joint Universal Syntactic and Semantic Parsing

223   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في حين أن العديد من المحاولات قد بذلت لتحليل بناء الجملة والدلالات، فإن الأداء العالي في مجال واحد يأتي عادة بسعر الأداء في الآخر.يتناقض هذا المقارضة مع مجموعة الأبحاث الكبيرة التي تركز على التفاعلات الغنية في واجهة Syntax - Semantics.نستكشف هياكنات نموذجية متعددة تسمح لنا باستغلال التعليقات التوضيحية الغنية والمسلية الواردة في مجموعة بيانات دلالات التحلل العالمية (UDS)، مما أدى إلى تحليل التبعيات الشاملة والأمم المتحدة للحصول على نتائج حديثة في كل من الشكليات.نقوم بتحليل سلوك نموذج مشترك من بناء الجملة والدلالات، والعثور على أنماط تدعمها النظرية اللغوية في بناء جملة - واجهة دلالات.ثم نحقق في ما يعيد تصميم النمذجة المشتركة إلى حد كبير إلى إعداد متعدد اللغات، حيث نجد اتجاهات مماثلة عبر 8 لغات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نحن تصف مهمة IWPT الثانية على تحليل نهاية إلى نهاية من النص الخام لتعزيز التبعيات العالمية.نحن نقدم تفاصيل حول مقاييس التقييم ومجموعات البيانات المستخدمة للتدريب والتقييم.قارنا النهج التي اتخذتها الفرق المشاركة ومناقشة نتائج المهمة المشتركة، والمقارنة أيضا مع الطبعة الأولى من هذه المهمة.
تساهم هذه الورقة في مؤشر ترابط البحث عن مجال معالجة مخططات التوضيحية المختلفة التبعية: واحدة (دلالية ") تفضل كلمات المحتوى كجوهرات علاقات التبعية والآخر (Syntactic ') تفضل رؤوس النحوية. أصدرت العديد من الدراسات الدعم لفكرة أن اختيار المعايير النحوية لتعيين رؤوس في أشجار التبعية يحسن أداء محلل التبعية. قد يتم شرح ذلك من خلال افتراض أن الأساليب الأساسية هي عموما أكثر واقعية. في هذه الدراسة، نختبر هذه الفرضية من خلال مقارنة أداء خمسة أنظمة تحليل (كل من الانتقال والرسوم البيانية القائمة على الرسم البياني) على مجموعة مختارة من 21 Treebanks، وكلها في متغير دلالات، تمثلها UD القياسية (التبعيات العالمية)، و البديل "البقع الأساسية"، يمثلها SUD (التبعيات العالمية النحوية العالمية): على عكس التجارب التي تم الإبلاغ عنها سابقا، والتي تعتبر قابلة للتعلم التوضيحية "التوضيحية للدلية" والمنظمات الأساسية للإنشاءات الخاصة في المختبر، تعتبر مخططات التعليق التوضيحي بالكامل في الجسم الحي. بالإضافة إلى ذلك، قارنا هذه المخططات التوضيحية باستخدام مجموعة من الخصائص الأساسية الكمي، والتي قد تعكس أيضا قدرتها على تعلمها. تظهر نتائج التجارب أن SUD يميل إلى أن يكون أكثر حيلة من UD، ولكن ميزة واحدة أو المخطط الآخر يعتمد على المحلل المحلل والجور في السؤال.
الملخص نقدم نموذجا يستند إلى الذاكرة للتحليل الدلالي المعتمد على السياق.تركز النهج السابقة على تمكين وحدة فك الترميز لنسخ أو تعديل التحليل من الكلام السابق، على افتراض وجود تبعية بين الحواجز الحالية والسابقة.في هذا العمل، نقترح تمثيل معلومات سياقية ب استخدام ذاكرة خارجية.نحن نتعلم وحدة تحكم ذاكرة السياق التي تدير الذاكرة عن طريق الحفاظ على المعنى التراكمي لإعلام المستخدمين المتسلسلين.نقيم نهجنا على ثلاثة معايير تحليل الدلالات.تظهر النتائج التجريبية أن طرازنا يمكن أن يقوم بتحسين معالجة المعلومات التي تعتمد على السياق وتظهر الأداء المحسن دون استخدام أجهزة فك تشفير المهام الخاصة.
أثناء النظر في الأوقات الطبيعية في وثائق الأمن الغذائي، وجدنا أن التعليق التوضيحي التركيبي للتوسع في الوقت نفسه يتطلب العديد من التعليقات التوضيحية شبه المكررة للحصول على الدلالات الصحيحة للتعبيرات مثل 7 نوفمبر إلى 11 2021. للحد من هذه المشكلة، نحناس تكشاف استبدال الممتلكات الفاصل الفرعية للخضار بممتلكات فاصلة فاصلة فاخرة، وهذا هو، مما يجعل أصغر الوحدات (على سبيل المثال، 7 و 11 عاما بدلا من أكبر الوحدات (على سبيل المثال، 2021) رؤساء سلاسل التقاطع.لضمان ظل دلالات الفواصل الزمنية المشروحة دون تغيير على الرغم من تغييراتنا في بناء جملة مخطط التوضيحية، طبقنا العديد من التقنيات المختلفة للتحقق من صحة تغييراتنا.تم اكتشاف تقنيات التحقق من الصحة هذه وسمحتنا بحل العديد من الأخطاء المهمة في الترجمة الآلية لدينا من الفاصل الفرعي إلى بناء جملة فائق الفاصل الزمني.
على الرغم من التطورات الحديثة في الدور الدوالي الذي يدفعه ترميز النص المدرب مسبقا مثل بيرت، فإن الأداء يتخلف عند تطبيقه على المسندات لاحظ بشكل غير منتظم أثناء التدريب أو إلى الجمل في مجالات جديدة. في هذا العمل، يمكننا التحقيق في كيفية تحسين أداء وضع العلامات على الدوران المنخفض التردد والبيانات خارج نطاق البيانات باستخدام Verbnet، معجم فعل يضم الأفعال إلى فئات هرمية تستند إلى سلوك النحوية والدلية المشتركة وتحدد التمثيل الدلالي وصف العلاقات بين الحجج. نجد أن فئات Verbnet توفر مستوى فعال من التجريد، وتحسين التعميم على المساكن المنخفض التردد من خلال السماح لهم بالتعلم من الأمثلة التدريبية للندوات الأخرى المنتمدة إلى نفس الفصل. نجد أيضا أن التدريب المشترك لعلامات الدور الحرفية والأزهار المسند للفئات الحرفية للأفعال البسيطة يؤدي إلى تحسينات في كلا المهام، مما يدعم بشكل طبيعي استخراج التمثيلات الدلالية في فيربيت.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا