ترغب بنشر مسار تعليمي؟ اضغط هنا

مقارنة بمعالجة خطط التبعية: `الدلالي" (UD) و "النحوية" (SUD)

Comparing learnability of two dependency schemes: `semantic' (UD) and `syntactic' (SUD)

563   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تساهم هذه الورقة في مؤشر ترابط البحث عن مجال معالجة مخططات التوضيحية المختلفة التبعية: واحدة (دلالية ") تفضل كلمات المحتوى كجوهرات علاقات التبعية والآخر (Syntactic ') تفضل رؤوس النحوية. أصدرت العديد من الدراسات الدعم لفكرة أن اختيار المعايير النحوية لتعيين رؤوس في أشجار التبعية يحسن أداء محلل التبعية. قد يتم شرح ذلك من خلال افتراض أن الأساليب الأساسية هي عموما أكثر واقعية. في هذه الدراسة، نختبر هذه الفرضية من خلال مقارنة أداء خمسة أنظمة تحليل (كل من الانتقال والرسوم البيانية القائمة على الرسم البياني) على مجموعة مختارة من 21 Treebanks، وكلها في متغير دلالات، تمثلها UD القياسية (التبعيات العالمية)، و البديل "البقع الأساسية"، يمثلها SUD (التبعيات العالمية النحوية العالمية): على عكس التجارب التي تم الإبلاغ عنها سابقا، والتي تعتبر قابلة للتعلم التوضيحية "التوضيحية للدلية" والمنظمات الأساسية للإنشاءات الخاصة في المختبر، تعتبر مخططات التعليق التوضيحي بالكامل في الجسم الحي. بالإضافة إلى ذلك، قارنا هذه المخططات التوضيحية باستخدام مجموعة من الخصائص الأساسية الكمي، والتي قد تعكس أيضا قدرتها على تعلمها. تظهر نتائج التجارب أن SUD يميل إلى أن يكون أكثر حيلة من UD، ولكن ميزة واحدة أو المخطط الآخر يعتمد على المحلل المحلل والجور في السؤال.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في حين أن العديد من المحاولات قد بذلت لتحليل بناء الجملة والدلالات، فإن الأداء العالي في مجال واحد يأتي عادة بسعر الأداء في الآخر.يتناقض هذا المقارضة مع مجموعة الأبحاث الكبيرة التي تركز على التفاعلات الغنية في واجهة Syntax - Semantics.نستكشف هياكنات نموذجية متعددة تسمح لنا باستغلال التعليقات التوضيحية الغنية والمسلية الواردة في مجموعة بيانات دلالات التحلل العالمية (UDS)، مما أدى إلى تحليل التبعيات الشاملة والأمم المتحدة للحصول على نتائج حديثة في كل من الشكليات.نقوم بتحليل سلوك نموذج مشترك من بناء الجملة والدلالات، والعثور على أنماط تدعمها النظرية اللغوية في بناء جملة - واجهة دلالات.ثم نحقق في ما يعيد تصميم النمذجة المشتركة إلى حد كبير إلى إعداد متعدد اللغات، حيث نجد اتجاهات مماثلة عبر 8 لغات.
تتداول هذه الورقة عن عملية بناء أول أداة تحويل الدائرة إلى التبعية التركية. نقطة الانطلاق لهذا العمل هي دراسة سابقة التي تحولت فيها 10 آلاف من أشجار هيكل العبارة يدويا إلى تركية من Corpus الأصلي Penntreebank. ضمن نطاق هذا المشروع، تم تحويل هذه العبار ات التركية هذه الأشجار تلقائيا إلى هياكل التبعية على غرار UD، باستخدام خوارزمية تستند إلى القواعد وخوارزمية لتعلم الآلة محددة لمتطلبات اللغة التركية. تمت مقارنة نتائج الخوارزمية وكلاهما أن نهج التعلم الآلي أثبت أنه أكثر دقة من الخوارزمية القائمة على القواعد. تم تنقيح الناتج من قبل فريق من اللغويين. اتخذت الإصدارات المكررة عباحيات قياسية ذهبية لتقييم الخوارزميات. بالإضافة إلى مساهمتها في مشروع UD مع مجموعة بيانات كبيرة من 10،000 شجرة التبعية التركية، فإن هذا المشروع يفي أيضا فجوة مهمة للأداة التحويل التركية، مما يتيح التعدد السريع من شركة التبعية التي يمكن استخدامها لتدريب محلل التبعية الأفضل وبعد
وجدت أنظمة توليد النص المختلط من التعليمات البرمجية قد وجدت تطبيقات في العديد من المهام المصب، بما في ذلك التعرف على الكلام والترجمة والحوار.تعتمد نموذج أنظمة الجيل هذه على نظريات النحوية المحددة جيدا من خلط التعليمات البرمجية، وهناك نقص في مقارنة هذ ه النظريات.نقدم تقييم بشري واسع النطاق لنظريات نحوية شعبية وشعبية لغة ماتريكس (ML) وقيد التكافؤ (EC).قارناها ضد ثلاث نماذج قائمة على أساسها وتظهر كمية فعالية فعالية نظريتين نحوي.
أثناء النظر في الأوقات الطبيعية في وثائق الأمن الغذائي، وجدنا أن التعليق التوضيحي التركيبي للتوسع في الوقت نفسه يتطلب العديد من التعليقات التوضيحية شبه المكررة للحصول على الدلالات الصحيحة للتعبيرات مثل 7 نوفمبر إلى 11 2021. للحد من هذه المشكلة، نحناس تكشاف استبدال الممتلكات الفاصل الفرعية للخضار بممتلكات فاصلة فاصلة فاخرة، وهذا هو، مما يجعل أصغر الوحدات (على سبيل المثال، 7 و 11 عاما بدلا من أكبر الوحدات (على سبيل المثال، 2021) رؤساء سلاسل التقاطع.لضمان ظل دلالات الفواصل الزمنية المشروحة دون تغيير على الرغم من تغييراتنا في بناء جملة مخطط التوضيحية، طبقنا العديد من التقنيات المختلفة للتحقق من صحة تغييراتنا.تم اكتشاف تقنيات التحقق من الصحة هذه وسمحتنا بحل العديد من الأخطاء المهمة في الترجمة الآلية لدينا من الفاصل الفرعي إلى بناء جملة فائق الفاصل الزمني.
تمثيل المعنى التجريدي (AMR) هو تمثيل معنى على مستوى الجملة بناء على هيكل الوسائد المسند.أحد التحديات التي نجدها في تحليل عمرو هي التقاط هيكل الجمل المعقدة التي تعبر عن العلاقة بين المسندات.إن معرفة الجزء الأساسي من هيكل الجملة مقدما قد يكون مفيدا في مثل هذه المهمة.في هذه الورقة، نقدم قائمة أنماط التبعية للإنشاءات الإنكليزية المجامعة المصممة لتحليل عمرو.مع مرحلة مانعة نمط مخصصة، يتم استرداد جميع حدوث إنشاءات الجملة المعقدة من جملة مدخلات.في حين أن بعض المسحاتين لديهم غموض دليون، فإننا نتعامل مع هذه المشكلة من خلال نماذج تصنيف التدريب على البيانات المستمدة من AMR و Wikipedia Corpus، وإنشاء خط أساس جديد للأعمال المستقبلية.سيتم الإعلان عن أنماط الجملة المجامعة المتقدمة وأوصاف عمرو المقابلة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا