ترغب بنشر مسار تعليمي؟ اضغط هنا

التحليل القائم على السوبر مع أنظمة إعادة كتابة سياق خالية من السياق

Supertagging-based Parsing with Linear Context-free Rewriting Systems

431   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم أول محلل محلل دائري على أساس أنظمة إعادة الكتابة الخالية من السياق (LCFRS).وهو يستخدم المصنفات العصبية والتفوق على المحللين السابقين في LCFRS في كل من الدقة وسرعة التحليل من هامش واسع.نتائجنا مواكبة أفضل المحللين المتساقين (العام)، وخاصة درجات الناخبين المتساقين إنشاء حالة جديدة من الفن.إن قلب نهجنا هو إجراء فعال لليككاليزي يدفع LCFRS معجمية من أي شجرة Treebank غير المتساقين.وصفنا بتعديل تحليل LCFRS المعتاد على الرسم البياني الذي يمثل التضخم بسرعة وإدخال إجراء يحول مشتقات LCFRS المعجمية إلى أشجار تحليل مكافئة من TreeBank الأصلي.يتم تقييم نهجنا على الانجليزية المتساقين بين بنك بنك بنسل وشركة النيجرية الألمانية والنمر.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إعادة صياغة إعادة صياغة مهمة مهمة في معالجة اللغة الطبيعية. تركز الأشغال السابقة على توليد إعادة صياغة مستوى الجملة، مع تجاهل توليد إعادة صياغة مستوى المستند، وهي مهمة أكثر تحديا وقيمة. في هذه الورقة، نستكشف مهمة إعادة صياغة نص عن طريق الوثيقة لأول م رة والتركيز على التنوع بين الجملة من خلال النظر في إعادة كتابة الجملة وإعادة ترتيبها. نقترح Corpg (توليد إعادة صياغة البحث عن النصوص الموجهة)، والتي تتمتع بالطرازات الرسم البياني Gru لتشفير الرسم البياني لعلاقة الاتساق والحصول على تمثيل مدرك التماسك لكل جملة، والتي يمكن استخدامها لإعادة ترتيب جمل الإدخال المتعددة (المحورة). نحن نقوم بإنشاء مجموعة بيانات صياغة على مستوى الوثيقة Pseudo لتدريب Corpg. تظهر نتائج التقييم التلقائي أن Corpg تفوقت على العديد من النماذج الأساسية القوية على درجات Bertscore وتنوعها. يوضح التقييم البشري أيضا أن نموذجنا يمكن أن يولد إعادة صياغة المستندات بمزيد من التنوع والحفاظ الدلالي.
منذ إنشائها، أدت نماذج اللغة القائمة على المحولات إلى مكاسب أداء مثيرة للإعجاب عبر مهام معالجة لغات طبيعية متعددة. بالنسبة للعربية، يتم تحقيق النتائج الحالية من أحدث البيانات في معظم مجموعات البيانات بواسطة نموذج اللغة العربية. على الرغم من هذه التطو رات الحديثة، يستمر الكشف عن السخرية والشاحنات بمهام تحديا باللغة العربية، بالنظر إلى التشكل الغني باللغة والتفاوت اللغوي والاختلافات الجدلية. تقدم فريق Project Team Profers لفريق SPPU-AASM للمهمة المشتركة Wanlp Arsarcasm المشتركة 2021، والمراكز حول الكشف عن السخرية ومشاعر القطبية للعقائز العربية. تقترح الدراسة نموذجا مختلطا، يجمع بين تمثيلات الجملة من أرابيرت مع ناقلات كلمة ثابتة تدربت على شركة الوسائط الاجتماعية العربية. يحقق النظام المقترح درجة F1-Saarchastic من 0.62 ودرجة F-PN من 0.715 بمهام الكشف عن السخرية والشاحنات، على التوالي. تشير نتائج المحاكاة إلى أن النظام المقترح تتفوق على العديد من النهج الحالية لكل من المهام، مما يشير إلى أن دمج تمثيلات نصية خالية من السياق والسياق يمكن أن تساعد في التقاط جوانب تكميلية من معنى الكلمات باللغة العربية. احتل النظام المرتبة الثانية والعاشرة في المهام الفرعية ذات الصلة بتكشف السخرية وتحديد المعنويات.
تجارب تفاصيل الورقة هذه التي أجريناها في التبعيات العالمية 2.7 كورسا من أجل التحقيق في أمر الكلمات المهيمنة في اللغات المتاحة.لهذا الغرض، استخدمنا أداة إعادة كتابة الرسم البياني، نمت، والتي سمحت لنا بتجاوز التعليقات التوضيحية السطح وتحديد الموضوعات ا لضمنية.قمنا أولا بقياس توزيع أوامر الكلمة الستة المختلفة (SVO، SOV، VSO، VOS، OVS، OSV) في كورسا والتحقيق فيها عندما كان هناك فرق كبير في Corga بلغة معينة.بعد ذلك، قارننا النتائج التي تم الحصول عليها مع المعلومات المقدمة في قاعدة بيانات Wals (مجفف ومشبيلماث، 2013) وفي (̈Ostling، 2015).أخيرا، درسنا تأثير استخدام أداة إعادة كتابة الرسم البياني لهذه المهمة.تتوفر الأدوات والموارد المستخدمة لهذا البحث بحرية.
تبين أن قواعد النحوية الخالية من السياق (PCFGS) مع المعلمة العصبية فعالة في تحريض قواعد العبارات غير المعروضة.ومع ذلك، نظرا للتعقيد المركزي المكعبي لتمثيل PCFG وتحليله، فإن النهج السابقة لا يمكن أن توسيع نطاق عدد كبير نسبيا من الرموز (غير اللامعة وال أعمدة).في هذا العمل، نقدم شكل معلمات جديد من PCFGS استنادا إلى تحلل تربوت، والذي يحتوي على تعقيد حسابي ثلاثي في رقم الرمز، وبالتالي يسمح لنا باستخدام عدد أكبر بكثير من الرموز.نحن نستخدم أيضا المعلمة العصبية للنموذج الجديد لتحسين أداء تحليل غير مخالف.نقيم نموذجنا عبر عشرة لغات وإظهار تجريبيا فعالية استخدام المزيد من الرموز.
تصف هذه الورقة نظام مقترح لمهمة IWPT 2021 المشتركة بشأن التحليل في التبعيات العالمية المعززة (EUD).نقترح نظام مقرها إعادة كتابة الرسم البياني لحساب التبعيات العالمية المحسنة، بالنظر إلى التبعيات العالمية الأساسية (UD).

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا