ترغب بنشر مسار تعليمي؟ اضغط هنا

يمكن أن تفعل PCFGS بشكل أفضل: حث النحو من السياق الحاصل مع العديد من الرموز

PCFGs Can Do Better: Inducing Probabilistic Context-Free Grammars with Many Symbols

295   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تبين أن قواعد النحوية الخالية من السياق (PCFGS) مع المعلمة العصبية فعالة في تحريض قواعد العبارات غير المعروضة.ومع ذلك، نظرا للتعقيد المركزي المكعبي لتمثيل PCFG وتحليله، فإن النهج السابقة لا يمكن أن توسيع نطاق عدد كبير نسبيا من الرموز (غير اللامعة والأعمدة).في هذا العمل، نقدم شكل معلمات جديد من PCFGS استنادا إلى تحلل تربوت، والذي يحتوي على تعقيد حسابي ثلاثي في رقم الرمز، وبالتالي يسمح لنا باستخدام عدد أكبر بكثير من الرموز.نحن نستخدم أيضا المعلمة العصبية للنموذج الجديد لتحسين أداء تحليل غير مخالف.نقيم نموذجنا عبر عشرة لغات وإظهار تجريبيا فعالية استخدام المزيد من الرموز.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم إظهار نماذج الإجابة على الأسئلة (QA) للحصول على فهم القراءة لاستغلال تحيزات محددات غير مقصودة مثل السؤال - التداخل المعجمي السياق. هذا يعيق نماذج ضمان الجودة من المعمم إلى العينات الممثلة تمثيلا مثل الأسئلة ذات التداخل المعجمي المنخفض. يمكن أن يكو ن جيل السؤال (QG)، وهي طريقة لتعزيز مجموعات بيانات QA، حل تدهور الأداء إذا كان QG يمكن أن Debias QA بشكل صحيح. ومع ذلك، نكتشف أن نماذج QG العصبية الأخيرة متحيزة نحو توليد الأسئلة ذات التداخل المعجمي العالي، والتي يمكن أن تضخيم تحيز DataSet. علاوة على ذلك، يكشف تحليلنا أن تكبير البيانات مع نماذج QG هذه تضعف بشكل متكرر الأداء على الأسئلة مع التداخل المعجمي المنخفض، مع تحسين ذلك على الأسئلة ذات التداخل المعجمي العالي. لمعالجة هذه المشكلة، نستخدم نهج مرادف يستند إلى استبدال أسئلة زيادة التداخل المعجمي المنخفض. نوضح أن نهج تكبير البيانات المقترح بسيط ولكنه فعال في التخفيف من مشكلة التدهور مع الأمثلة الاصطناعية 70K فقط.
نقدم أول محلل محلل دائري على أساس أنظمة إعادة الكتابة الخالية من السياق (LCFRS).وهو يستخدم المصنفات العصبية والتفوق على المحللين السابقين في LCFRS في كل من الدقة وسرعة التحليل من هامش واسع.نتائجنا مواكبة أفضل المحللين المتساقين (العام)، وخاصة درجات ا لناخبين المتساقين إنشاء حالة جديدة من الفن.إن قلب نهجنا هو إجراء فعال لليككاليزي يدفع LCFRS معجمية من أي شجرة Treebank غير المتساقين.وصفنا بتعديل تحليل LCFRS المعتاد على الرسم البياني الذي يمثل التضخم بسرعة وإدخال إجراء يحول مشتقات LCFRS المعجمية إلى أشجار تحليل مكافئة من TreeBank الأصلي.يتم تقييم نهجنا على الانجليزية المتساقين بين بنك بنك بنسل وشركة النيجرية الألمانية والنمر.
تتحمل أنظمة Training NLP عادة إمكانية الوصول إلى البيانات المشروحة التي تحتوي على ملصق بشري واحد لكل مثال. بالنظر إلى وضع علامات غير كاملة من الحنجرة والغموض الملازمين من اللغة، فإننا نفترض أن العلامة الفردية ليست كافية لتعلم مجموعة تفسير اللغة. نستك شف مخططات توزيع توضيحية جديدة، وتعيين ملصقات متعددة لكل مثال لمجموعة فرعية صغيرة من أمثلة التدريب. تقديم أمثلة متعددة التوصيل هذه بتكلفة التعليق عدد أقل من الأمثلة التي تجلب مكاسب واضحة حول مهمة مهمة وكتابة الكيان في اللغة الطبيعية، حتى عندما نتدرب أولا مع بيانات تسمية واحدة ثم ضبط أمثلة ملصقات متعددة. تمديد إطار تكبير بيانات مختلط، نقترح خوارزمية التعلم التي يمكن أن تتعلم من الأمثلة التدريبية مع كمية مختلفة من التوضيحية (مع صفر، واحد، أو ملصقات متعددة). تجمع هذه الخوارزمية بكفاءة مع الإشارات من بيانات التدريب غير المتكافئة وتجلب مكاسب إضافية في ميزانية التوضيحية المنخفضة وإعدادات المجال الصليب. معا، تحقق طريقة لدينا مكاسب ثابتة في مهام اثنين، مما يشير إلى أن التسميات التوزيعية بشكل غير متساو بين أمثلة التدريب يمكن أن تكون مفيدة للعديد من مهام NLP.
أدوار الأحرف النمطية المعروفة أيضا باسم Archetys أو Dramatis الشخصية - تلعب وظيفة مهمة في الروايات: إنها تسهل الاتصالات الفعالة مع حزم الخصائص والجمعيات الافتراضية وتخفيف فهم أدوار تلك الشخصيات في السرد الشامل. نقدم نهج تجميع K-Wi يعني غير المدعوم با لكامل للتعلم الأدوار النمطية التي تعطى معلومات مؤامرة هيكلة فقط. نوضح هذه التقنية في نظرية فلاديمير بروتب الهيكلية للفولكلتال الروسية (تم التقاطها في كوربوس فوندنر الموسعة، مع 46 حكايات)، والتي تبين أن نهجنا يمكن أن تحفز ستة من أصل سبعة من شخصيات الدكتور الدافعة مع تدابير F1 تصل إلى 0.70 (0.58 متوسط) مع فئة إضافية لشخصيات طفيفة. لقد استكشفنا مجموعات ميزة مختلفة وتغيرات طريقة تقييم الكتلة. تشتمل مجموعة الميزات الأفضل أداء على وظائف المؤامرة و Unigrams و TF-IDF الأوزان و Adgeddings على رؤوس سلسلة Aquerence. أدوار المذكورة في كثير من الأحيان (بطل أو شرير)، أو أنماط مؤامرة مميزة بوضوح (الأميرة) متباينة بقوة أكثر من أدوار أقل تواترا أو متميزة (المرسل، المساعد، المانح). يشير تحليل الأخطاء التفصيلي إلى أن جودة السلسلة الأساسية ووظائف المؤامرة تتكلم حاسمة لهذه المهمة. نحن نقدم جميع بياناتنا ورمزنا لاستنساخ.
أهداف المحاذاة الكامنة مثل CTC والفأس تحسن بشكل كبير نماذج الترجمة الآلية غير التلقائي.هل يمكنهم تحسين النماذج التلقائية أيضا؟نستكشف إمكانية تدريب نماذج الترجمة الآلية ذات الجهاز التلقائي بأهداف محاذاة كامنة، ومراقبة ذلك، في الممارسة العملية، ينتج هذ ا النهج نماذج التدهور.نحن نقدم شرحا نظريا لهذه النتائج التجريبية، وأثبت أن أهداف المحاذاة الكامنة غير متوافقة مع إجبار المعلم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا