تبين أن قواعد النحوية الخالية من السياق (PCFGS) مع المعلمة العصبية فعالة في تحريض قواعد العبارات غير المعروضة.ومع ذلك، نظرا للتعقيد المركزي المكعبي لتمثيل PCFG وتحليله، فإن النهج السابقة لا يمكن أن توسيع نطاق عدد كبير نسبيا من الرموز (غير اللامعة والأعمدة).في هذا العمل، نقدم شكل معلمات جديد من PCFGS استنادا إلى تحلل تربوت، والذي يحتوي على تعقيد حسابي ثلاثي في رقم الرمز، وبالتالي يسمح لنا باستخدام عدد أكبر بكثير من الرموز.نحن نستخدم أيضا المعلمة العصبية للنموذج الجديد لتحسين أداء تحليل غير مخالف.نقيم نموذجنا عبر عشرة لغات وإظهار تجريبيا فعالية استخدام المزيد من الرموز.
Probabilistic context-free grammars (PCFGs) with neural parameterization have been shown to be effective in unsupervised phrase-structure grammar induction. However, due to the cubic computational complexity of PCFG representation and parsing, previous approaches cannot scale up to a relatively large number of (nonterminal and preterminal) symbols. In this work, we present a new parameterization form of PCFGs based on tensor decomposition, which has at most quadratic computational complexity in the symbol number and therefore allows us to use a much larger number of symbols. We further use neural parameterization for the new form to improve unsupervised parsing performance. We evaluate our model across ten languages and empirically demonstrate the effectiveness of using more symbols.
المراجع المستخدمة
https://aclanthology.org/
تم إظهار نماذج الإجابة على الأسئلة (QA) للحصول على فهم القراءة لاستغلال تحيزات محددات غير مقصودة مثل السؤال - التداخل المعجمي السياق. هذا يعيق نماذج ضمان الجودة من المعمم إلى العينات الممثلة تمثيلا مثل الأسئلة ذات التداخل المعجمي المنخفض. يمكن أن يكو
نقدم أول محلل محلل دائري على أساس أنظمة إعادة الكتابة الخالية من السياق (LCFRS).وهو يستخدم المصنفات العصبية والتفوق على المحللين السابقين في LCFRS في كل من الدقة وسرعة التحليل من هامش واسع.نتائجنا مواكبة أفضل المحللين المتساقين (العام)، وخاصة درجات ا
تتحمل أنظمة Training NLP عادة إمكانية الوصول إلى البيانات المشروحة التي تحتوي على ملصق بشري واحد لكل مثال. بالنظر إلى وضع علامات غير كاملة من الحنجرة والغموض الملازمين من اللغة، فإننا نفترض أن العلامة الفردية ليست كافية لتعلم مجموعة تفسير اللغة. نستك
أدوار الأحرف النمطية المعروفة أيضا باسم Archetys أو Dramatis الشخصية - تلعب وظيفة مهمة في الروايات: إنها تسهل الاتصالات الفعالة مع حزم الخصائص والجمعيات الافتراضية وتخفيف فهم أدوار تلك الشخصيات في السرد الشامل. نقدم نهج تجميع K-Wi يعني غير المدعوم با
أهداف المحاذاة الكامنة مثل CTC والفأس تحسن بشكل كبير نماذج الترجمة الآلية غير التلقائي.هل يمكنهم تحسين النماذج التلقائية أيضا؟نستكشف إمكانية تدريب نماذج الترجمة الآلية ذات الجهاز التلقائي بأهداف محاذاة كامنة، ومراقبة ذلك، في الممارسة العملية، ينتج هذ