يمكن أن تعكس القواط التي تحدث بشكل طبيعي، مثل الإجابة على شظايا لأسئلة اللغة الطبيعية والارتباطات التشعبية على صفحات الويب، الحد من الحدس النحامي البشري فيما يتعلق بحدود الجمل الفعلية.إن توفرهم والمراسلات التقريبية لبناء الجملة يجعلهم جذابا على أنها مصادر معلومات بعيدة لتدميرها في تحليل دائم غير مخالف.لكنهم صاخبة وغير كاملة.لمعالجة هذا التحدي، نقوم بتطوير فقدان منحدري من الأقواس الجزئي في التعلم.توضح التجارب أن نماذجنا الخاضعة للإشراف على نطاق واسع تدرب على البيانات الموجودة بشكل طبيعي قوسين أكثر دقة في حث الهياكل النحوية من النظم المنافسة غير المنفصلة.على English WSJ Corpus، تحقق نماذجنا درجة F1 غير قابلة للتحقيق من 68.9 لتحليل الدوائر الانتخابية.
Naturally-occurring bracketings, such as answer fragments to natural language questions and hyperlinks on webpages, can reflect human syntactic intuition regarding phrasal boundaries. Their availability and approximate correspondence to syntax make them appealing as distant information sources to incorporate into unsupervised constituency parsing. But they are noisy and incomplete; to address this challenge, we develop a partial-brackets-aware structured ramp loss in learning. Experiments demonstrate that our distantly-supervised models trained on naturally-occurring bracketing data are more accurate in inducing syntactic structures than competing unsupervised systems. On the English WSJ corpus, our models achieve an unlabeled F1 score of 68.9 for constituency parsing.
المراجع المستخدمة
https://aclanthology.org/
نقدم الأزواج، أول مجموعة بيانات عربية كبيرة من المطالبات التي تحدث بشكل طبيعي تم جمعها من 5 مواقع عربية للتحقق من الحقائق، على سبيل المثال، فات بايانو ومطبقة، وتغطي المطالبات التي تغطيها منذ عام 2016. تتكون DataSet لدينا من 6،121 مطالبة جنبا إلى جنب
تعتمد أساليب نقل نمط النص الحالي (TST) على أسلوب الطبقات لتفكيك سمات محتوى النص والأناقة لنقل نمط النص. في حين أن المصنف الأسلوب يلعب دورا حاسما في طرق TST الحالية، لا يوجد تحقيق معروف على تأثيره على أساليب TST. في هذه الورقة، نقوم بإجراء دراسة تجريب
بناء الجملة أساسي في تفكيرنا حول اللغة.الفشل في التقاط هيكل لغة الإدخال قد يؤدي إلى مشاكل تعميم وتعامل معهم.في العمل الحالي، نقترح نموذجا جديدا للغة في مجال بناء الجملة: ذاكرة ترتيب سنوية (SOM).نماذج النموذج صراحة الهيكل مع محلل تدريجي وتحافظ على إعد
تم جمع معظم مجموعات بيانات تحليل الدلالات المتاحة، والتي تتكون من أزواج من الكلام الطبيعي والنماذج المنطقية، فقط لغرض تدريب وتقييم أنظمة فهم اللغة الطبيعية.ونتيجة لذلك، فإنها لا تحتوي على أي من ثراء ومجموعة متنوعة من الكلام الطبيعية التي تحدث، حيث يس
يدقق هذا البرنامج التعليمي أحدث التقدم التقني في التحليل النحوي ودور بناء الجملة في مهام معالجة اللغة الطبيعية المناسبة (NLP)، حيث يتمثل الترجمة الدلالية في الدورات الدلالية (SRL) والترجمة الآلية (MT) المهام التي لديهاكان دائما مفيدا من أدلة النحوية