ترغب بنشر مسار تعليمي؟ اضغط هنا

بناء جملة من الأقواس التي تحدث بشكل طبيعي

Learning Syntax from Naturally-Occurring Bracketings

130   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يمكن أن تعكس القواط التي تحدث بشكل طبيعي، مثل الإجابة على شظايا لأسئلة اللغة الطبيعية والارتباطات التشعبية على صفحات الويب، الحد من الحدس النحامي البشري فيما يتعلق بحدود الجمل الفعلية.إن توفرهم والمراسلات التقريبية لبناء الجملة يجعلهم جذابا على أنها مصادر معلومات بعيدة لتدميرها في تحليل دائم غير مخالف.لكنهم صاخبة وغير كاملة.لمعالجة هذا التحدي، نقوم بتطوير فقدان منحدري من الأقواس الجزئي في التعلم.توضح التجارب أن نماذجنا الخاضعة للإشراف على نطاق واسع تدرب على البيانات الموجودة بشكل طبيعي قوسين أكثر دقة في حث الهياكل النحوية من النظم المنافسة غير المنفصلة.على English WSJ Corpus، تحقق نماذجنا درجة F1 غير قابلة للتحقيق من 68.9 لتحليل الدوائر الانتخابية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم الأزواج، أول مجموعة بيانات عربية كبيرة من المطالبات التي تحدث بشكل طبيعي تم جمعها من 5 مواقع عربية للتحقق من الحقائق، على سبيل المثال، فات بايانو ومطبقة، وتغطي المطالبات التي تغطيها منذ عام 2016. تتكون DataSet لدينا من 6،121 مطالبة جنبا إلى جنب مع ملصقاتها الواقعية والبيانات الوصفية الإضافية، مثلمع تحديد محتوى المقال عن الواقع، فئة موضحة، وروابط للمشاركات أو صفحات الويب نشر المطالبة.نظرا لأن البيانات يتم الحصول عليها من مختلف مواقع التحقق من الحقائق، فإننا نقوم بتوحيد ملصقات المطالبة الأصلية لتوفير تصنيف ملصقات موحدة لجميع المطالبات.علاوة على ذلك، نحن نقدم إحصاءات البيانات الكاشفة وتحفيز استخدامها من خلال اقتراح تطبيقات بحثية محتملة.يتم توفير مجموعة البيانات للجمهور لمجتمع البحث.
تعتمد أساليب نقل نمط النص الحالي (TST) على أسلوب الطبقات لتفكيك سمات محتوى النص والأناقة لنقل نمط النص. في حين أن المصنف الأسلوب يلعب دورا حاسما في طرق TST الحالية، لا يوجد تحقيق معروف على تأثيره على أساليب TST. في هذه الورقة، نقوم بإجراء دراسة تجريب ية عن قيود أقراص الطبقات المستخدمة في طرق TST الحالية. لقد أظهرنا أن مصنفات النمط الموجودة لا يمكنهم تعلم بناء جملة الجملة بشكل فعال وفي نهاية المطاف أداء نماذج TST الحالية. لمعالجة هذه المشكلة، نقترح نموذجا جديدا للجيل القابل للتحكم في بناء الجملة، والذي يتضمن مصنف بنمط بناء بناء الجملة يضمن التمثيلات الكامنة المستفادة التي تم التعهد بها بفعالية برياحة هيكل الجملة ل TST. من خلال تجارب واسعة على مهام نقل نمط نصية شعبية، نوضح أن طريقةنا المقترحة تتفوق بشكل كبير على اثني عشر طريقا حديثة. أظهرت دراسات الحالة لدينا أيضا قدرة SACG على توليد جمل ذات أسلوب يستهدف بطلاقة حافظت على المحتوى الأصلي.
بناء الجملة أساسي في تفكيرنا حول اللغة.الفشل في التقاط هيكل لغة الإدخال قد يؤدي إلى مشاكل تعميم وتعامل معهم.في العمل الحالي، نقترح نموذجا جديدا للغة في مجال بناء الجملة: ذاكرة ترتيب سنوية (SOM).نماذج النموذج صراحة الهيكل مع محلل تدريجي وتحافظ على إعد اد الاحتمالات الشرطي لطراز اللغة القياسية (من اليسار إلى اليمين).لتدريب المحلل التدريجي وتجنب تحيز التعرض، نقترح أيضا أوراكل ديناميكية جديدة، بحيث يكون SOM أكثر قوة لقرارات تحليل خاطئة.تظهر التجارب أن SOM يمكن أن يحقق نتائج قوية في نمذجة اللغة، والتحليل الإضافي، واختبارات التعميم النحوي أثناء استخدام معلمات أقل من النماذج الأخرى.
تم جمع معظم مجموعات بيانات تحليل الدلالات المتاحة، والتي تتكون من أزواج من الكلام الطبيعي والنماذج المنطقية، فقط لغرض تدريب وتقييم أنظمة فهم اللغة الطبيعية.ونتيجة لذلك، فإنها لا تحتوي على أي من ثراء ومجموعة متنوعة من الكلام الطبيعية التي تحدث، حيث يس أل البشر عن البيانات التي يحتاجونها أو فضولها.في هذا العمل، نطلق سراح SEDE، مجموعة بيانات مع 12،023 أزواج من الكلام واستفسارات SQL التي تم جمعها من الاستخدام الحقيقي على موقع Stack Exchange.نظظ أن هذه الأزواج تحتوي على مجموعة متنوعة من التحديات في العالم الحقيقي والتي نادرا ما تنعكس حتى الآن في أي مجموعة بيانات تحليل دلالية أخرى، اقترح متري تقييم استنادا إلى مقارنة بنود الاستعلام الجزئي الأكثر ملاءمة لاستفسارات العالم الحقيقي، وإجراء تجاربمع خطوط أساس قوية، تظهر فجوة كبيرة بين الأداء على SEDE مقارنة مع مجموعات البيانات الشائعة الأخرى.
يدقق هذا البرنامج التعليمي أحدث التقدم التقني في التحليل النحوي ودور بناء الجملة في مهام معالجة اللغة الطبيعية المناسبة (NLP)، حيث يتمثل الترجمة الدلالية في الدورات الدلالية (SRL) والترجمة الآلية (MT) المهام التي لديهاكان دائما مفيدا من أدلة النحوية الإعلامية منذ فترة طويلة، على الرغم من أن التقدم من طرازات التعلم العميق المنتهي في النهاية يظهر نتائج جديدة.في هذا البرنامج التعليمي، سنقدم أولا الخلفية وأحدث التقدم المحرز في التحليل النحوي و SRL / NMT.بعد ذلك، سنلخص الأدلة الرئيسية حول التأثيرات النحوية على هذين المهامين المتعلقين، واستكشاف الأسباب وراء كل من الخلفيات الحسابية واللغوية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا