ترغب بنشر مسار تعليمي؟ اضغط هنا

المورفولوجيا المحددة جيدا هو التورفولوجيا على مستوى الجملة

Well-Defined Morphology is Sentence-Level Morphology

382   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

اكتسبت المهام المورفولوجية شعبية لائقة داخل مجتمع NLP في السنوات الأخيرة، حيث توفر مجموعات بيانات كبيرة متعددة اللغات تحليلا مورفولوجي للكلمات، إما في أو خارج السياق. ومع ذلك، فإن الافتقار إلى تعريف لغوي واضح للكلمات ديطات العمل التلقيح غير مكتمل واجب في التناقضات، لا سيما عبر اللغوية. في هذا العمل، نقوم بتوسيع الانعكاسات المورفولوجية للكلمات لإنقاذ الجمل لتوفير عالمية حقيقية منفصلة عن تقاليد هربيا لاستخدام المساحة البيضاء. للسماح بإلقاء التوضيح عن انعطاف الجملة، نحدد مخططا شرحا مورفولوجي بواسطة مجموعة ثابتة من ميزات الانهيار. نقدم مجموعة بيانات صغيرة عبر اللغوية بما في ذلك جمل بسيطة نصف تم إنشاؤها بشكل دائم في 4 لغات متنوعة من الناحية النموذجية المشروح وفقا لمخططنا المقترح، وإظهار أن مهمة إعادة انتقالة يصعب بشكل كبير ولكن تغيير النطاق من الكلمات إلى محددة بشكل جيد الجمل تسمح الواجهة مع نماذج اللغة السياقية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

المعجمات المعجمية ونماذج التنبؤ هي مكون رئيسي في العديد من أنظمة التوليف والتعرف على الكلام. نحن نعلم أن الكلمات ذات الصلة المورفولوجية تتبع عادة نمط ثابت من النطق والذين يمكن وصفها بالنماذج الخاصة باللغة. في هذا العمل، نستكشف مدى استخدام الشبكات الع صبية المتكررة العميقة لتعلم هذا النمط تلقائيا واستغلال هذا النمط لتحسين جودة تنبؤ الكلمات ذات الصلة من خلال انعطاف مورفولوجي. نقترح مقارنتين جديدة لتزويد المعلومات المورفولوجية، باستخدام الطبقة المورفولوجية للكلمة وليمما، والتي يتم تفوحها عادة في المعجم القياسي. نبلغ عن التحسينات عبر عدد من اللغات الأوروبية بدرجات متفاوتة من التعقيد الصوتي والمورفولوجي، وعائلتين لغتان، مع تحسينات أكبر لغات حيث تكون مهمة تنبؤ النطق بطبيعتها أكثر تحديا. ونحن نلاحظ أيضا أن الجمع بين شبكات LSTM ثنائية الاتجاه مع آليات الاهتمام هي نهج عصبي فعال للمشكلة الحسابية التي نظرت، عبر اللغات. يبدو أن نهجنا مفيدا بشكل خاص في إعداد الموارد المنخفض، سواء من تلقاء نفسها وبتعلم التحويل.
البحوث العلمية حول تحليل المشاعر في اللغة العربية محدودة جدا في الوقت الحالي. بينما يوجد العديد من تطبيقات تحليل المشاعر في اللغة الانكليزية, اللغة العربية مازالت تخطو خطى بطيئة في هذا المجال. في هذا البحث، نقوم بعرض تطبيق حول تحليل المشاعر في اللغ ة العربية عبر تطبيق مصنف مشاعر لتغريدات عربية. التغريدات تم تحليلها لكي نحصل على قطبية مشاعر (ايجابية او سلبية)، بما أن البيانات تم جمعها من شبكة التواصل الاجتماعي تويتر, فهذا يعكس أهميتها الكبيرة في الشرق الأوسط، حيث اللغة العربية هي اللغة المحكية.
استخراج الأحداث على مستوى المستند أمر بالغ الأهمية لمختلف مهام معالجة اللغة الطبيعية لتوفير معلومات منظمة.النهج الحالية عن طريق النمذجة المتسلسلة إهمال الهياكل المنطقية المعقدة للنصوص الطويلة.في هذه الورقة، نستفيد بين تفاعلات الكيان وتفاعلات الجملة خ لال المستندات الطويلة وتحويل كل وثيقة إلى رسم بياني غير مرمى غير مسبهب من خلال استغلال العلاقة بين الجمل.نقدم مجتمع الجملة لتمثيل كل حدث كشركة فرعية.علاوة على ذلك.توضح التجارب أن إطارنا يحقق نتائج تنافسية على الأساليب الحديثة على مجموعة بيانات استخراج الأحداث على مستوى الوثيقة على نطاق واسع.
إن تأطير مقالة إخبارية تعني تصوير الحدث المبلغ عنها من منظور محدد، على سبيل المثال، من منظور اقتصادي أو صحي. Reframing وسائل لتغيير هذا المنظور. اعتمادا على الجمهور أو الحضور، يمكن أن تصادف REFRIMING ضرورية لتحقيق التأثير المرغوب على القراء. يرتبط Re framing بتكييف الأسلوب والشاعر، والتي يمكن معالجة تقنيات توليد النص العصبي. ومع ذلك، فإن الأمر أكثر تحديا لأن تغيير الإطار يتطلب إعادة كتابة الجمل بأكملها بدلا من عبارات واحدة. في هذه الورقة، ندرس كيفية إعادة صياغة الجمل في مقالات إخبارية مع الحفاظ على تماسكها إلى السياق. نتعامل مع REMREMING كمركز ملء على مستوى الجملة الذي نربط النماذج العصبية على كوربوس موجود للإطار الوسائط. لتوجيه التدريب، نقترح ثلاث استراتيجيات: محاكمة اللغة المؤطرة، والحفاظ على الكيانات المسماة، والتعلم الخصم. نقوم بتقييم النماذج المعنية تلقائيا وتدويا من أجل اتساق الموضوع والتماسك والتعداد الناجح. تشير نتائجنا إلى أن إنشاء نص مؤطر بشكل صحيح يعمل بشكل جيد ولكن مع المفاضلات.
تجزئة خطاب وقطع الخطاب على مستوى الجملة تلعب أدوارا مهمة لمختلف مهام NLP للنظر في التماسك النصي.على الرغم من الإنجازات الأخيرة في كلا المهام، لا يزال هناك مجال للتحسين بسبب ندرة البيانات المسمى.لحل المشكلة، نقترح مصنف إنتاج نموذجي في اللغة (LMGC) لاس تخدام مزيد من المعلومات من الملصقات عن طريق معالجة الملصقات كمدخلات أثناء تعزيز تمثيلات التسمية من خلال تضمين أوصاف لكل ملصق.علاوة على ذلك، نظرا لأن هذا يتيح LMGC من إعداد تمثيلات الملصقات، غير المرئي في خطوة ما قبل التدريب، يمكننا استخدام نموذج لغة مدرب مسبقا في LMGC.تظهر النتائج التجريبية على DTSET RST-DT أن LMGC حققت النتيجة F1 من أصل 96.72 في تجزئة الخطاب.وقد حقق المزيد من درجات الولاية F1 عشرات من 84.69 مع حدود الذهب EDU و 81.18 مع حدود مجزأة تلقائيا، على التوالي، في تحليل خطاب على مستوى الجملة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا