ترغب بنشر مسار تعليمي؟ اضغط هنا

كانت أدوات معالجة اللغة الطبيعية والموارد قد تم إنشاؤها بشكل أساسي وتدريبها بشكل أساسي على أنواع اللغات القياسية.في الوقت الحاضر، مع استخدام كميات كبيرة من البيانات التي تم جمعها من وسائل التواصل الاجتماعي، تحتاج إلى معالجة الأصناف والتسجيلات الأخرى، والتي قد تقدم تحديات وصعوبات أخرى.في هذا العمل، نركز على اللغة الإنجليزية ونقدم تحليلا أوليا من خلال مقارنة كوربوس Twitteraae، المشروح للعرق، و Wordnet عن طريق تحديد وشرح اللغة عبر الإنترنت التي تفتقدها WordNet.
نماذج اللغة العصبية، بما في ذلك النماذج القائمة على المحولات، والتي تدرب مسبقا على كوربورا كبيرة جدا أصبحت وسيلة شائعة لتمثيل النص في مهام مختلفة، بما في ذلك الاعتراف بالعلاقات الدلالية النصية، على سبيل المثال نظرية هيكل الوثائق عبر المستندات. عادة م ا تكون النماذج المدربة مسبقا عادة ما يتم ضبطها على مهام المصب وتستخدم ناقلات تم الحصول عليها كمدخلات للصفين العصبي العميق. لا توجد معرفة لغوية تم الحصول عليها من الموارد والأدوات. في هذه الورقة، نقارن هذه النهج الشاملة بمجموعة من تمثيل الجملة الدوافع التي تعتمد على الرسم البياني الغني في الرسم البياني والشبكة العصبية النموذجية المطبقة على مهمة الاعتراف بعقود CST في البولندية. يصف التمثيل مستويات مختارة من هيكل الجملة بما في ذلك وصف المعاني المعجمية على أساس أجهزة WordNet (PLWOLNET) ومفاهيم Sumo المتصلة. تظهر النتائج التي تم الحصول عليها أنه في حالة العلاقات الصعبة والتدريب المتوسطة الحجم تمثيل النص المخصب من الناحية الدلوية يؤدي إلى نتائج أفضل بكثير.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا