ترغب بنشر مسار تعليمي؟ اضغط هنا

إن اكتشاف المهن في النصوص ذات صلة بمجموعة من سيناريوهات التطبيق الهامة، مثل الذكاء التنافسي والتحليل الاجتماعي والمندول الاجتماعي أو تعدين البيانات المرتبطة بالصحة الصحية. على الرغم من الأهمية وأنواع البيانات غير المتجانسة التي تذكر المهن، كانت جهود التعدين النصية للتعرف عليها محدودة. ويرجع ذلك إلى عدم وجود إرشادات توضيحية واضحة وعالية ذهبية عالية الجودة. يمكن اعتبار بيانات وسائل التواصل الاجتماعي مصدرا ذا صلة للمعلومات للمراقبة في الوقت الفعلي للمجموعات المهنية المعرضة للخطر في سياق الأوبئة مثل واحد CovID-19، مما يسهل استراتيجيات التدخل للمهن في الاتصال المباشر مع الوكلاء المعديين أو المتضررين من العقلية العقلية مشاكل صحية. لتقييم أساليب NLP الحالية وإنشاء الموارد، نظمت المسار الفرعي في SMM4H 2021، وتوفير المشاركين الرئيسيين مع مجموعة قياسية ذهبية من التغريدات المشروح يدويا (IAA من 0.919) بعد المبادئ التوجيهية التوضيحية المتاحة باللغة الإسبانية والإنجليزية، Gazetteer الاحتلال ، إصدار مترجم آلة من التغريدات، و STASTEXT AGEDDINGS. من بين 35 فريقا مسجلا، 11 قدم ما مجموعه 27 أشواط. قام المشاركون الأكثر أداء بنظامين يعتمدون على تقنيات NLP الأخيرة (E.G. المحولات) وحقق 0.93 درجة فئة في تصنيف النص و 0.839 في الاعتراف الكي Corpus: https://doi.org/10.5281/zenodo.4309356.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا