ترغب بنشر مسار تعليمي؟ اضغط هنا

تحفز الوجود الواسع للغة الهجومية على وسائل التواصل الاجتماعي تطوير أنظمة قادرة على الاعتراف بهذا المحتوى تلقائيا.بصرف النظر عن بعض الاستثناءات البارزة، فإن معظم الأبحاث حول تحديد اللغة الهجومية التلقائية تعامل مع اللغة الإنجليزية.لمعالجة هذا القصور، نقدم العفن، مجموعة بيانات اللغة المهاراتية الهجومية.القالب هو أول مجموعة بيانات من نوعها مترجمة للأمراثي، مما يفتح مجالا جديدا للبحث في لغات Indo-Arian منخفضة الموارد.نقدم النتائج من العديد من تجارب التعلم الآلي على هذه البيانات، بما في ذلك تجارب التعلم الصفر القصيرة وغيرها من عمليات التعلم على المحولات عبر اللغات الحديثة من البيانات الحالية في البنغالية والإنجليزية والهندية.
أصبح استخدام آليات الاهتمام في أساليب التعلم العميق شعبية في معالجة اللغة الطبيعية بسبب أدائه المعلقة. يسمح باستخدام هذه الآليات إلى إحدى الأهمية لإدارة أهمية عناصر التسلسل وفقا لسياقها، ومع ذلك، فقد تمت ملاحظتها هذه الأهمية بشكل مستقل بين أزواج عناص ر التسلسل (اهتمام الذات) وبين مجال تطبيق التسلسل (الاهتمام السياقي)، مما يؤدي إلى فقد المعلومات ذات الصلة والحد من تمثيل التسلسلات. لمعالجة هذه القضايا الخاصة هذه نقترح آلية الاهتمام الذاتي الذاتي، والتي تتداول قبالة القيود السابقة، من خلال النظر في العلاقات الداخلية والسياقية بين عناصر التسلسل. تم تقييم الآلية المقترحة في أربع مجموعات قياسية لتحقيق مهمة تحديد اللغة المسيئة لتحقيق النتائج المشجعة. تفوقت على آليات الاهتمام الحالية وأظهرت أداء تنافسي فيما يتعلق بالنهج الحديثة من بين الفن.
توضح هذه الورقة النظام الذي طورته STATITATIAIRE D'Analyze StatistIck Des Tyses لتحديد الهوية الحالية (DLI) المهمة المشتركة لعام 2021. هذه المهمة صعبة للغاية لأن المواد تتكون من تعليقات YouTube قصيرة، مكتوبة في البرنامج النصي الروماني، من ثلاثةلغات Dr avidian ذات الصلة ارتباطا وثيقا، وفئة رابعة تتكون من العديد من اللغات الأخرى في أبعاد متفاوتة، كلها مختلطة مع اللغة الإنجليزية.يتكون النظام المقترح من نموذج الانحدار اللوجستي الذي يستخدمه كلما يتميز فقط N-Grams من الشخصيات بحد أقصى طول 5. بعد تحسينها من حيث ترجيح الميزة ومعلمات المصنف، فهو المرتبة الأولى في التحدي.تقوم التحليلات الإضافية التي أجريت تسطير أهمية التحسين، خاصة عندما يكون مقياس الفعالية هو الماكرو F1.
وصف النظم التي طورها مجلس البحوث القومي كندا للمهمة المشتركة لتحديد اللغة اليوراليك في حملة التقييم الفاديم 2021.قمنا بتقييم طريقتين مختلفتين لهذه المهمة: مصنف احتمالية استغلال حرف 5 غرامات فقط كميزات، وشبكة عصبية قائمة على الطابع مدربة مسبقا من خلال الإشراف الذاتي، ثم ضبطها على مهمة تحديد اللغة.تحولت الطريقة السابقة إلى أداء أفضل، مما يؤدي إلى الشك على فائدة أساليب التعلم العميق لتحديد اللغة، حيث لم يتمكنوا بعد بشكل مقنع وتفوقوا باستمرار على خوارزميات التصنيف أكثر بساطة وأقل تكلفة استغلال ميزات N-Gram.
تصف هذه الورقة نتائج المهام المشتركة التي تنظم كجزء من حملة التقييم الفاديم 2021. كانت الحملة جزءا من ورشة العمل الثامنة حول معالجة اللغات الطبيعية (NLP) لغات أخرى وأصناف وملاءات (طباعة فيديو)، مشتركة مع EACL2021. أدرجت أربع مهام مشتركة منفصلة هذا ال عام: تحديد الهوية اللغوية لل DRAVIDIAN (DLI)، وتحديد الهياكل الرومانية (RDI)، ومجموعة متنوعة من وسائل التواصل الاجتماعي GEOLOATION (SMG) وتحديد اللغة الأوراليك (ULI).تم تنظيم DLI لأول مرة واصل الثلاثة الأخرى سلسلة من المهام من حملات التقييم السابقة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا