هندسة ميزة هي خطوة مهمة في خطوط أنابيب NLP الكلاسيكية، ولكن قد لا يكون مهندسو تعلم الآلات على بينة من الإشارات للبحث عنها عند معالجة نص اللغة الأجنبية.مجموعة أدوات الاستخراج الروسية (RFET) هي مجموعة من مكتبات استخراج الميزات المجمعة لسهولة الاستخدام من قبل المهندسين الذين لا يتحدثون الروسية.تتضمن مجموعة الميزات الحالية ل RFET ميزات تنطبق على الأنواع عبر وسائل التواصل الاجتماعي للنص ومهام العلوم الاجتماعية الحاسوبية.نوضح فعالية الأداة باستخدامه في مهمة تحديد سمة الشخصية.قارنا أداء آلات ناقلات الدعم (SVMS) المدربين مع وبدون الميزات التي توفرها RFET؛نحن أيضا قارنها مع SVM مع ميزات التضمين العصبية الناتجة عن عقوبة المرور.
Feature engineering is an important step in classical NLP pipelines, but machine learning engineers may not be aware of the signals to look for when processing foreign language text. The Russian Feature Extraction Toolkit (RFET) is a collection of feature extraction libraries bundled for ease of use by engineers who do not speak Russian. RFET's current feature set includes features applicable to social media genres of text and to computational social science tasks. We demonstrate the effectiveness of the tool by using it in a personality trait identification task. We compare the performance of Support Vector Machines (SVMs) trained with and without the features provided by RFET; we also compare it to a SVM with neural embedding features generated by Sentence-BERT.
المراجع المستخدمة
https://aclanthology.org/
يهدف هذا البحث إلى بيان أهمية مسرح الطفل في استثارة خيال الطفل و تنمية مواهبه
و قدراته الإبداعية، و إظهار تاريخ المسرح و نشأته و خصائصه و أنواعه في مجالات
الشعر و النثر ومسرح العرائس، كما يهدف إلى بيان أثر المسرح المدرسي في تنمية
شخصية الطفل، و تنشيط عمليات الخلق و الإبداع الفني لديه .
قد يساعد نظام حوار موجه نحو المهام مع التكيف مع شخصية المستخدم بشكل كبير تحسين أداء مهمة الحوار. ومع ذلك، يمكن أن يكون مثل هذا نظام الحوار صعبة عمليا للتنفيذ، لأنه من غير الواضح كيف تؤثر شخصية المستخدم على أداء مهمة الحوار. لاستكشاف العلاقة بين شخصية
تصف الورقة توضيحات TENTRANS إلى المهمة المشتركة ل WMT 2021 المشتركة.نستكشف تدريب مجموعة متنوعة من نماذج محولات الصغار الأصغر باستخدام إعداد المعلمين - طالب.يتم تدريب نموذجنا من خلال منصة تدريب متعددة اللغات المتطورة ذاتية اللغات ذاتية اللغويةونحن نطل
نقدم مجموعة أدوات مفتوحة المصدر لمعالجة اللغة الطبيعية الدنماركية، مما يتيح سهولة الوصول إلى أحدث التطورات الدنماركية ل NLP.يتميز مجموعة الأدوات بوظائف المجمع لتحميل النماذج ومجموعات البيانات بطريقة موحدة باستخدام أطر NLP لجهة خارجية.تم تطوير مجموعة
تقارير الورقة نتائج دراسة الترجمة للنصوص الأدبية على أساس الروسية المترجمة وغير الترجمة. نهدف إلى معرفة ما إذا كانت الترجمات تنحرف عن النصوص الأدبية غير المترجمة، وإذا تعزى الفروق الثابتة إلى العلاقات الموضعية بين المصدر واللغات المستهدفة. نتوقع أن ت