جذبت الكشف التلقائي لمؤشر Myers-Briggs Type (MBTI) من منشورات قصيرة عناية ملحوظة في السنوات القليلة الماضية.أظهرت الدراسات الحديثة أن هذه مهمة صعبة للغاية، خاصة في بيانات تويتر شائعة الاستخدام.من الصعب أيضا الحصول على تسميات MBTI أيضا، حيث تتطلب الشرح البشري علماء النفس المدربين، والطريقة التلقائية للحصول عليها من خلال استبيانات طويلة من قابلية الاستخدام المشكوك فيها للمهمة.في هذه الورقة، نقدم طريقة لجمع ملصقات MBTI موثوقة عبر أربعة أسئلة مختارة بعناية يمكن تطبيقها على أي نوع من البيانات النصية.
Automatic detection of the Myers-Briggs Type Indicator (MBTI) from short posts attracted noticeable attention in the last few years. Recent studies showed that this is quite a difficult task, especially on commonly used Twitter data. Obtaining MBTI labels is also difficult, as human annotation requires trained psychologists, and automatic way of obtaining them is through long questionnaires of questionable usability for the task. In this paper, we present a method for collecting reliable MBTI labels via only four carefully selected questions that can be applied to any type of textual data.
المراجع المستخدمة
https://aclanthology.org/
اكتسب الكشف عن فكاهة الاهتمام في السنوات الأخيرة بسبب الرغبة في فهم المحتوى الذي تم إنشاؤه من قبل المستخدم بلغة مجازية. ومع ذلك، فإن الخلافات الفردية والثقافية الكبيرة في التصور الفكاهي تجعل من الصعب للغاية جمع مجموعة بيانات الفكاهة على نطاق واسع مع
القيلات السحائية النخاعية آفة كثيرة الشيوع ببلادنا، و للأسف معظم الإصابات بها تنتهي بإعاقة و عاهة دائمة، و قسم كبير من هؤلاء الأطفال نفقدهم بالتهاب سحايا عقابيل تلك القيلات. و هنا نطرح التساؤل: لِم هذه
الآفات شائعة ببلادنا في حين أصبحت شبه نادرة بال
في هذه الدراسة، ندرس تغيير اللغة في Biji الصينية باستخدام مهمة التصنيف: تصنيف النصوص الصينية القديمة حسب الفترات الزمنية. على وجه التحديد، نحن نركز على نوع فريد من نوعه في الأدب الصيني الكلاسيكي: BIJI (حرفيا دفتر الملاحظات "أو الملاحظات الفرشاة")، أي
أصبحت الرعاية الصحية موضوع بحث أكثر وأكثر أهمية مؤخرا. مع البيانات المتنامية في مجال الرعاية الصحية، فإنه يوفر فرصة رائعة للتعلم العميق لتحسين جودة الخدمة وتقليل التكاليف. ومع ذلك، فإن تعقيد بيانات السجلات الصحية الإلكترونية (EHR) هي تحديا لتطبيق الت
يتم استخدام تقطير المعرفة (KD) على نطاق واسع لضغط ونشر نماذج لغة كبيرة مدربة مسبقا على أجهزة EDGE لتطبيقات العالم الحقيقي.ومع ذلك، فإن مساحة البحث واحدة مهملة هي تأثير الملصقات الصاخبة (التالفة) على KD.نقدم، إلى حد علمنا، أول دراسة حول الملكية الدماغ