ترغب بنشر مسار تعليمي؟ اضغط هنا

كيفية الحصول على ملصقات موثوقة لتصنيف MBTI من النصوص؟

How to Obtain Reliable Labels for MBTI Classification from Texts?

439   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

جذبت الكشف التلقائي لمؤشر Myers-Briggs Type (MBTI) من منشورات قصيرة عناية ملحوظة في السنوات القليلة الماضية.أظهرت الدراسات الحديثة أن هذه مهمة صعبة للغاية، خاصة في بيانات تويتر شائعة الاستخدام.من الصعب أيضا الحصول على تسميات MBTI أيضا، حيث تتطلب الشرح البشري علماء النفس المدربين، والطريقة التلقائية للحصول عليها من خلال استبيانات طويلة من قابلية الاستخدام المشكوك فيها للمهمة.في هذه الورقة، نقدم طريقة لجمع ملصقات MBTI موثوقة عبر أربعة أسئلة مختارة بعناية يمكن تطبيقها على أي نوع من البيانات النصية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

اكتسب الكشف عن فكاهة الاهتمام في السنوات الأخيرة بسبب الرغبة في فهم المحتوى الذي تم إنشاؤه من قبل المستخدم بلغة مجازية. ومع ذلك، فإن الخلافات الفردية والثقافية الكبيرة في التصور الفكاهي تجعل من الصعب للغاية جمع مجموعة بيانات الفكاهة على نطاق واسع مع علامات فكاهة موثوقة. نقترح كورالي، وهو إطار لتوليد ملصقات الفكاهة المتصورة على Facebook Works، باستخدام ردود الفعل المستخدم المتاحة بشكل طبيعي على هذه الوظائف مع عدم وجود شرح يدوي مطلوبا. يوفر Choral كل من الملصقات الثنائية والعشرات المستمرة من الفكاهة وغير الفكاهة. نقدم أكبر مجموعة بيانات حتى الآن مع الفكاهة المسمى على المشاركات 785K ذات الصلة إلى Covid-19. بالإضافة إلى ذلك، نقوم بتحليل التعبير عن الفكاهة المرتبطة بالسيارة في وسائل التواصل الاجتماعي عن طريق استخراج ميزات المعمير الدلالية والعاطفية من المشاركات، وبناء نماذج الكشف عن الفكاهة مع أداء مشابه للبشر. يتيح كورالي تطوير نماذج الكشف عن فكاهة واسعة النطاق على أي موضوع ويفتح طريقا جديدا لدراسة الفكاهة على وسائل التواصل الاجتماعي.
القيلات السحائية النخاعية آفة كثيرة الشيوع ببلادنا، و للأسف معظم الإصابات بها تنتهي بإعاقة و عاهة دائمة، و قسم كبير من هؤلاء الأطفال نفقدهم بالتهاب سحايا عقابيل تلك القيلات. و هنا نطرح التساؤل: لِم هذه الآفات شائعة ببلادنا في حين أصبحت شبه نادرة بال بلدان المتقدمة؟ لا تزال نسبة القيلات السحائية النخاعية التي تراجع مشفى الأطفال و غيره من المراكز الصحية شائعة جداً فيجب معرفة ما الأسباب و العوامل المؤهبة لحدوثها، و ذلك بغية التقليل من نسبة حدوثها و معرفة مدى علاقتها بالحمل و ظروف الحمل و صلة القربى بين الأبوين و تناول حمض الفوليك لدى الحامل.
في هذه الدراسة، ندرس تغيير اللغة في Biji الصينية باستخدام مهمة التصنيف: تصنيف النصوص الصينية القديمة حسب الفترات الزمنية. على وجه التحديد، نحن نركز على نوع فريد من نوعه في الأدب الصيني الكلاسيكي: BIJI (حرفيا دفتر الملاحظات "أو الملاحظات الفرشاة")، أي مجموعة من الحكايات، الاقتباسات، إلخ، أي شيء مؤلفين ينظرون إلى جديرة بالملاحظة، تمتد Biji مئات السنين عبر العديد من السلالات والحفاظ على لغة غير رسمية في شكل مكتوب. لهذه الأسباب، يعتبرون موردا جيدا لتحقيق تغيير اللغة في الصينية (فانغ، 2010). في هذه الورقة، نقوم بإنشاء مجموعة بيانات جديدة من 108 Biji عبر أربع سلالات. بناء على DataSet، نقدم أولا مهمة تصنيف الفترة الزمنية للصينيين. ثم نحقق في طرق تمثيل ميزة مختلفة للتصنيف. تظهر النتائج أن النماذج باستخدام المدينات السياقية تؤدي الأفضل. يؤكد تحليل لأعلى الميزات المختارة من قبل نموذج Word N-Gram (بعد التبييض الأسماء المناسبة) أن هذه الميزات مفيدة وتتوافق مع الملاحظات والافتراضات المقدمة من اللغويين التاريخيين.
أصبحت الرعاية الصحية موضوع بحث أكثر وأكثر أهمية مؤخرا. مع البيانات المتنامية في مجال الرعاية الصحية، فإنه يوفر فرصة رائعة للتعلم العميق لتحسين جودة الخدمة وتقليل التكاليف. ومع ذلك، فإن تعقيد بيانات السجلات الصحية الإلكترونية (EHR) هي تحديا لتطبيق الت علم العميق. على وجه التحديد، تتم مراقبة البيانات التي تم إنتاجها في القبول في المستشفى من قبل نظام EHR، والذي يتضمن بيانات منظمة مثل درجة حرارة الجسم اليومية والبيانات غير المنظمة مثل النصوص المجانية والقياسات المختبرية. على الرغم من وجود بعض الأطر المعالجة المسبقة المقترحة لبيانات EHR المحددة، فإن الملاحظات السريرية التي تحتوي على قيمة سريرية كبيرة تتجاوز عالم نظرها. بالإضافة إلى ذلك، سواء كانت هذه البيانات المختلفة من وجهات النظر المختلفة هي مفيدة لجميع المهام الطبية وكيفية الاستفادة من أفضل هذه البيانات لا تزال غير واضحة. لذلك، في هذه الورقة، نقوم أولا باستخراج الملاحظات السريرية المصاحبة من EHR وتقترح طريقة لدمج هذه البيانات، كما ندرس بشكل شامل النماذج المختلفة وأساليب نفاد البيانات لتحسين أداء تنبؤ المهام الطبي بشكل أفضل. تظهر النتائج على مهام التنبؤتين أن نموذجنا المنصوص عليه مع بيانات مختلفة تتفوق على الطريقة التي من أحدثها دون ملاحظات سريرية، توضح أهمية طريقة الانصهار وميزات الملاحظات السريرية.
يتم استخدام تقطير المعرفة (KD) على نطاق واسع لضغط ونشر نماذج لغة كبيرة مدربة مسبقا على أجهزة EDGE لتطبيقات العالم الحقيقي.ومع ذلك، فإن مساحة البحث واحدة مهملة هي تأثير الملصقات الصاخبة (التالفة) على KD.نقدم، إلى حد علمنا، أول دراسة حول الملكية الدماغ ية مع ملصقات صاخبة في فهم اللغة الطبيعية (NLU).نحن توثق نطاق المشكلة وتقديم طريقتين لتخفيف تأثير ضوضاء التسمية.تشير التجارب على مرجع الغراء إلى أن أساليبنا فعالة حتى تحت مستويات ضوضاء عالية.ومع ذلك، تشير نتائجنا إلى أن المزيد من البحث ضروري للتعامل مع ضجيج الملصقات تحت KD.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا