ترغب بنشر مسار تعليمي؟ اضغط هنا

تعتمد منصات وسائل التواصل الاجتماعي عبر الإنترنت على نحو متزايد على تقنيات معالجة اللغة الطبيعية (NLP) للكشف عن محتوى مسيء على نطاق واسع من أجل تخفيف الأضرار التي يسببها لمستخدميها. ومع ذلك، فإن هذه التقنيات تعاني من مختلف تحيزات أخذ العينات والجمعية الموجودة في البيانات التدريبية، والتي غالبا ما تؤدي إلى أداء الفرعية على المحتوى ذي الصلة بالمجموعات المهمشة، مما يحتمل أن يؤدي إلى أضرار غير متناسبة تجاههم. ركزت دراسات حول مثل هذه التحيزات حتى الآن على حفنة فقط من محاور التباينات والمجموعات الفرعية التي تحتوي على التعليقات التوضيحية / المعجم المتاحة. وبالتالي، يتم تجاهل التحيزات المتعلقة بالسياقات غير الغربية إلى حد كبير في الأدبيات. في هذه الورقة، نقدم طريقة خاضعة للإشراف ضعيفا للكشف عن التحيزات المعجمية بقوة في السياقات الجغرافية الثقافية الأوسع نطاقا. من خلال دراسة الحالة حول نموذج كشف للسمية المتوفرة للجمهور، نوضح أن طريقتنا تحدد المجموعات البارزة من الأخطاء المتبادلة الجغرافية، وفي متابعة، توضح أن هذه التجمعات تعكس الأحكام الإنسانية من اللغة الهجومية واللغة الفعلية في تلك السياقات الجغرافية. نحن أيضا إجراء تحليل نموذج تدرب على مجموعة بيانات مع ملصقات الحقيقة الأرضية لفهم هذه التحيزات بشكل أفضل، وتقديم تجارب التخفيف الأولي.
الاكتشاف الموقف، الذي يهدف إلى تحديد ما إذا كان الفرد هو مفهوم مستهدف أو ضد الكشف عن الرأي العام من تدفقات بيانات وسائل التواصل الاجتماعي الكبيرة. ومع ذلك، فإن التعليق البشري لمحتوى وسائل التواصل الاجتماعي لا يستوفي دائما الموقف "" كما يقاس من خلال ا ستطلاعات الرأي العام. نوضح ذلك من خلال مقارنة موقف الفرد المبلغ عنها مباشرة إلى الموقف الذي استنتج من بيانات وسائل التواصل الاجتماعي الخاصة بهم. استفاد من استطلاع للرأي العام الطولي مع مقاعد Twitter المستفتى، أجرينا هذه المقارنة مع 1،129 فردا في أربع أهداف بارزة. نجد أن الاستدعاء مرتفعا لكل من تصنيفات الموقف المحترفين، ولكن الدقة متغير في عدد من الحالات. نحدد ثلاثة عوامل تؤدي إلى قطع الاتصال بين النص وموقف المؤلف: التناقضات الزمنية والاختلافات في البنيات وأخطاء القياس من كل من المشاركين في المسح والمعجبين. من خلال تقديم إطار لتقييم حدود نماذج الكشف عن الموقف، يوفر هذا العمل نظرة مهمة في الكشف عن الموقف حقا.
مع شعبية عمر الإنترنت الحالي، قدمت المنصات الاجتماعية عبر الإنترنت جسر للتواصل بين الشركات الخاصة والمؤسسات العامة والجمهور.الغرض من هذا البحث هو فهم تجربة المستخدم للمنتج من خلال تحليل بيانات مراجعة المنتجات في حقول مختلفة.نقترح شبكة عصبية مقرها Bil stm والتي غزت المعلومات العاطفية الغنية.بالإضافة إلى النظر في التكافؤ والإثارة وهو أصغر المعلومات العاطفية، يتم دمج علاقة الاعتماد بين النصوص أيضا في نموذج التعلم العميق لتحليل المعنويات.تظهر النتائج التجريبية أن هذا البحث يمكن أن يحقق أداء جيدا في التنبؤ بمفردات التكافؤ والإثارة.بالإضافة إلى ذلك، يمكن أن يكون دمج معلومات VA والاعتماد في نموذج Bilstm أداء ممتاز لتحليل معنويات النص الاجتماعي، والذي يتحقق من أن هذا النموذج فعال في الاعتراف بالمشاعر النص الإنسي الاجتماعي الاجتماعي.
مكنت الوصول الواسع من منصات وسائل التواصل الاجتماعي، مثل Twitter، العديد من المستخدمين من مشاركة أفكارهم وآرائهم وعواطفهم على مواضيع مختلفة عبر الإنترنت. سيسمح القدرة على الكشف عن هذه المشاعر تلقائيا العلماء الاجتماعيين، وكذلك الشركات التي يجب فهم ال ردود بشكل أفضل من الأمم والأزياء. في هذه الدراسة، نقدم مجموعة بيانات تتراوح بين 30،000 تغريدات فارسي تحمل مشاعر EKMAN الأساسية الستة (الغضب والخوف والسعادة والحزن والحزن والكراهية والعجب). هذه هي أول مجموعة بيانات العاطفة المتاحة للجمهور في اللغة الفارسية. في هذه الورقة، نوضح نظام جمع البيانات ووضع العلامات المستخدمة لإنشاء هذه البيانات. نقوم أيضا بتحليل مجموعة البيانات التي تم إنشاؤها، والتي تظهر ميزات وخصائص البيانات المختلفة. من بين أشياء أخرى، نحقق في حدوث مشاعر مختلفة في مجموعة البيانات، والعلاقة بين المعنويات والعاطفة الحالات النصية. تتوفر DataSet علنا ​​في https://github.com/nazaninsbr/persian-emotion-detection.
فهم اللغة الطبيعية مهمة مهمة في أنظمة الحوار الحديثة.يصبح أكثر أهمية مع التمديد السريع لوظيفة أنظمة الحوار.في هذا العمل، نقدم نهجا لتعلم تحويل الصفر بالرصاص لمهام تصنيف النوايا وملء الفتحات بناء على نماذج اللغة المدربة مسبقا.نستخدم نماذج محكسية عميقة تغذيها مع الكلام وأوصاف اللغة الطبيعية لحالة المستخدم للحصول على embeddings.ثم تستخدم هذه المدينات من قبل شبكة عصبية صغيرة لإنتاج تنبؤات للحصول على الاحتمالات النية والفتحة.تحقق هذه الهندسة المعمارية نتائج جديدة من الفنون الجديدة في سيناريوهات صفرية بالرصاص.واحدة هي لغة واحدة تتكيف مع المهارات الجديدة وآخر هو التكيف عبر اللغات.
تصبح الصحة العقلية أكثر اهتماما مؤخرا مؤخرا، والاكتئاب كونه مرض شائع جدا في الوقت الحاضر، ولكن أيضا اضطرابات أخرى مثل القلق أو الاضطرابات القهرية الهوس أو اضطرابات التغذية أو اضطرابات نقص الانتباه / اضطرابات نقص الانتباه / فرط النشاط. توفر كمية كبيرة من البيانات من وسائل التواصل الاجتماعي والسلف الحديث لنماذج التعلم العميق وسيلة قيمة للكشف عن الاضطرابات النفسية تلقائيا من نص عادي. في هذه المقالة، نقوم بتجربة أساليب حديثة في مجموعة بيانات الصحة العقلية SMHD من Reddit (كوهان وآخرون، 2018). مساهمتنا ثلاثة أضعاف: استخدام مجموعة بيانات تتكون من المزيد من الأمراض أكثر من معظم الدراسات، مع التركيز على النص العام بدلا من مجموعات دعم الصحة العقلية والتصنيف من قبل الوظائف بدلا من الأفراد أو المجموعات. بالنسبة للتصنيف التلقائي للأمراض، فإننا نوظف ثلاث نماذج تعليمية عميقة: بيرت روبرتا و XLNet. نحن مضاعفة خط الأساس الذي أنشأه كوهان وآخرون. (2018)، على عينة فقط من مجموعة البيانات الخاصة بهم. نحن نحسن النتائج التي حصلت عليها جيانغ وآخرون. (2020) على تصنيف ما بعد المستوى. إن الدقة التي حصلت عليها مصنف اضطراب الأكل هو أعلى نظرا للوجود الحامل للمناقشات المتعلقة بالسعرات الحرارية والوجبات الغذائية والوصفات وما إلى ذلك، في حين أن الاكتئاب كان لديه أدنى درجة F1، ربما لأن الاكتئاب أكثر صعوبة في تحديد الأفعال اللغوية.
في هذا العمل، نقدم تحليل جزء واسع النطاق لخطاب مستخدمي وسائل التواصل الاجتماعي مع الاكتئاب.كشفت الأبحاث في علم النفس أن المستخدمين الاكتئابين يميلون إلى أن يكونوا مركزة ذاتيا، أكثر انشغالا مع أنفسهم ويقومون بإعادة المزيد عن حياتهم وعواطفهم.يهدف عملنا إلى الاستفادة من مجموعات بيانات واسعة النطاق والأساليب الحسابية لاستكشاف خطابي كمي.نحن نستخدم مجموعة بيانات الاكتئاب المتاحة للجمهور من التنبؤ بالمخاطر المبكرة في ورشة عمل الإنترنت (ERISK) 2018 واستخراج ميزات جزء من الكلام والعديد من المؤشرات بناء عليها.تكشف نتائجنا عن فروق ذات دلالة إحصائية بين الأفراد الاكتئاب وغير الاكتئاب الذين يؤكدون النتائج من أدب علم النفس الحالي.يوفر عملنا نظرة ثاقبة فيما يتعلق بالطريقة التي يعبر فيها الأفراد الاكتئاب عن أنفسهم على منصات وسائل التواصل الاجتماعي، مما يتيح لنماذج حسابية على علم أفضل للمساعدة في مراقبة الأمراض العقلية ومنعها.
غالبا ما تحتوي نصوص وسائل التواصل الاجتماعي مثل منشورات المدونة والتعليقات والتغريدات بلغات هجومية بما في ذلك تعليقات خطاب الكراهية العنصرية والهجمات الشخصية والتحرش الجنسي.لذلك اكتشاف الاستخدام غير المناسب للغة هو أهمية قصوى لسلامة المستخدمين وكذلك لقمع السلوك البغيض والعدوان.الأساليب الحالية لهذه المشكلة متاحة في الغالب لغات غنية بالموارد مثل الإنجليزية والألمانية.في هذه الورقة، نميز اللغة المسيئة في النيبالية، وهي لغة موارد منخفضة، تسليط الضوء على التحديات التي يجب معالجتها لمعالجة نص وسائل الإعلام الاجتماعية النيبالية.نقدم أيضا تجارب للكشف عن اللغة المسيئة باستخدام تعلم الآلات الخاضعة للإشراف.إلى جانب المساهمة في أول مناهج خط الأساس في الكشف عن اللغة الهجومية في النيبالية، نطلق أيضا على مجموعات البيانات المشروح البشرية لتشجيع البحث في المستقبل على هذا الموضوع الحاسم.
تستكشف هذه الورقة كيف تؤثر التكنولوجيا، وخاصة الأدوات الرقمية والذكاء الاصطناعي، عمليات نقل اللغة واللغات متعددة اللغات. تقوم تكنولوجيات المعلومات والاتصالات بتمكين أنماط التفاعل الجديدة، مع انتقال أجهزة الكمبيوتر من وسائل الإعلام النقية إلى مولدات ا للغة الفعلية، وإعادة تشكيلها عميقا صناعة الخدمات اللغوية، حيث استمرت أهمية بيانات اللغة ومساعدة المحركات في الارتفاع. نظرا لأن هذه التغييرات تؤثر بشدة على نماذج التواصل واللغات بشكل عام، فإنها تحتاج إلى معالجة ليس فقط من منظور تكنولوجيا المعلومات أو عن طريق الشركات التي يحركها الأعمال، ولكن أيضا في مجال الدراسات الترجمة والتفسيرية، في مناقشة أوسع بين العلماء والممارسين وعند إعداد البرامج التعليمية لتدريب المهنيين اللغوي المتخصصين. يتم تخصيص التركيز الخاص لبعض أحدث التطورات في التعرف التلقائي على التعرف على الكلام والترجمة المنطوقة، وكيفية دفع تطبيقاتها في الترجمة الفورية حدود حالات الاستخدام المعزز في العالم الجديد. وبالتالي، فإن هذا العمل --- عند تقاطع التحقيق النظري والممارسة المهنية والتصميم التعليمي --- يهدف إلى تقديم نظرة عامة تمهيدية على المناظر الطبيعية الحالية وتتصور المسارات المحتملة للسيناريوهات القادمة.
ركزت الأبحاث السائدة على خطاب الكراهية في الغالب في الوقت الحالي في مهمة تصنيف وظائف وسائل التواصل الاجتماعي بشكل رئيسي فيما يتعلق بطبقات نطاقات الكراهية المحددة مسبقا إلى حد ما.قد يكون هذا كافيا إذا كان الهدف هو اكتشاف وحذف الوظائف اللغوية المسيئة.و مع ذلك، لا يمكن إزالة الإزالة دائما بسبب تشريع بلد ما.أيضا، هناك أدلة على أن خطاب الكراهية لا يمكن مكافحته بنجاح بمجرد إزالة مشاركات الكلام الكراهية؛يجب أن تواجهها التعليم والعديد من الروايات.لهذا الغرض، نحتاج إلى تحديد (I) من هو الهدف في وظيفة خطاب كراهية معينة، و (2) ما هي الجوانب (أو الخصائص) التي تعزى الهدف إلى الهدف في المنصب.كأول تقريب، نقترح تكييف نموذج استخراج مفهوم حقيقي للأحدث إلى مجال خطاب الكراهية.نتيجة التجارب واعدة ويمكن أن تكون مصدر إلهام لمزيد من العمل في المهمة
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا