ترغب بنشر مسار تعليمي؟ اضغط هنا

Gepsa، أداة لرصد التحديات الاجتماعية في الصحافة الرقمية

GEPSA, a tool for monitoring social challenges in digital press

390   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الأوراق منصة لرصد روايات الصحافة فيما يتعلق بالعديد من التحديات الاجتماعية، بما في ذلك المساواة بين الجنسين والهجرة ولغات الأقليات.مع ترميز الروايات بلغة طبيعية، يتعين علينا استخدام تقنيات المعالجة الطبيعية لأتمتة تحليلها.وبالتالي، تتم معالجة الأخبار الزحفة عن طريق العديد من وحدات NLP، بما في ذلك التعرف على الكيان المسمى، واستخراج الكلمات الرئيسية، تصنيف المستندات للكشف عن التحدي الاجتماعي، وتحليل المعنويات.توفر واجهة قوية للقاطرات تصور البيانات للتحليل المستند إلى المستخدم للبيانات.تقدم هذه الورقة بنية النظام وتصف بالتفصيل مكوناتها المختلفة.يتم توفير التقييم للوحدات المتعلقة باستخراج ومعلومات المعلومات المتعلقة بالتحديات الاجتماعية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تناولت الدراسة مفهوم المكتبة الرقمية، و نشأتها، و مراحل تطورها موضحة مشكلة المصطلحات الرقمية. و سلطت الدراسة الضوء على مستلزمات المكتبة الرقمية، و مجموعاتها و العمليات الفنية من حيث التصنيف و الفهرسة، كما تطرقت لآليات الاسترجاع الرقمي، و بينت أسال يب البحث عن المعلومة الرقمية، موضحة معنى و آلية المنطق البولياني في البحث عن المعلومات، كما عرضت بعجالة صورة المكتبات الرقمية عربياً، و قدمت عرضاً لأهم التحديات التي تواجهها المكتبات الرقمية العربية في العصر الراهن. و خلصت الدراسة إلى مجموعة من النتائج و التوصيات.
في هذه الورقة نناقش العديد من التحديات المتعلقة بتطوير لعبة ثلاثية الأبعاد، تهدف هدفها إلى زيادة الوعي بالتبريد الإلكتروني أثناء جمع التوضيح اللغوي في اللغة الهجومية.من المفترض أن تستخدم اللعبة من قبل المراهقين، وبالتالي رفع عدد من القضايا التي يجب م عالجتها أثناء التنمية.على سبيل المثال، يجب أن تكون جماليات اللعبة جذابة للاعبين الذين ينتمون إلى هذه الفئة العمرية، ولكن في الوقت نفسه يجب تنفيذ جميع الحلول الممكنة لتلبية متطلبات الخصوصية.أيضا، ينبغي إخفاء مهمة الشروح اللغوية مخفية، وتبني ما يسمى ميكانيكا اللعبة المتعامدة، دون التأثير على جودة البيانات التي تم جمعها.في حين أن بعض هذه التحديات يتم تناولها في تطوير اللعبة، نناقش بعض الآخرين في هذه الورقة ولكن لا يزال يفتقر إلى حل نهائي.
الملخص على الرغم من التقدم المحرز في السنوات الأخيرة في معالجة تحديات فهم اللغة الطبيعية (NLU)، فإن غالبية هذا التقدم لا يزال يتركز على اللغات الغنية بالموارد مثل اللغة الإنجليزية. يركز هذا العمل على اللغة الفارسية، واحدة من اللغات المنطوقة على نطاق واسع في العالم، ومع ذلك، هناك عدد قليل من مجموعات بيانات NLU متاحة لهذه اللغة. إن توفر مجموعات بيانات التقييم عالية الجودة ضرورة لتقييم موثوق للتقدم المحرز في مهام ومجال NLU المختلفة. نقدم Parsinlu، أول معيار باللغة الفارسية التي تتضمن مجموعة من مهام فهم اللغة --- قراءة الفهم والتتبع النصي وما إلى ذلك. يتم جمع مجموعات البيانات هذه في العديد من الطرق، وغالبا ما تنطوي على التعليقات التوضيحية اليدوية من قبل المتكلمين الأصليين. ينتج عن هذا أكثر من 14.5 ألف حالة جديدة عبر 6 مهام NLU مميزة. بالإضافة إلى ذلك، نقدم النتائج الأولى من طرازات اللغة أحادية الأحادية ومتعددة اللغات في هذه المعيار ومقارنتها بالأداء البشري، والذي يوفر رؤى قيمة في قدرتنا على معالجة التحديات الفارسية في اللغة الفارسية. نأمل أن يعزز Parsinlu مزيدا من البحث والتقدم في فهم اللغة الفارسية
القدرة على توليد محاذاة كلمة دقيقة مفيدة لمجموعة متنوعة من المهام.في حين أن محاذاة الكلمة الإحصائية يمكن أن تعمل بشكل جيد، خاصة عندما تكون بيانات التدريب الموازية وفيرة، فقد تبين مؤخرا نماذج تضمين متعددة اللغات نتائج جيدة في سيناريوهات غير مخالفة.نقي م طريقة فرقة لمحاذاة الكلمات على أربع أزواج لغوية وإظهار ذلك من خلال الجمع بين أدوات متعددة، والاستفادة من نهجها المختلفة، يمكن إجراء مكاسب كبيرة.هذا يحمل للإعدادات التي تتراوح من الموارد المنخفضة جدا إلى المورد العالي.علاوة على ذلك، نقدم اختبار محاذاة ذهبي جديد مجموعة أيسلندية وأداة جديدة سهلة الاستخدام لإنشاء محاذاة Word يدوية.
تولد نماذج اللغة الكبيرة (LM) نص بطلاقة بشكل ملحوظ ويمكن تكييفها بكفاءة عبر مهام NLP. قياس وضمان جودة النص الذي تم إنشاؤه من حيث السلامة أمر ضروري لنشر LMS في العالم الحقيقي؛ تحقيقا لهذه الغاية، غالبا ما يعتمد العمل السابق على التقييم التلقائي لسمية LM. نناقش هذا النهج بشكل خطير، وتقييم العديد من استراتيجيات تخفيف السمية فيما يتعلق بالتقييم التلقائي والبشري، وتحليل عواقب التخفيف من السمية من حيث التحيز النموذجي وجودة LM. نوضح أنه في حين أن استراتيجيات التدخل الأساسية يمكن أن تتحسن بشكل فعال مقاييس تلقائية تم تأسيسها مسبقا على مجموعة بيانات Realtoxicyprompts، فإن هذا يأتي عند تكلفة انخفاض تغطية LM لكلا النصوص حول، ولهجات المجموعات المهمشة. بالإضافة إلى ذلك، نجد أن التصدير البشري غالبا ما يختلفون في درجات سمية تلقائية عالية بعد تدخلات تخفيض السمية القوي --- تسليط الضوء على مزيد من الفروق الدقيقة المشاركة في التقييم الدقيق لسامة LM.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا