تم استخدام Growdsourcing بشكل مجيئي لتعليق مجموعات هائلة من البيانات.ومع ذلك، فإن العقبات الرئيسية التي تحول دون استخدام ملصقات من مصادر الحموشة هي ضوضاء وأخطاء من التعليقات الشرحية غير الخبراء.في هذا العمل، يقترح مقارنتين تتعامل مع الضوضاء والأخطاء في ملصقات الحشد.يستخدم النهج الأول تقليل الحد الأدنى على علم الحدة (SAM)، وهي تقنية التحسين بقوة بالملصقات الصاخبة.ينفد النهج الآخر على أن طبقة شبكة عصبية تدعى SoftMax-Crowdlayer مصممة خصيصا للتعلم من التعليقات التوضيحية من الحشد.وفقا للنتائج، يمكن للنهج المقترحة تحسين أداء نموذج الشبكة المتبقية الواسعة ونموذج التصور متعدد الطبقات المطبقة على مجموعات بيانات المصادر في الحشد في مجال معالجة الصور.كما أنه يحتوي على نتائج مماثلة ومقارنة مع تقنية التصويت الأغلبية عند تطبيقها على مجال البيانات المتسلسل حيث يتم استخدام تمثيلات التشفير الثنائية من المحولات (Bert) كطراز أساسي في كلا الحالتين.
Crowdsourcing has been ubiquitously used for annotating enormous collections of data. However, the major obstacles to using crowd-sourced labels are noise and errors from non-expert annotations. In this work, two approaches dealing with the noise and errors in crowd-sourced labels are proposed. The first approach uses Sharpness-Aware Minimization (SAM), an optimization technique robust to noisy labels. The other approach leverages a neural network layer called softmax-Crowdlayer specifically designed to learn from crowd-sourced annotations. According to the results, the proposed approaches can improve the performance of the Wide Residual Network model and Multi-layer Perception model applied on crowd-sourced datasets in the image processing domain. It also has similar and comparable results with the majority voting technique when applied to the sequential data domain whereby the Bidirectional Encoder Representations from Transformers (BERT) is used as the base model in both instances.
المراجع المستخدمة
https://aclanthology.org/
الخلاف بين المبرمجين هو في كل مكان في جميع مجموعات البيانات المشروحة بأحكام بشرية في كل من معالجة اللغة الطبيعية ورؤية الكمبيوتر.ومع ذلك، تفترض معظم أساليب تعلم الآلات الأكثر إشرافا أن التفسير المفضل الوحيد موجود لكل عنصر، وهو في أحسن الأحوال مثالية.
تصف هذه الورقة نظام مقدم من فريق Biggreen إلى LCP 2021 للتنبؤ بالتعقيد المعجمي للكلمات الإنجليزية في سياق معين.نحن نكرب نموذجا يعتمد على الهندسة مع نموذج شبكة عصبي عميق تأسست على بيرتف.بينما ينفذ بيرت نفسها بشكل تنافسي، فإن نموذجنا القائم على الهندسة
من بين المهام التي تحفزها انتشار المعلومات الخاطئة، فإن اكتشاف الدعاية تحديا بشكل خاص بسبب عجز التعليقات التوضيحية الدقيقة الدقيقة اللازمة لتدريب نماذج التعلم الآلي.هنا نظهر كيف يمكن الاستفادة من البيانات من المهام الأخرى ذات الصلة، بما في ذلك تقييم
التعقيد المعجمي يلعب دورا مهما في فهم القراءة.لا يمكن استخدام تنبؤ التعقيد المعجمي (LCP) كجزء من أنظمة التبسيط المعجمية، ولكن أيضا كتطبيق مستقل لمساعدة الأشخاص على قراءة أفضل.تقدم هذه الورقة النظام الفائز الذي قدمناه إلى مهمة LCP المشتركة في Semeval
أصبح الكشف عن الفكاهة موضوع اهتمام بالعديد من فرق البحث، وخاصة المشاركين في الدراسات الاجتماعية والنفسية، بهدف الكشف عن الفكاهة والأشجار السكانية المستهدفة (مثل مجتمع، مدينة، أي بلد، موظفوشركة معينة).قامت معظم الدراسات الحالية بصياغة مشكلة الكشف عن ا