تحقق هذه الورقة في فعالية مهمة الإحداثي التلقائي لشرح النص في مجالات الخبراء. في مهمة إنشاء كورسرا المشروح عالي الجودة، غالبا ما تغطي مجالات الخبراء مجالات فرعية متعددة (مثل الكيمياء العضوية وغير العضوية في مجال الكيمياء) إما صراحة أو ضمنيا. لذلك، من الأهمية بمكان تعيين معلقين على المستندات ذات الصلة بخبرتهم المجالين الدقيقة. ومع ذلك، فإن معظم الأساليب الحالية لتقدير التعشيد التقديري موثوقية لكل معلقي أو مثيل مشروح فقط بعد عملية التوضيحية. لمعالجة هذه المسألة، نقترح طريقة لتقدير خبرات المجال في كل Annotator قبل عملية الشرح باستخدام المعلومات المتاحة بسهولة من المحن المعلقين مسبقا. نقترح تدبيرين لتقدير خبرات الهنود: إجراء واضح باستخدام الفئات المحددة مسبقا من المجالات الفرعية، وتدبير ضمني باستخدام تمثيلات موزعة للوثائق. تظهر النتائج التجريبية على مهام شرح الاسم الكيميائي أن دقة التوضيحية تتحسن عندما يتم دمج كل من التدابير الصريحة والمنامية للتخصيص العنفي.
This paper investigates the effectiveness of automatic annotator assignment for text annotation in expert domains. In the task of creating high-quality annotated corpora, expert domains often cover multiple sub-domains (e.g. organic and inorganic chemistry in the chemistry domain) either explicitly or implicitly. Therefore, it is crucial to assign annotators to documents relevant with their fine-grained domain expertise. However, most of existing methods for crowdsoucing estimate reliability of each annotator or annotated instance only after the annotation process. To address the issue, we propose a method to estimate the domain expertise of each annotator before the annotation process using information easily available from the annotators beforehand. We propose two measures to estimate the annotator expertise: an explicit measure using the predefined categories of sub-domains, and an implicit measure using distributed representations of the documents. The experimental results on chemical name annotation tasks show that the annotation accuracy improves when both explicit and implicit measures for annotator assignment are combined.
المراجع المستخدمة
https://aclanthology.org/
توفر المحاكاة الطبية بيئة تسيطر عليها لتدريب وتقييم المهارات السريرية. ومع ذلك، كمنصة تقييم، فإنه يتطلب وجود فاحص من ذوي الخبرة لتوفير ملاحظات الأداء، والتي تشمل عادة باستخدام قائمة مرجعية محددة المهام. هذا يجعل عملية التقييم غير فعالة ومكلفة. علاوة
تقدم هذه الورقة نتائج المهمة المشتركة للمقاييس WMT21. طلب من المشاركين تسجيل مخرجات أنظمة الترجمة المتنافسة في مهمة الترجمة الأخبار WMT21 مع مقاييس أوتوماتيكية على مجطتين مختلفتين: أخبار ومحادثات تيد. تم تقييم جميع المقاييس على مدى ارتباطها على مستوى
يمكن أن تكشف نمط النص أن يكشف السمات الحساسة للمؤلف (E.G. العمر والسباق) للقارئ، والذي يمكن، بدوره، يؤدي إلى انتهاكات الخصوصية والتحيز في كل من القرارات البشرية والخضارات على أساس النص. على سبيل المثال، قد تكشف أسلوب الكتابة في تطبيقات الوظائف عن سما
يمكن اكتشاف الوظائف الإخبارية الخادعة المشتركة في المجتمعات عبر الإنترنت مع نماذج NLP، وقد ركزت البحوث الحديثة الكثير على تطوير هذه النماذج.في هذا العمل، نستخدم خصائص المجتمعات والمؤلفين عبر الإنترنت --- سياق كيفية نشر المحتوى - - لشرح أداء نموذج كشف
المواد الحيوية هي المواد الاصطناعية أو الطبيعية المستخدمة لبناء الأعضاء الاصطناعية، أو تصنيع الأطراف الاصطناعية، أو استبدال الأنسجة. شهد القرن الماضي تطور الآلاف من المواد الحيوية الجديدة، ونتيجة لذلك، زيادة أسية في المنشورات العلمية في هذا المجال. ي