ترغب بنشر مسار تعليمي؟ اضغط هنا

أخبرني ما تقرأه: التذعار التلقائية المهمة القائمة على الخبرة التلقائي لشرح النص في مجالات الخبراء

Tell Me What You Read: Automatic Expertise-Based Annotator Assignment for Text Annotation in Expert Domains

242   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تحقق هذه الورقة في فعالية مهمة الإحداثي التلقائي لشرح النص في مجالات الخبراء. في مهمة إنشاء كورسرا المشروح عالي الجودة، غالبا ما تغطي مجالات الخبراء مجالات فرعية متعددة (مثل الكيمياء العضوية وغير العضوية في مجال الكيمياء) إما صراحة أو ضمنيا. لذلك، من الأهمية بمكان تعيين معلقين على المستندات ذات الصلة بخبرتهم المجالين الدقيقة. ومع ذلك، فإن معظم الأساليب الحالية لتقدير التعشيد التقديري موثوقية لكل معلقي أو مثيل مشروح فقط بعد عملية التوضيحية. لمعالجة هذه المسألة، نقترح طريقة لتقدير خبرات المجال في كل Annotator قبل عملية الشرح باستخدام المعلومات المتاحة بسهولة من المحن المعلقين مسبقا. نقترح تدبيرين لتقدير خبرات الهنود: إجراء واضح باستخدام الفئات المحددة مسبقا من المجالات الفرعية، وتدبير ضمني باستخدام تمثيلات موزعة للوثائق. تظهر النتائج التجريبية على مهام شرح الاسم الكيميائي أن دقة التوضيحية تتحسن عندما يتم دمج كل من التدابير الصريحة والمنامية للتخصيص العنفي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

توفر المحاكاة الطبية بيئة تسيطر عليها لتدريب وتقييم المهارات السريرية. ومع ذلك، كمنصة تقييم، فإنه يتطلب وجود فاحص من ذوي الخبرة لتوفير ملاحظات الأداء، والتي تشمل عادة باستخدام قائمة مرجعية محددة المهام. هذا يجعل عملية التقييم غير فعالة ومكلفة. علاوة على ذلك، فإن طريقة التقييم هذه لا توفر الممارسين الطبيين الفرصة للتدريب المستقل. من الناحية المثالية، يجب إجراء عملية ملء قائمة التحقق بواسطة نظام موضوعي تدرك كامل، قادر على الاعتراف بمراقبة الأداء السريرية ومراقبتها. تحقيقا لهذه الغاية، قمنا بتطوير نظام مرجعي تلقائي بالكامل ونظام مرئي تلقائي بالكامل، قادر على تحديد تصرفات سكان التخدير بشكل موضوعي وتحقيق صحة في بيئة محاكاة. بناء على النتائج التي تم تحليلها، يكون نظامنا قادرا على الاعتراف بمعظم المهام في قائمة المراجعة: درجة F1 من 0.77 لجميع المهام، ونتيجة F1 من 0.79 للمهام اللفظية. تطوير نظام يستند إلى تحسين تجربة مجموعة واسعة من منصات المحاكاة. علاوة على ذلك، في المستقبل، يجوز تنفيذ هذا النهج في غرفة التشغيل وغرفة الطوارئ. هذا يمكن أن يسهل تطوير التقنيات المساعدة التلقائية لهذه المجالات.
تقدم هذه الورقة نتائج المهمة المشتركة للمقاييس WMT21. طلب من المشاركين تسجيل مخرجات أنظمة الترجمة المتنافسة في مهمة الترجمة الأخبار WMT21 مع مقاييس أوتوماتيكية على مجطتين مختلفتين: أخبار ومحادثات تيد. تم تقييم جميع المقاييس على مدى ارتباطها على مستوى النظام والقطاع مع التصنيفات البشرية. على عكس إصدارات السنوات السابقة، فقد استحوذنا هذا العام على تصنيفاتنا الإنسانية الخاصة بنا على أساس التقييم البشري القائم على الخبراء عبر مقاييس الجودة متعددة الأبعاد (MQM). يحتوي هذا الإعداد على العديد من المزايا: (1) قد أظهر التقييم القائم على الخبراء أنه أكثر موثوقية، (2) تمكنا من تقييم جميع المقاييس على مجاليين مختلفين باستخدام ترجمات نفس أنظمة MT، (III) أضفنا 5 إضافية الترجمات القادمة من نفس النظام أثناء تطوير النظام. بالإضافة إلى ذلك، صممنا ثلاث مجموعات تحدي تقيم متانة جميع المقاييس التلقائية. نقدم تحليلا مكثفا حول مدى أداء المقاييس على أزواج ثلاث لغات: الإنجليزية إلى الألمانية والإنجليزية إلى الروسية والصينية إلى الإنجليزية. نوضح تأثير الترجمات المرجعية المختلفة على المقاييس المستندة إلى المرجع ومقارنة شرح MQM القائم على الخبراء مع درجات DA المكتسبة بواسطة WMT.
يمكن أن تكشف نمط النص أن يكشف السمات الحساسة للمؤلف (E.G. العمر والسباق) للقارئ، والذي يمكن، بدوره، يؤدي إلى انتهاكات الخصوصية والتحيز في كل من القرارات البشرية والخضارات على أساس النص. على سبيل المثال، قد تكشف أسلوب الكتابة في تطبيقات الوظائف عن سما ت المرشح المحمية التي يمكن أن تؤدي إلى التحيز في اتخاذ القرارات، بغض النظر عما إذا كانت القرارات التوصية مجددا أو من قبل البشر. نقترح إطارا أساسيا يستند إلى VAE يهدف إلى توضيح الملامح الأسلوبية للنص الذي تم إنشاؤه بشريا من خلال نقل النمط، عن طريق إعادة كتابة النص نفسه تلقائيا. نقدي، يعمل إطار عملنا على فكرة النمط الذي تم توعيته بطريقة مرنة تمكن مفاهيمين متميزين من النمط المباشر: (1) الحد الأدنى من الفكرة التي تتقاطع بشكل فعال أن الأنماط المختلفة التي شوهدت في التدريب، و (2) مفهوم أقصى يسعى إلى التباطؤ بإضافة ميزات أسلوبية لجميع السمات الحساسة إلى النص، ساري المفعول، حوسبة نقابة الأساليب. يمكن استخدام إطار عملنا النمط الخاص بنا لأغراض متعددة، ومع ذلك، فإننا نوضح فعاليته في تحسين نزاهة المصب المصب. نقوم أيضا بإجراء دراسة شاملة عن تأثير تجمع الأنماط على الطلاقة والاتساق الدلالي، وإزالة السمة من النص، في اثنين وثلاث نقل نمط النطاق.
يمكن اكتشاف الوظائف الإخبارية الخادعة المشتركة في المجتمعات عبر الإنترنت مع نماذج NLP، وقد ركزت البحوث الحديثة الكثير على تطوير هذه النماذج.في هذا العمل، نستخدم خصائص المجتمعات والمؤلفين عبر الإنترنت --- سياق كيفية نشر المحتوى - - لشرح أداء نموذج كشف الخداع الشبكي العصبي وتحديد السكان الفرعيين الذين يتأثرون بشكل غير متناسب بدقة نموذجيةأو الفشل.نحن ندرس من يقوم بنشر المحتوى، وحيث يتم نشر المحتوى إليه.نجد أنه في حين أن خصائص المؤلف هي أفضل من المتنبئين من المحتوى الخادع من الخصائص المجتمعية، فإن كلا الخصائص مرتبطة بقوة بأداء نموذجي.قد تفشل مقاييس الأداء التقليدية مثل درجة F1 في التقاط أداء نموذجي ضعيف على السكان الفرعيين المعزولين مثل المؤلفين المحددين، وعلى هذا النحو، فإن التقييم الأكثر دقة لنماذج الكشف عن الخداع أمر بالغ الأهمية.
المواد الحيوية هي المواد الاصطناعية أو الطبيعية المستخدمة لبناء الأعضاء الاصطناعية، أو تصنيع الأطراف الاصطناعية، أو استبدال الأنسجة. شهد القرن الماضي تطور الآلاف من المواد الحيوية الجديدة، ونتيجة لذلك، زيادة أسية في المنشورات العلمية في هذا المجال. ي مكن أن تمكن تحليل واسع النطاق من المواد الحيوية وأدائها اختيار المواد التي يحركها البيانات وتصميم الزرع. ومع ذلك، يتطلب مثل هذا التحليل تحديد وتنظيم المفاهيم، مثل المواد والهياكل، من النصوص المنشورة. لتسهيل استخراج المعلومات في المستقبل وتطبيق تقنيات تعلم الآلات، قمنا بتطوير Annotator الدلالي خصيصا مصممة خصيصا لأدبيات المواد الحيوية. تم تنفيذ Annetator SNANTATATATATATOR باتباع منظمة وحدات تستخدم حاويات البرمجيات للمكونات المختلفة وتزويرها باستخدام nextflow كدير سير العمل. تم تطوير مكونات معالجة اللغة الطبيعية (NLP) بشكل أساسي في Java. سمح هذا الإعداد بالاعتراف الكي في الكيان المسمى بدقة سبعة عشر فئة ذات صلة بمجال المواد الحيوية. نحن هنا تفصيل تطوير وتقييم وأداء النظام، وكذلك إصدار المجموعة الأولى من ملخصات المواد الحيوية المشروحة. نجعل كل من الجور والنظام المتاح للمجتمع لتعزيز الجهود المستقبلية في هذا المجال والمساهمة في استدامتها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا