ترغب بنشر مسار تعليمي؟ اضغط هنا

أفضل تحجيم (BWS) أفضل منهجية للتعليق على أساس مثيلات مقارنة والترتيب، بدلا من تصنيف أو تسجيل الحالات الفردية.أظهرت الدراسات فعالية هذه المنهجية المطبقة على مهام NLP من حيث جودة عالية من مجموعات البيانات الناتجة عن طريق ذلك.في ورقة مظاهرة النظام هذه، نقدم LitEScale، مكتبة برامج مجانية لإنشاء وإدارة مهام التوضيحية BWS.يحسب LitEScale tuples typles للتعليق ويدير المستخدمين وعملية التوضيحية، ويخلق معيار الذهب النهائي.يمكن الوصول إلى وظائف LitEScale برمجيا من خلال وحدة نمطية Python، أو عبر واجهتين لمستخدمين بديلين، واحدة قائمة على وحدة التحكم النصية ومقرها على الويب.لقد نمت ونشرنا أيضا نسخة كاملة من Litescale كاملة مع دعم متعدد المستخدمين.
تتداول هذه الورقة عن عملية بناء أول أداة تحويل الدائرة إلى التبعية التركية. نقطة الانطلاق لهذا العمل هي دراسة سابقة التي تحولت فيها 10 آلاف من أشجار هيكل العبارة يدويا إلى تركية من Corpus الأصلي Penntreebank. ضمن نطاق هذا المشروع، تم تحويل هذه العبار ات التركية هذه الأشجار تلقائيا إلى هياكل التبعية على غرار UD، باستخدام خوارزمية تستند إلى القواعد وخوارزمية لتعلم الآلة محددة لمتطلبات اللغة التركية. تمت مقارنة نتائج الخوارزمية وكلاهما أن نهج التعلم الآلي أثبت أنه أكثر دقة من الخوارزمية القائمة على القواعد. تم تنقيح الناتج من قبل فريق من اللغويين. اتخذت الإصدارات المكررة عباحيات قياسية ذهبية لتقييم الخوارزميات. بالإضافة إلى مساهمتها في مشروع UD مع مجموعة بيانات كبيرة من 10،000 شجرة التبعية التركية، فإن هذا المشروع يفي أيضا فجوة مهمة للأداة التحويل التركية، مما يتيح التعدد السريع من شركة التبعية التي يمكن استخدامها لتدريب محلل التبعية الأفضل وبعد
تقدم هذه الورقة مساهمتنا الفائزة في مهمة Semeval 2021 8: MeasessVal.الغرض من هذه المهمة هو تحديد العدد والقياسات من الخطاب العلمي السريري، بما في ذلك الكميات والكيانات والخصائص والوحدات والوحدات والمعدلات وعلاقاتهم المتبادلة.يمكن أن تهدف هذه المهمة إ لى مشكلة استخراج كيان مشترك وعلاقة.وفقا لذلك، نقترح Conner، أداة استخراج العد والقياس التي يمكن أن تحدد الكيانات والعلاقات المقابلة في نموذج خط أنابيب من خطوتين.نحن نقدم وصفا مفصلا للنموذج المقترح فيما يلي.علاوة على ذلك، يتم التحقيق في تأثير الوحدات الأساسية والمخططات الفنية المعنية لدينا أيضا.
تصف هذه الورقة معيارا متاحا بحرية على شبكة الإنترنت يسمى HB DEID.تحدد DED HB ما يسمى بالمعلومات الصحية المحمية، PHI، في نص مكتوب باللغة السويدية والأقنعة أو استبدالها مع بدائل أو سرية.يتم تسمية فيس كيانات مثل الأسماء الشخصية والمواقع والأعمار وأرقام الهواتف والتواريخ.يستخدم HB DEID نموذجا CRF مدرب على النص المشروح غير الحساسة في السويدية، بالإضافة إلى خطوة ما بعد معالجة القواعد لإيجاد فاي.الخطوة الأخيرة في غامضة PHI هي إما قناعها، إظهار اسم الفصل أو استخدام نظام الكشف عن القواعد لاستبداله.
ActiveAnno هي أداة توضيحية تركز على مهام التوضيحية على مستوى المستندات التي وضعت على حد سواء لإعدادات الصناعة والبحثية.وهي مصممة لتكون أداة للأغراض العامة مع مجموعة واسعة من حالات الاستخدام.ويتميز بيو واجهة مستخدم حديثة واستجابة لإنشاء مشاريع توضيحية ، وإجراء التعليقات التعليقات التوضيحية، والخلافات، وتحليل نتائج التوضيحية.Activeanno تضمين واجهة مستخدم قابلة للتكوين للغاية والتفاعلية.تقوم الأداة أيضا بإدماج API مريح تمكن التكامل في أنظمة برامج أخرى، بما في ذلك API لتكامل تعليم الجهاز.بنيت Activeanno بتصميم قابل للتوسيع وسهولة النشر في الاعتبار، وكل ذلك لتمكين المستخدمين من أداء مهام التوضيحية ذات الكفاءة العالية ونتائج التوضيحية عالية الجودة.
Gecko +: أداة تصحيح الأخطاء النحوية والخطاط نقدم Gecko +، أداة مساعدة الكتابة على شبكة الإنترنت للغة الإنجليزية التي تصحيح الأخطاء على حد سواء في الجملة وعلى مستوى الخطاب.يعتمد ذلك على نماذجتين من أحدث نماذج لتصحيح الأخطاء النحوية وطلب الجملة.يتوفر G ecko + عبر الإنترنت كتطبيق ويب يقوم بتنفيذ خط أنابيب يجمع بين الطرزين.
نقترح سهولة، أداة تشخيصية بسيطة للإجابة على السؤال المرئي (VQA) الذي يحدد صعوبة الصورة، عينة السؤال.يعتمد سهولة على نمط الإجابات التي قدمها المعلقون المتعددين على سؤال معين.على وجه الخصوص، تعتبر جوانبين من الإجابات: (1) انتروبيا؛(2) المحتوى الدلالي.أ ولا، نثبت صحة تشخيصنا لتحديد عينات سهلة / من الصعب لنماذج VQA الحديثة.ثانيا، نعرض أن هذه السهولة يمكن استخدامها بنجاح لتحديد العينات الأكثر إعلانية للتدريب / ضبط الدقيقة.بشكل حاسم، يتم استخدام المعلومات فقط المتوفرة بسهولة في أي مجموعة بيانات VQA لحساب درجاتها.
الكشف التلقائي عن معلومات المؤامرة الحرجة في مراجعات عناصر الوسائط يشكل تحديات فريدة لكل من الحوسبة الاجتماعية واللغويات الحسابية. في هذه الورقة، نقترح إلقاء مشكلة اكتشاف تحيز المفسد في الخطاب عبر الإنترنت مهمة تبسيط النص. نحن تخمين أنه بالنسبة لزوج مستخدم العنصر، فإن مراجعة المستخدم الأكثر بساطة نتعلمه من ملخص عنصر أعلى احتمال تقديم المفسد. يشتمل نموذجنا العصبي على شبكة المحولات المتقدمة لتحتل شدة المفسد في تغريدات المستخدم. شيدنا مجموعة بيانات مستدامة مفلصة عالية الجودة كشط من تغريدات مراجعة غير مرغوبة وقترن بملخص العنوان وبيانات meta المستخرجة من مجال معين من الفيلم. إلى حد كبير، فإن نتائجنا الكمية والنوعية تزن في تأثير أداء وجود الكيان المسمى في ملخصات المؤامرة. أحصى ما يلاحظه على تقسيم وإعادة صياغة التراسل مع المعرفة المقطوعة من الإنجليزية في ويكيبيديا ومضربتها بشكل جيد في مجموعة بيانات الأفلام لدينا، فإن نموذجنا العصبي يظهر لتفوق كلا من خطوط طراز لغة وطيور أحادية الترجمة.
تقدم هذه الأوراق منصة لرصد روايات الصحافة فيما يتعلق بالعديد من التحديات الاجتماعية، بما في ذلك المساواة بين الجنسين والهجرة ولغات الأقليات.مع ترميز الروايات بلغة طبيعية، يتعين علينا استخدام تقنيات المعالجة الطبيعية لأتمتة تحليلها.وبالتالي، تتم معالج ة الأخبار الزحفة عن طريق العديد من وحدات NLP، بما في ذلك التعرف على الكيان المسمى، واستخراج الكلمات الرئيسية، تصنيف المستندات للكشف عن التحدي الاجتماعي، وتحليل المعنويات.توفر واجهة قوية للقاطرات تصور البيانات للتحليل المستند إلى المستخدم للبيانات.تقدم هذه الورقة بنية النظام وتصف بالتفصيل مكوناتها المختلفة.يتم توفير التقييم للوحدات المتعلقة باستخراج ومعلومات المعلومات المتعلقة بالتحديات الاجتماعية.
قمنا في هذا البحث بإجراء دراسة تحليلية لأهم خوارزميات حجز الموارد المقترحة في الأبحاث السابقة, و المقارنة بينها من حيث الهدف الذي تسعى لتحقيقه و المزايا و نقاط الضعف في كل منها.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا