ترغب بنشر مسار تعليمي؟ اضغط هنا

Activeanno: أداة التعليق التوضيحية لمستوى الوثيقة للأغراض العامة مع تكامل التعلم النشط

ActiveAnno: General-Purpose Document-Level Annotation Tool with Active Learning Integration

185   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

ActiveAnno هي أداة توضيحية تركز على مهام التوضيحية على مستوى المستندات التي وضعت على حد سواء لإعدادات الصناعة والبحثية.وهي مصممة لتكون أداة للأغراض العامة مع مجموعة واسعة من حالات الاستخدام.ويتميز بيو واجهة مستخدم حديثة واستجابة لإنشاء مشاريع توضيحية، وإجراء التعليقات التعليقات التوضيحية، والخلافات، وتحليل نتائج التوضيحية.Activeanno تضمين واجهة مستخدم قابلة للتكوين للغاية والتفاعلية.تقوم الأداة أيضا بإدماج API مريح تمكن التكامل في أنظمة برامج أخرى، بما في ذلك API لتكامل تعليم الجهاز.بنيت Activeanno بتصميم قابل للتوسيع وسهولة النشر في الاعتبار، وكل ذلك لتمكين المستخدمين من أداء مهام التوضيحية ذات الكفاءة العالية ونتائج التوضيحية عالية الجودة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الترجمة الآلية العصبية (NMT) حساسة لتحويل المجال. في هذه الورقة، نتعامل مع هذه المشكلة في إعداد تعليمي نشط حيث يمكننا أن نقضي ميزانية معينة في ترجمة البيانات داخل المجال، وتصفح تدريجيا نموذج NMT خارج المجال المدرب مسبقا على البيانات المترجمة حديثا. ع ادة ما تختار طرق التعلم النشطة الحالية ل NMT الجمل بناء على درجات عدم اليقين، ولكن هذه الأساليب تتطلب ترجمة مكلفة للجمل الكاملة حتى عندما تكون عبارات واحدة أو اثنين فقط في الجملة مفيدة. لمعالجة هذا القيد، نعيد فحص العمل السابق من حقبة الترجمة الآلية القائمة على العبارة (PBMT) التي حددت جمل كاملة، ولكن العبارات الفردية إلى حد ما. ومع ذلك، في حين أن دمج هذه العبارات في أنظمة PBMT كانت بسيطة نسبيا، إلا أنها أقل تافهة لأنظمة NMT، والتي يجب تدريبها على تسلسل كامل لالتقاط خصائص هيكلية أكبر للجمل الفريدة للمجال الجديد. للتغلب على هذه العقبات، نقترح تحديد كلا الجمل الكاملة والعبارات الفردية من البيانات غير المسبقة في المجال الجديد للتوجيه إلى المترجمين البشريين. في مهمة ترجمة باللغة الألمانية-الإنجليزية، تحقق نهج التعلم النشط لدينا تحسينات متسقة حول أساليب اختيار الجملة القائمة على عدم اليقين، وتحسين ما يصل إلى 1.2 نتيجة بلو على خطوط خطوط التعلم النشطة قوية.
تتحمل أنظمة Training NLP عادة إمكانية الوصول إلى البيانات المشروحة التي تحتوي على ملصق بشري واحد لكل مثال. بالنظر إلى وضع علامات غير كاملة من الحنجرة والغموض الملازمين من اللغة، فإننا نفترض أن العلامة الفردية ليست كافية لتعلم مجموعة تفسير اللغة. نستك شف مخططات توزيع توضيحية جديدة، وتعيين ملصقات متعددة لكل مثال لمجموعة فرعية صغيرة من أمثلة التدريب. تقديم أمثلة متعددة التوصيل هذه بتكلفة التعليق عدد أقل من الأمثلة التي تجلب مكاسب واضحة حول مهمة مهمة وكتابة الكيان في اللغة الطبيعية، حتى عندما نتدرب أولا مع بيانات تسمية واحدة ثم ضبط أمثلة ملصقات متعددة. تمديد إطار تكبير بيانات مختلط، نقترح خوارزمية التعلم التي يمكن أن تتعلم من الأمثلة التدريبية مع كمية مختلفة من التوضيحية (مع صفر، واحد، أو ملصقات متعددة). تجمع هذه الخوارزمية بكفاءة مع الإشارات من بيانات التدريب غير المتكافئة وتجلب مكاسب إضافية في ميزانية التوضيحية المنخفضة وإعدادات المجال الصليب. معا، تحقق طريقة لدينا مكاسب ثابتة في مهام اثنين، مما يشير إلى أن التسميات التوزيعية بشكل غير متساو بين أمثلة التدريب يمكن أن تكون مفيدة للعديد من مهام NLP.
الحجج عالية الجودة هي جزء أساسي من صنع القرار.توقع جودة الوسيطة تلقائيا هي مهمة معقدة حصلت مؤخرا على الكثير من الاهتمام في تعدين الحجة.ومع ذلك، فإن جهود التوضيحية لهذه المهمة مرتفعة بشكل استثنائي.لذلك، نختبر أساليب التعلم النشطة القائمة على عدم اليقي ن (AL) على مجموعتين بيانات قوامها الشائعة لتقدير ما إذا كان يمكن تمكين التعلم الكفء للعينة.يدل تقييمنا التجريبي الواسع أن وظائف الاستحواذ القائمة على عدم اليقين لا يمكن أن تتجاوز الدقة التي تم التوصل إليها مع الاستحواذ العشوائي على مجموعات البيانات هذه.
تهدف محاذاة الكيان (EA) إلى مطابقة الكيانات المكافئة عبر الرسوم البيانية المعرفة المختلفة (KGS) وهي خطوة أساسية من KG Fusion. الأساليب الرئيسية الحالية - نماذج عصام العصبية - تعتمد على التدريب مع محاذاة البذور، أي مجموعة من أزواج كيان ما قبل الانحياز والتي تعد مكلفة للغاية للتعليق. في هذه الورقة، نركض إطارا للتعليم النشط الجديد (AL) من أجل EA العصبي، تهدف إلى إنشاء محاذاة بذرة مفيدة للغاية للحصول على نماذج EA أكثر فعالية مع تكلفة أقل تعلقا. يعالج إطارنا تحديين رئيسيتين واجههما عند تطبيق Alo EA: (1) كيفية استغلال التبعيات بين الكيانات داخل الإستراتيجية. تفترض معظم الاستراتيجيات أن مثيلات البيانات للعينة مستقلة وتوزيعها بشكل متطابقة. ومع ذلك، ترتبط الكيانات في كجم. لمعالجة هذا التحدي، نقترح استراتيجية أخذ العينات غير اليقين في الهيكل التي يمكن أن تقيس حالة عدم اليقين في كل كيان وتأثيرها على كياناته الجار في كجم. (2) كيفية التعرف على الكيانات التي تظهر في كجم واحد ولكن ليس في كجم آخر (I.E.، البكالوريوس). تحديد البكالوريوس من المرجح أن ينقذ ميزانية التعليق التوضيحي. لمعالجة هذا التحدي، نحن نضع المعرفة البكالوريوس يدفع الانتباه إلى تخفيف تأثير تحيز أخذ العينات. تظهر النتائج التجريبية أن استراتيجيتنا المقترحة يمكن أن تحسن بشكل كبير جودة أخذ العينات بعنادة جيدة عبر مجموعات البيانات المختلفة ونماذج EA ومبلغ البكالوريوس.
يوروفوك هو عبارات متعددة اللغات تم بناؤها لتنظيم الوثائقي التشريعي لمؤسسات الاتحاد الأوروبي.يحتوي على الآلاف من الفئات في مستويات مختلفة من الخصوصية وتستهدف واصفاتها من قبل النصوص القانونية في ثلاثين لغة تقريبا.في هذا العمل، نقترح إطارا موحدا لتصنيف EUROVOC في 22 لغة من خلال ضبط نماذج اللغة المحولات الحديثة التي تعتمد على المحولات.نحن ندرس على نطاق واسع أداء نماذجنا المدربة وإظهار أنها تعمل بشكل كبير على تحسين النتائج التي تم الحصول عليها بواسطة أداة مماثلة - جيم - على نفس مجموعة البيانات.تم فتح الرمز والنماذج التي تم ضبطها بشكل جيد مصادر، بالإضافة إلى واجهة برنامجية تخفف عملية تحميل أوزان طراز مدرب وتصنيف مستند جديد.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا