ترغب بنشر مسار تعليمي؟ اضغط هنا

نماذج Wikibert: التعلم العميق التعلم للعديد من اللغات

WikiBERT Models: Deep Transfer Learning for Many Languages

618   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مكنت نماذج اللغة العصبية العميقة مثل بيرت التطورات الأخيرة في العديد من مهام معالجة اللغة الطبيعية. ومع ذلك، نظرا للجهد والتكلفة الحاسوبية المشاركة في التدريب المسبق لها، يتم إدخال هذه النماذج عادة فقط لعدد صغير من لغات الموارد عالية الوزن مثل اللغة الإنجليزية. في حين تتوفر نماذج متعددة اللغات التي تغطي أعدادا كبيرة من اللغات، فإن العمل الحديث يشير إلى أن التدريب أحادي الأحادي يمكن أن ينتج عن نماذج أفضل، وفهمنا للمفاضرة بين التدريب الأحادي وغير اللغوي غير مكتمل. في هذه الورقة، نقدم خط أنابيب بسيطة وأتمتة بالكامل لإنشاء نماذج بيرت الخاصة باللغة من البيانات من بيانات ويكيبيديا وإدخال 42 من هذه النماذج الجديدة، والأكثر من اللازم لغات حتى الآن تفتقر إلى نماذج اللغة العصبية العميقة المخصصة. نقوم بتقييم مزايا هذه النماذج باستخدام اختبارات Cloze و Autify Parser على بيانات التبعيات العالمية، والأداء المتناقض مع النتائج باستخدام طراز Bert (Mbert) متعدد اللغات. نجد أن نماذج WikiBert المقدمة حديثا تفوقت Mbert في اختبارات Cloze لجميع اللغات تقريبا، وأن uDify باستخدام نماذج Wikibert تفوق المحلل باستخدام Mbert في المتوسط، مع توضح الطرز الخاصة باللغة تحسين أداء محسنة بشكل كبير لبعض اللغات، ولكن تحسين محدود أو تحسين انخفاض في الأداء للآخرين. تتوفر جميع الطرق والنماذج المقدمة في هذا العمل تحت التراخيص المفتوحة من https://github.com/turkunlp/wikibert.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم عرض التعلم النشط للحد من متطلبات التوضيحية للعديد من مهام معالجة اللغة الطبيعية، بما في ذلك وضع العلامات الدلالية (SRL).تنطوي SRL على وسيطة وسيطة تمتد من أجل المحتمل أن يحتمل أن يتسرب المتعددة في جملة، مما يجعل من الصعب تجميع القرارات العديدة في د رجة واحدة لتحديد حالات جديدة للتعليق.في هذه الورقة، نطبق طريقتين للحصول على درجات تجميع عبر المسندات المتعددة من أجل اختيار جمل الاستعلام مع طريقتين تقدير اليقين النموذجي: استخدام مخرجات الشبكة العصبية واستخدام التعلم النشط في Bayesian في التسرب عن طريق الخلاف.قارنا هذه الأساليب بثلاثة أسماطية سلبية --- اختيار الجملة العشوائية، تحديد المستندات العشوائية بالكامل، واختيار الجمل مع معظم المتوقع --- وتحليل تأثير هذه الاستراتيجيات لديها على منحنى التعلم فيما يتعلق بتخفيض عدد المشروحالجمل والمسند لتحقيق الأداء العالي.
يعتبر التعلم العميق القلب النابض للذكاء الصنعي في السنوات الأخيرة، وفي ظل تراوح تطبيقاته بين السيارات ذاتية القيادة وصولًا إلى التحليلات الطبية وغير ذلك، وقدرته على حل المشاكل المعقدة متفوقًا على الإنسان في الكثير من الأحيان، بدا أننا وصلنا للحل النه ائي لمشاكل الذكاء الصنعي، لكن ظهور الهجمات الخادعة أصبح العائق الأساسي لتوظيف التطبيقات التي تعتمد على التعلم العميق كبديل للإنسان، وأصبح التطبيقات الأخيرة تحت المجهر لدراسة قدرتها على منع هذه الهجمات، نستعرض في هذا البحث تعريف الهجوم الخادع وطرقه بشكل عام، ثم نتطرق إلى تطبيقين محورين يمكن مهاجمتهما من خلاله ونعرض كيف نتصدى لهذه الهجمات، مرورًا بمقارنة النماذج الإحصائية مع الإنسان وكون الهجمات الخادعة جزءًا أساسيًا من الأنظمة التي تعتمد على المعطيات للقيام بمهامها.
أسماء ومعرفات المراقبة المنطقية (LOINC) هي مجموعة قياسية من الرموز التي تمكن الأطباء من التواصل حول الاختبارات الطبية.تعتمد المختبرات على Loinc لتحديد ما تختبر طلبات الطبيب للمريض.ومع ذلك، غالبا ما يستخدم الأطباء رموز مخصصة خاصة بالموقع في أنظمة السج لات الطبية التي يمكن أن تشمل اختلافا بالاختصار والأخطاء الإملائية واخترع المختصرات.يجب أن يتم تعيين حلول البرمجيات من هذه الرموز المخصصة إلى معيار Loinc لدعم قابلية التشغيل البيني للبيانات.التحدي الرئيسي هو أن لوينك تتألف من ستة عناصر.التعيين لا يتطلب عدم استخراج هذه العناصر فحسب، بل يجمع بينها أيضا وفقا لمنطق Loinc.وجدنا أن التعلم العميق القائم على الطابع يتفوق عند استخراج عناصر Loinc بينما تكون الأساليب القائمة على المنطق أكثر فعالية للجمع بين هذه العناصر في قيم Loinc كاملة.في هذه الورقة، نقدم مجموعة من التعلم والمنطق والمنطق المستخدم حاليا في العديد من المرافق الطبية في الخريطة من
ألقى النمو الأسي للإنترنت والوسائط الاجتماعية في العقد الماضي الطريق إلى زيادة نشر المعلومات الخاطئة أو المضللة. منذ الانتخابات الرئاسية الأمريكية لعام 2016، أصبحت مصطلح أخبار وهمية "أصبحت شعبية متزايدة وقد تلقت هذه الظاهرة اهتماما أكبر. في السنوات ا لماضية، تم إنشاء العديد من وكالات فحص الحقائق، ولكن بسبب عدد كبير من الوظائف اليومية على وسائل التواصل الاجتماعي، والفحص اليدوي غير كاف. حاليا، هناك حاجة ملحة لأدوات الكشف عن الأخبار التلقائي، إما لمساعدة قوائم الداما اليدوية أو التشغيل كأدوات قائمة بذاتها. هناك العديد من المشاريع جارية حول هذا الموضوع، لكن معظمهم يركزون على اللغة الإنجليزية. تناقش ورقة البحث في البحث هذه توظيف أساليب التعلم العميق، وتطوير أداة، للكشف عن الأخبار الخاطئة باللغة البرتغالية. كخطوة أولى، سنقوم بمقارنة الهيغات الراسخة التي تم اختبارها بلغات أخرى وتحليل أدائها على بياناتنا البرتغالية. بناء على النتائج الأولية لهذه المصنفات، يجب أن نختار نموذجا للتعلم العميق أو الجمع بين العديد من نماذج التعلم العميق التي تعاني من وعد لتعزيز أداء نظام الكشف عن الأخبار المزيف.
نظرا لقوتها العظيمة في النمذجة البيانات غير الإقليدية مثل الرسوم البيانية أو الفتحات، فقد فتحت التعلم العميق على تقنيات الرسم البياني (I.E.، Graph Newerations Nearials (GNNS)) باب جديد لحل مشاكل NLP ذات الصلة بالرسوم البيانية الصعبة. لقد شهدت زيادة ا لمصالح في تطبيق التعلم العميق على تقنيات الرسم البياني إلى NLP، وقد حققت نجاحا كبيرا في العديد من مهام NLP، بدءا من مهام التصنيف مثل تصنيف الجملة، ووضع العلامات الدلالية الدلالية واستخراج العلاقات، إلى مهام التوليد مثل الترجمة الآلية، والسؤال توليد وتلخيص. على الرغم من هذه النجاحات، لا تزال التعلم العميق على الرسوم البيانية ل NLP لا يزال العديد من التحديات، بما في ذلك تحويل بيانات تسلسل النص الأصلي تلقائيا إلى بيانات منظم بياني للغاية، والبيانات المعقدة النمذجة بشكل فعال تتضمن تعيين بين المدخلات المستندة إلى الرسم البياني وبيانات الإخراج غير المنظمة الأخرى تسلسل، الأشجار، وبيانات الرسم البياني مع أنواع متعددة في كل من العقد والحواف. سيتغطي هذا البرنامج التعليمي مواضيع ذات صلة ومثيرة للاهتمام على تطبيق التعلم العميق على تقنيات الرسم البياني إلى NLP، بما في ذلك بناء الرسم البياني التلقائي ل NLP، وتمثيل الرسوم البياني تعلم النماذج القائمة على NLP، والمخططات المتقدمة GNN (على سبيل المثال، Graph2Seq و Graph2Tree و Graph2Graph) ل NLP تطبيقات GNNS في مهام NLP المختلفة (مثل الترجمة الآلية، وتوليد اللغة الطبيعية، واستخراج المعلومات والتحليل الدلالي). بالإضافة إلى ذلك، سيتم تضمين جلسات التدريب العملي للتطبيق العملي لمساعدة الجمهور على زيادة الخبرة العملية في تطبيق GNNS لحل مشاكل NLP الصعبة باستخدام مكتبة المصدر المفتوحة التي تم تطويرها مؤخرا - Graph4NLP، أول مكتبة للباحثين والممارسين لسهولة الاستخدام من GNNS مهام NLP المختلفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا