ترغب بنشر مسار تعليمي؟ اضغط هنا

AB Antiquo: إعادة إعمار اللغة العصبية

Ab Antiquo: Neural Proto-language Reconstruction

326   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

حدد اللغويين التاريخيون منتظمين في عملية تغيير الصوت التاريخي.تستخدم الطريقة المقارنة تلك الأوستانتيات لإعادة بناء الكلمات البروتو بناء على النماذج الملحوظة بلغات الابنة.هل يمكن أن تتألف هذه العملية بكفاءة؟نحن نبذة عن مهمة إعادة إعمار بروتو كلمة، والتي يتعرض فيها النموذج للدراجات في لغات ابنة المعاصرة، ويتعين عليها التنبؤ بكلمة البروتو في لغة الجد.نحن نقدم مجموعة بيانات جديدة لهذه المهمة، والتي تشمل أكثر من 8000 مداخل مقارنة، وإظهار أن نماذج التسلسل العصبي تفوق الطرق التقليدية المطبقة على هذه المهمة حتى الآن.يكشف تحليل الأخطاء عن تقلب في قدرة النموذج العصبي لالتقاط تغييرات صوتية مختلفة، وارتباطا بعقد التغييرات.يكشف تحليل المدينات المستفادة أن نماذج تتعلم التعميمات ذات مغزى لفونيا، مما يتوافق مع التحولات الصوتيات المصادفة جيدا وثقنها اللغويات التاريخية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقترح نموذجا عاما عميقا يقوم بإجراء تحليل الطباعة وإعادة بناء الخط عن طريق تعلم أنواع DESENTANGLED من كل من نمط الخط وشكل الأحرف. يتيح لنمنا نهجنا على زيادة عدد أنواع الأحرف التي يمكننا النموذج بشكل فعال مقارنة بالطرق السابقة. على وجه التحديد، نستنتج المتغيرات الكامنة المنفصلة التي تمثل الشخصية والخط عبر زوج من شبكات الاستدلال التي تأخذ كمجموعات مدخلات من الحروفية التي تشترك كلها إما كوعي حرف، أو تنتمي إلى الخط نفسه. يتيح هذا التصميم طرازنا التعميم مع الشخصيات التي لم يتم ملاحظتها أثناء وقت التدريب، وهي مهمة مهمة في ضوء Sparsity النسبية لمعظم الخطوط. لقد طرحنا أيضا خسارة جديدة، مكيفة من العمل السابق التي تقيس احتمال استخدام توزيع متكيف في مساحة متوقعة، مما يؤدي إلى المزيد من الصور الطبيعية دون الحاجة إلى تمييز. نحن نقيم في مهمة إعادة بناء الخط على مجموعات البيانات المختلفة التي تمثل أنواع الأحرف من العديد من اللغات، ومقارنة إيجابية لأنظمة نقل النمط الحديث وفقا لمقاييس كل من المقاييس التلقائية والتقييم يدويا.
يتضمن البحث دراسة جيوديزية لإعادة تأهيل محاور الروافع الجسرية المخربة، و إعادة تعميرها و تعييرها من أجل استثمارها في عملية الانتاج. في البداية تم التطرق إلى أنواع الروافع الجسرية المستعملة في المعامل الضخمة، و الطرق الجيوديزية المستخدمة في بنائها، و الشروط التي يجب أن تحققها المحاور.اعتماداً على الشروط السابقة تم اقتراح طريقة جيوديزية لإعادة تأهيل الروافع. و تم اعداد برنامج حاسوبي لتنفيذ الآلية المقترحة بلغة mat lab، و اختبار الطريقة المقترحة مع البرنامج على أمثلة واقعية. و تم اختبار البرنامج على الحالتين الرئيسيتين: الأولى: عند تركيب محاور الروافع الجسرية، الثانية : عند الاختبار الدوري ( الصيانة الدورية ) للروافع الجسرية . و توصل البحث إلى إمكانية استخدام الطريقة المقترحة في إعادة التأهيل و التركيب و المراقبة الدورية، كما أظهر كفاءة البرنامج الحاسوبي المقترح.
اقترح مخطط التعلم الخاص Texthide مؤخرا لحماية البيانات النصية الخاصة أثناء مرحلة التدريب عبر ترميز المثيل المزعوم.نقترح هجوم إعادة الإعمار الجديد لكسر Texthide من خلال استعادة بيانات التدريب الخاص، وبالتالي تكشف النقاب عن مخاطر الخصوصية على ترميز الم ثيل.لقد صادقنا تجريبيا فعالية هجوم إعادة الإعمار مع مجموعات بيانات شائعة الاستخدام لتصنيف الجملة.إن هجومنا ستقدم تطوير التعلم في الحفاظ على الخصوصية في سياق معالجة اللغة الطبيعية.
كان التقدم المحرز الأخير في نمذجة اللغة مدفوعة ليس فقط بالتقدم في البنيات العصبية، ولكن أيضا من خلال تحسين الأجهزة والتحسين.في هذه الورقة، نؤيد نموذج اللغة الاحتمالية العصبية (NPLM) من بنغيو وآخرون.(2003)، والتي تسلسل ببساطة تضمين كلمة داخل نافذة ثاب تة ويمرر النتيجة من خلال شبكة تغذية إلى الأمام للتنبؤ بالكلمة التالية.عند القياس حتى الأجهزة الحديثة، يؤدي هذا النموذج (على الرغم من قيودها العديدة) أفضل بكثير مما كان متوقعا عن معايير نموذج اللغة على مستوى Word.يكشف تحليلنا أن NPLM يحقق حيرة أقل من محول الأساس مع سياقات مدخلات قصيرة ولكن تكافح للتعامل مع تبعيات طويلة الأجل.مستوحاة من هذه النتيجة، نقوم بتعديل المحول عن طريق استبدال طبقة انتباهي أول مع طبقة التسلسل المحلية في NPLM، مما يؤدي إلى انخفاض حيرة صغيرة ولكنها ثابتة عبر مجموعات بيانات نمذجة لغة مستوى الكلمات.
نقترح نهجا متعدد المهام، وهو نهج احتمالي لتسهيل استخراج العلاقات بالإشراف المستمر عن طريق إحضار أوثق تمثيل الجمل التي تحتوي على نفس أزواج قاعدة المعرفة.لتحقيق ذلك، نحن نحيز المساحة الكامنة من الجمل عبر السيارات الآلية (VAE) التي يتم تدريبها بشكل مشتر ك مع مصنف العلاقة.يرشد القانون الكامن تمثيلات الزوج وتؤثر إعادة إعمار الجملة.تشير النتائج التجريبية إلى مجموعة البيانات التي تم إنشاؤها عبر الإشراف البعيد إلى أن التعلم متعدد المهام ينتج عن فوائد الأداء.يكشف الاستكشاف الإضافي لتوظيف برايورس قاعدة المعارف في TheVAE أن مساحة الجملة يمكن أن تتحول نحو قاعدة المعرفة، وتقديم الترجمة الترجمة الترجمة

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا