ترغب بنشر مسار تعليمي؟ اضغط هنا

تحسين أكثر من اللاحقة التي تولد اللغات الحساسة للسياق

Optimizing over subsequences generates context-sensitive languages

133   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التعميمات الصوتية مجردة هي حالة محدودة.في حين أن النظرية المثيرة للتطبيقات هي إطار شائع لأمراض النمذجة، من المعروف أنها توليد تعيينات ولغات غير محدودة.توضح هذه الورقة أن النظرية المثيلة قادرة على توليد لغات خالية من السياق، والمساهمة في توصيف قدرتها الإندنية.يتحقق هذا مع الحد الأدنى من التعديل للنظرية حيث يتم استخدامه بشكل يكلف.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تركز العديد من النهج الحالية لتفسير نماذج تصنيف النص على توفير الأهمية عشرات لأجزاء من نص الإدخال، مثل الكلمات، ولكن دون أي طريقة لاختبار أو تحسين طريقة التفسير نفسها. هذا له تأثير مزعج مشكلة فهم أو بناء الثقة في النموذج، مع طريقة التفسير نفسها إضافة إلى عتامة النموذج. علاوة على ذلك، فإن العشرات الأهمية حول الأمثلة الفردية عادة ما تكون لا تكفي لتوفير صورة كافية من السلوك النموذجي. لمعالجة هذه المخاوف، نقترح Moxie (تأثير النمذجة الحساسة للكلمات) بهدف تمكين واجهة أكثر ثراء للمستخدم للتفاعل مع النموذج الذي يتم تفسيره وإنتاج تنبؤات قابلة للإصابة. على وجه الخصوص، نهدف إلى تقديم تنبؤات لعشرات الأهمية والمعدات المضادة والتحيزات المستفادة مع Moxie. بالإضافة إلى ذلك، مع هدف التعلم العالمي، يوفر Moxie مسارا واضحا لاختبار وتحسين نفسها. نقيم موثوقية وكفاءة Moxie على مهمة تحليل المعنويات.
تنشئ المنصات والمجتمعات عبر الإنترنت معاييرها التي تحكم السلوك المقبول داخل المجتمع.ركز جهد كبير في NLP على تحديد السلوكيات غير المقبولة، وفي الآونة الأخيرة، على التنبؤ بها قبل حدوثها.ومع ذلك، ركزت هذه الجهود إلى حد كبير على السمية باعتبارها الشكل ال وحيد لانتهاك المعايير المجتمعية.وقد أغفل هذا التركيز على مجموعة أكبر من القواعد التي يفرضها المشرفون.هنا، نقدم مجموعة بيانات جديدة تركز على طيف أكثر اكتمالا من معايير المجتمع وانتهاكاتها في سياقات المجتمع المحلى والعالمي المحلي.نقدم سلسلة من النماذج التي تستخدم هذه البيانات لتطوير اكتشاف انتهاك المعايير والتحسس المجتمعي، مما يدل على أن هذه التغييرات تعطي أداء عال.
تعلم Word Ageddings تحيزات ضمنية من العظميات اللغوية التي تم التقاطها إحصائيات Word في حدوثها. من خلال تمديد الطرق التي تقيس تحيزات تشبه الإنسان في Word Embeddings، نقدم Valnorm، وهي مهمة وطريقة تقييم جوهرية جديدة لتحديد البعد الافتراضي للتأثير في مج موعات الكلمة المصنوعة من البشرية من علم النفس الاجتماعي. نحن نطبق Valnorm على Adgeddings كلمة ثابتة من سبع لغات (الصينية والإنجليزية والألمانية والبولندية والبرتغالية والإسبانية والتركية) من النص الإنجليزي التاريخي الممتد إلى 200 عام. يحقق Valnorm دقة عالية باستمرار في تحديد تكاليف مجموعات كلمات المجموعة غير التمييزية وغير الاجتماعية. على وجه التحديد، يحقق Valnorm ترابط بيرسون ل R = 0.88 لعشرات الحكم البشري من التكافؤ لمدة 399 كلمة تم جمعها لإنشاء معايير ممتعة باللغة الإنجليزية. على النقيض من ذلك، نقيس القوالب النمطية الجنسانية باستخدام نفس مجموعة من embeddings Word وتجد أن التحيزات الاجتماعية تختلف عبر اللغات. تشير نتائجنا إلى أن جمعيات التكافؤ في كلمات الفريق غير التمييزية غير التمييزية تمثل جمعيات مشتركة على نطاق واسع، بسب سبع لغات وأكثر من 200 عام.
يهدف سؤال متعدد اللغات، الرد على الرسم البياني للمعرفة (KGQA) إلى استخلاص إجابات من الرسم البياني المعرفي (KG) للأسئلة بلغات متعددة. لتكون قابلة للتطبيق على نطاق واسع، نركز على إعداد نقل الطلقة الصفرية. هذا هو، يمكننا فقط الوصول إلى البيانات التدريبي ة فقط بلغة موارد عالية، بينما تحتاج إلى الإجابة على أسئلة متعددة اللغات دون أي بيانات معدنية باللغات المستهدفة. يتم تشغيل نهج مباشر إلى نماذج متعددة اللغات المدربة مسبقا (على سبيل المثال، MBERT) للنقل عبر اللغات، ولكن هناك فجوة كبيرة من الأداء KGQA بين المصدر واللغات المستهدفة. في هذه الورقة، نستمسى تحريض معجم ثنائي اللغة دون مقابل (BLI) لخريطة الأسئلة التدريبية في لغة المصدر في تلك الموجودة في اللغة المستهدفة مثل بيانات التدريب المعزز، والتي تتحل إلى عدم تناسق اللغة بين التدريب والاستدلال. علاوة على ذلك، نقترح استراتيجية تعليمية عدائية لتخفيف اضطراب بناء الجملة في البيانات المعززة، مما يجعل النموذج يميل إلى كل من اللغة والبنيات الاستقلال. وبالتالي، فإن نموذجنا يضيق الفجوة في تحويل صفرية عبر اللغات. التجارب على مجموعة بيانات KGQA متعددة اللغات مع 11 لغة موارد صفرية تحقق من فعاليتها.
نماذج الترجمة العصبية متعددة اللغات تعامل مع لغة مصدر واحدة في وقت واحد.ومع ذلك، فقد أظهر العمل السابق أن الترجمة من لغات مصدر متعددة تعمل على تحسين جودة الترجمة.تختلف عن الأساليب الحالية على الترجمة المتعددة المصدر التي تقتصر على سيناريو الاختبار حي ث تتوفر جمل مصدر مواز من لغات متعددة في وقت الاستدلال، نقترح تحسين الترجمة متعددة اللغات في سيناريو أكثر شيوعا من خلال استغلال جمل المصدر الاصطناعية من اللغات المساعدة.نحن ندرب نموذجنا على شركة Synthetic متعددة المصدر، وتطبيق اخفاء عشوائي لتمكين الاستدلال المرن مع مدخلات مصدر واحد أو مصدر ثنائي.تجارب واسعة النطاق على الصينية / الإنجليزية - اليابانية ومقاييس الترجمة متعددة اللغات على نطاق واسع تشير إلى أن طرازنا يتفوق على خط الأساس متعدد اللغات بشكل كبير من أعلى إلى +4.0 بلو مع أكبر تحسينات على أزواج اللغات المنخفضة أو البعيدة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا