ترغب بنشر مسار تعليمي؟ اضغط هنا

توقع التركيبات اللغوية الناشئة عبر الوقت: ملحق الإطار النحوي عبر تسلسل متعدد الوسائط

Predicting emergent linguistic compositions through time: Syntactic frame extension via multimodal chaining

213   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعتمد اللغة الطبيعية على معجم محدود للتعبير عن مجموعة غير محدودة من الأفكار الناشئة. هناك نتيجة واحدة لهذا التوتر هي تشكيل مؤلفات جديدة، بحيث يمكن دمج الوحدات اللغوية الحالية مع العناصر الناشئة في تعبيرات جديدة. نحن نطور إطارا يستغل الآليات المعرفية للسلاسل والمعرفة متعددة الوسائط للتنبؤ التعبيرات التركيبية الناشئة عبر الزمن. نقدم نموذج تمديد الإطار النحوي (SFEM) الذي يستمد على نظرية المدعون والمعرفة من الاهتمام "، والفهور"، واللغة "" لاستنتاج كيفية توسيع الأفعال إطاراتها لتشكيل مؤلفات جديدة مع الأسماء الحالية والرواية. نقيم SFEM بصرامة على 1) طرائق المعرفة و 2) تصنيف نماذج من التفصيل، في كوربوس الإنجليزية المحلينة على مدى 150 عاما الماضية. نظرا لأن SFEM Multimodal يتوقع بناء جملة الفعل والجدات التي ظهرت حديثا أفضل بكثير من النماذج المتنافسة باستخدام المعرفة اللغوية أو غير المستمرة البحتة. نجد دعما لوجهة نظر مثالية للسلاسل بدلا من عرض النموذج الأولي والكشف عن كيفية أن يكون النهج المشترك للسلسل متعدد الوسائط أمرا أساسيا لإنشاء استخدام اللغة الحرفية والجازرة بما في ذلك الاستعارة و Methymyy.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

رؤية لغة الرؤية هي المهمة التي تتطلب وكيل للتنقل من خلال بيئة ثلاثية الأبعاد بناء على تعليمات اللغة الطبيعية. أحد التحدي الرئيسي في هذه المهمة هو التعليمات البرية مع المعلومات المرئية الحالية التي يترافق الوكيل. معظم العمل الحالي توظف اهتماما ناعما ع لى الكلمات الفردية لتحديد موقع التعليمات المطلوبة للعمل التالي. ومع ذلك، فإن كلمات مختلفة لها وظائف مختلفة في الجملة (على سبيل المثال، المعدلات ينقل السمات، الأفعال تنقل الإجراءات). يمكن أن تساعد معلومات بناء الجملة مثل التبعيات وهياكل العبارات الوكيل لتحديد أجزاء مهمة من التعليمات. وبالتالي، في هذه الورقة، نقترح وكيل التنقل الذي يستخدم معلومات بناء الجملة المستمدة من شجرة التبعية لتعزيز المحاذاة بين التعليمات والمشاهد المرئية الحالية. التجريبية، تتفوق وكيلنا على نموذج خط الأساس الذي لا يستخدم معلومات بناء الجملة على مجموعة بيانات الغرفة إلى الغرفة، خاصة في البيئة غير المرئية. بالإضافة إلى ذلك، يحقق وكيلنا الحديث الجديد في مجموعة بيانات الغرفة عبر الغرفة، والتي تحتوي على تعليمات في 3 لغات (الإنجليزية، الهندية، التيلجو). نظهر أيضا أن وكيلنا أفضل في محاذاة التعليمات مع المعلومات المرئية الحالية عبر تصورات نوعية.
قد يتم تحديد الجنس النحاسي من قبل دلالات أو إجمالية أو علم الصوتيات أو يمكن أن يكون تعسفيا.تحديد الأنماط في العوامل التي تحكم نون الجنسين يمكن أن تكون مفيدة لمتعلمي اللغة، وفهم المصادر اللغوية الفطرية للتحيز بين الجنسين.قد يتم استبدال النهج اليدوية ا لقائمة على القواعد اليدوية من خلال النهج الحسابية الأكثر دقة وقابلة للتطوير ولكن أصعب من أجل تفسيرها للتنبؤ بنوع الجنس من المعلومات النموذجية.في هذا العمل، نقترح نماذج تصنيف الجنسية القابلة للتفسير للفرنسية، والتي تحصل على أفضل ما في العالمين.نقدم نهج عصبي عالية الدقة التي تعززها نهج قائم على بديل عالمي جديد لتوضيح التنبؤات.نقدم سمات مساعدة "لتوفير تعقيد تفسير الضبط.
لقد أظهرت نماذج اللغة المدربة على كورسا كبيرة جدا مفيدة لمعالجة اللغة الطبيعية. كأداة أثرية ثابتة، أصبحوا موضوعا للدراسة المكثفة، حيث يحكم العديد من الباحثين "مدى الحصول عليها والذي يثبت بسهولة التجريد اللغوي ومعرفة الواقعية والعمومية وقدرات التفكير. تطبيق العمل الحديث عدة تحقيقات مراحل التدريب المتوسطة لمراقبة العملية التنموية للنموذج الواسع النطاق (شيانغ وآخرون، 2020). بعد هذا الجهد، نجيب بشكل منهجي على سؤال: لأنواع مختلفة من المعرفة يتعلم نموذج اللغة، عند التدريب أثناء (قبل) هل تم الحصول عليها؟ باستخدام روبرتا كدراسة حالة، نجد: يتم الحصول على المعرفة اللغوية بسرعة، ثابتة، قوية عبر المجالات. الحقائق والعموم أبطأ وأكثر حساسية للنطاق. القدرات المنطقية هي، بشكل عام، لا تكتسب بشكل ثابت. كشركات بيانات جديدة، بروتوكولات محدبة، بروتوكولات وبروتوكولات وإثبات تظهر، نعتقد أن التحليلات الواردة في الوقت المحدد يمكن أن تساعد الباحثين على فهم التعلم المعقدة والخيول أن هذه النماذج تخضع لنا وتوجيهنا نحو نهج أكثر كفاءة التي تحقق التعلم اللازم بشكل أسرع.
تم الآن إنشاء أن نماذج اللغة العصبية الحديثة يمكن تدريبها بنجاح على لغات متعددة في وقت واحد دون تغييرات على الهندسة المعمارية الأساسية، وتوفير طريقة سهلة لتكييف مجموعة متنوعة من نماذج NLP لغات الموارد المنخفضة.ولكن ما نوع المعرفة المشتركة حقا بين الل غات داخل هذه النماذج؟هل يؤدي التدريب المتعدد اللغات في الغالب إلى محاذاة مساحات التمثيل المعجمية أو هل تمكن أيضا تقاسم المعرفة النحوية بحتة؟في هذه الورقة، نشرج أشكال مختلفة من التحويل المتبادل والبحث عن عواملها الأكثر تحديدا، باستخدام مجموعة متنوعة من النماذج والمهام التحقيق.نجد أن تعريض LMS لدينا بلغة ذات صلة لا تؤدي دائما إلى زيادة المعرفة النحوية في اللغة المستهدفة، وأن الظروف المثلى للنقل الدلالي المعجمي قد لا تكون الأمثل للتحويل النحوي.
في حين أن تقنيات التبغيات المتبقية تجد نجاحا متزايدا في مجموعة واسعة من مهام معالجة اللغة الطبيعية، فإن تطبيقها على الدورات الدلالية (SRL) كان محدودا بقوة من خلال حقيقة أن كل لغة تعتمد شكليها اللغوي الخاص بها، من Propbank من أجل أنظمة إنجليكزي للإسبا نية و PDT-VALLEX لتشيك، في جملة أمور. في هذا العمل، نتعلم هذه المشكلة وتقديم نموذج موحد لأداء SRL عبر اللغات عبر الموارد اللغوية غير المتجانسة. يتعلم نموذجنا ضمنيا تعيين عالي الجودة من أجل الشكليات المختلفة عبر لغات متنوعة دون اللجوء إلى محاذاة Word وتقنيات الترجمة. نجد ذلك، ليس فقط نظامنا المتبادل لدينا تنافس مع الحالة الحالية للفن ولكنها قوية أيضا على سيناريوهات البيانات المنخفضة. من المثير للاهتمام، من المثير للاهتمام، نموذجنا الموحد قادر على التعليق الجملة في تمريرة واحدة إلى الأمام مع جميع المخزونات التي تم تدريبها عليها، وتوفير أداة لتحليل ومقارنة النظريات اللغوية عبر لغات مختلفة. نطلق سردنا ونموذجنا في https://github.com/sapienzanlp/unify-srl.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا