ترغب بنشر مسار تعليمي؟ اضغط هنا

الترميز الهرمي للنمذجة وتفسير screenplays

Hierarchical Encoders for Modeling and Interpreting Screenplays

218   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في حين أن فهم اللغة الطبيعية لا يزال الفهم المستندات الطويلة تحديا مفتوحا، غالبا ما تحتوي هذه الوثائق على معلومات هيكلية يمكنها إبلاغ تصميم النماذج التي ترميزها.البرامج النصية للأفلام هي مثال لمثل هذه النصوص النيكلية منظم، يتم تجزئة البرامج النصية في مشاهد، والتي تتحلل في الحوار والمكونات الوصفية.في هذا العمل، نقترح بنية عصبية لتشفير هذا الهيكل، والذي ينفذ بقوة على مهام تصنيف العلامات متعددة الملصقات دون استخدام ميزات يدويا.نضيف طبقة من البصيرة عن طريق زيادة وحدة الترجمة ذات القدرة على الترجمة الترجمة الترجمة غير المنشطة، والتي يمكن استخدامها لاستخراج وتصور المسارات السردية.على الرغم من أن هذا العمل يتناول screenplays على وجه التحديد، فإننا نناقش كيف يمكن تعميم النهج الأساسي لمجموعة من الوثائق المهيكلة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

عندما ينتشر خطاب الكراهية على وسائل التواصل الاجتماعي والمجتمعات عبر الإنترنت، يستمر البحث في العمل على الكشف التلقائي.في الآونة الأخيرة، كان أداء الاعتراف يتزايد بفضل التقدم في التعلم العميق وإدماج ميزات المستخدم.يحقق هذا العمل في الآثار التي يمكن أ ن تحتوي هذه الميزات على نموذج للكشف.على عكس البحث السابق، نظهر أن مقارنة الأداء البسيطة لا تعرض التأثير الكامل لضمان معلومات السياق والمستخدمية.من خلال الاستفادة من تقنيات الشرط، نعرض (1) يلعب ميزات المستخدم دورا في قرار النموذج و (2) كيف تؤثر على مساحة الميزة المستفادة من النموذج.إلى جانب الكشف عن ذلك --- وتوضيح أيضا لماذا --- ميزات المستخدم هي سبب مكاسب الأداء، نوضح كيف يمكن دمج هذه التقنيات إلى فهم النموذج بشكل أفضل والكشف عن التحيز غير المقصود.
المحادثات الإنسانية تتطور بشكل طبيعي حول مواضيع مختلفة والتحرك بطلاقة بينهما.في البحوث على أنظمة الحوار، غالبا ما يتم تجاهل القدرة على الانتقال بنشاط وسلاسة إلى مواضيع جديدة.في هذه الورقة، نقدم TIAGE، وهو مؤشر مربع حوار مدرك مواضيع جديد يستخدم باستخد ام التعليقات التوضيحية البشرية على نوبات الموضوع.استنادا إلى TIAGE، نقدم ثلاث مهام للتحقيق في سيناريوهات مختلفة من النمذجة التي تحول المواضيع في إعدادات الحوار: الكشف عن موضوع التحول، وموضوع تحول توليد استجابة استجابة وتوليد التدريب على الموضوع.تشير التجارب في هذه المهام إلى أن إشارات التحول في Tiage مفيدة لتوليد استجابة الموضوع.من ناحية أخرى، ما زالت أنظمة الحوار تكافح لتحديد وقت تغيير الموضوع.يشير هذا إلى أن هناك حاجة إلى مزيد من الأبحاث في نمذجة الحوار Topic-Shift Cy.
تتضمن النهج الحديثة لإملاء مشكلة تصحيح الأخطاء الإملائي نماذج SEQ2SEQ القائمة على المحولات، والتي تتطلب مجموعات تدريبية كبيرة وتعاني من وقت الاستدلال البطيء؛وتسلسل نماذج وضع التسلسل المستندة إلى ترميز المحولات مثل بيرت، والتي تنطوي على مساحة تسمية ال مستوى المميز وبالتالي قاموس مفردات محددة مسبقا مسبقا.في هذه الورقة، نقدم طراز Tagger Tagner التسلسل الهرمي، أو HCTAGGER، لتصحيح الأخطاء الإملائي في النص القصير.نستخدم نموذج لغة مدرب مسبقا على مستوى الحرف كتشفير نصي، ثم يتوقع تحرير مستوى الأحرف لتحويل النص الأصلي إلى شكل خالي من الأخطاء مع مساحة تسمية أصغر بكثير.للحصول على فك التشفير، نقترح نهجا هرميا متعدد المهام للتخفيف من مسألة توزيع الملصقات الطويلة الذيل دون تقديم معلمات نموذجية إضافية.تثبت التجارب في مجموعات بيانات تصحيح أخطاء الأخشاب العامة أن HCTAGGER هو نهج دقيق وأسرع بكثير من العديد من النماذج الموجودة.
نهج تحديد استعارة الحديثة النظر أساسا في ميزات النص السياقية في غضون جملة أو إدخال ميزات لغوية خارجية إلى النموذج. لكنهم عادة ما يتجاهلون المعلومات الإضافية التي يمكن أن توفرها البيانات، مثل معلومات الاستعارة السياقية ومعلومات الخطاب الأوسع نطاقا. في هذه الورقة، نقترح نموذجا تم تزويده بتمثيل سياقي هرمي لاستخراج مزيد من المعلومات من كل من مستوى الجملة ومستوى الخطاب. على مستوى الجملة، نستفيد من معلومات الاستعارة من الكلمات التي تبادل الكلمة المستهدفة في الجملة لتعزيز قدرة المنطق على نموذجنا عبر تمثيل محسن محسن على الملصقات. عند مستوى الخطاب، يتم اعتماد شبكة الذاكرة العالمية التي تدركها لتعلم التبعية بعيدة المدى بين نفس الكلمات داخل خطاب. أخيرا، يجمع نموذجنا بين التمثيلات التي تم الحصول عليها من هذين الجزأين. تظهر نتائج التجربة على مهمتين لمجموعة بيانات VUA أن طرازنا يتفوق على كل طريقة أخرى لا تستخدم أي معرفة خارجية أيضا باستثناء ما يحتوي نموذج اللغة المدربة مسبقا عليه.
تصنيف النص القصير هو مهمة أساسية في معالجة اللغة الطبيعية.من الصعب بسبب عدم وجود معلومات السياق والبيانات المسمى في الممارسة العملية.في هذه الورقة، نقترح طريقة جديدة تسمى SHINE، والتي تعتمد على الشبكة العصبية الرسم البيانية (GNN)، لتصنيف النص القصير. أولا، نقوم بنمذت مجموعة بيانات النص القصيرة كشركة بيانية غير متجانسة هرمية تتكون من رسومات مكونة على مستوى Word والتي تقدم معلومات أكثر دلالة ونقصية.بعد ذلك، نتعلم ديناميكيا رسم بياني مستند قصير يسهل نشر الملصقات الفعالة بين النصوص القصيرة المشابهات.وبالتالي، فإن المقارنة مع الأساليب القائمة على GNN القائمة، والتألق يمكن أن يستغل أفضل التفاعلات بين العقد من نفس الأنواع والقبض على أوجه التشابه بين النصوص القصيرة.تظهر تجارب واسعة النطاق على مختلف مجموعات البيانات القصيرة القصيرة المعجمية أن التألق يتفوق باستمرار على الأساليب الحديثة، خاصة مع عدد أقل من الملصقات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا