ترغب بنشر مسار تعليمي؟ اضغط هنا

محادثة: أمرت جزئيا توليد البرامج النصية

proScript: Partially Ordered Scripts Generation

159   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

البرامج النصية - تسلسل الأحداث النموذجية التي تصف الأنشطة اليومية - تساعد في فهم الروايات من خلال توفير التوقعات، وحل الغموض، وملء المعلومات غير المستحقة. ومع ذلك، حتى الآن أثبتوا صعوبة في المؤلف أو استخراج النص. في هذا العمل، نوضح لأول مرة يمكن تصوير نماذج اللغات العصبية المدربة مسبقا لتوليد البرامج النصية عالية الجودة، في مستويات مختلفة من الحبيبية، لمجموعة واسعة من السيناريوهات اليومية (E.G.، خبز كعكة). للقيام بذلك، نقوم بجمع Growdsourced كبيرة (6.4K) من البرامج النصية التي أمرت جزئيا (المسمى المحترفات)، وهي أكبر بكثير من مجموعات البيانات السابقة، وتطوير النماذج التي تولد البرامج النصية من خلال الجمع بين توليد اللغة والتنبؤ بنية الرسم البياني. نحدد اثنين من المهام التكميلية: (1) التنبؤ الحافة: بالنظر إلى السيناريو والأحداث غير المدرجة، قم بتنظيم الأحداث في البرنامج النصي ساري المفعول (ربما بالترتيب الجزئي)، و (2) جيل البرنامج النصي: معطى سيناريو فقط، توليد الأحداث وتنظيمها في البرنامج النصي (ربما النظام الجزئي). تظهر تجاربنا أن نماذجنا تؤدي جيدا (على سبيل المثال، F1 = 75.7 في المهمة (1))، مما يوضح نهجا جديدا للتغلب على الحواجز السابقة أمام جمع البرنامج النصي. نظهر أيضا أنه لا يزال هناك مجال مهم للتحسين نحو أداء مستوى الإنسان. معا، توفر المهام الخاصة بنا ومجموعة البيانات والنماذج اتجاها بحثا جديدا لتعلم معرفة البرنامج النصي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

معظم اللغات المفقودة التي لا تزال غير المفقودة تظهر خصائيتين تشكل تحديات فك شفرة كبيرة: (1) لا يتم تجزئة النصوص بالكامل في الكلمات؛ (2) لا يتم تحديد أقرب لغة معروفة. نقترح نموذج فك تشفير يعالج كل من هذه التحديات من خلال بناء القيود اللغوية الغنية الت ي تعكس أنماط ثابتة في تغيير الصوت التاريخي. نلقي التقاط الهندسة الصوتيات الطبيعية عن طريق التعلم Admanes Admingdings بناء على الأبجدية الصوتية الدولية (IPA). الإطار الولادة الناتج الناتج نماذج تجزئة الكلمات والمعالجة، على علم بالقيود الصوتية. نقيم النموذج على كل من اللغات المعتمدة (القوطية، Ugaritic) وواحدة غير ملائمة (iberian). تظهر التجارب أن دمج الهندسة الصوتية يؤدي إلى مكاسب واضحة ومتسقة. بالإضافة إلى ذلك، نقترح قياس التقارب اللغوي الذي يحدد بشكل صحيح اللغات ذات الصلة القوطية و Ugaritic. بالنسبة إلى Iberian، لا تظهر الطريقة أدلة قوية تدعم لغة الباسك بلغة ذات صلة، متفق عليها بالموقف المفضل من قبل المنح الدراسية الحالية
في هذه الورقة، نقدم مهمة التنبؤ بشدة من الجوانب التي يقيم بها العمر من محتوى السينما على أساس البرنامج النصي للحوار.إننا نحقق أولا تصنيف شدة الأفلام الترتيبية على 5 جوانب: الجنس والعنف والبهجة واستهلاك المواد المخدرة والمشاهد المخيفة.يتم التعامل مع ا لمشكلة باستخدام إطار عمل متعدد القائم على شبكة سيامي يعمل بشكل متزامن على تحسين إمكانية تفسير التنبؤات.تظهر النتائج التجريبية أن أسلوبنا تتفوق على نموذج الحالة السابقة للدولة السابقة ويوفر معلومات مفيدة لتفسير تنبؤات النموذج.يتم توفير مجموعة البيانات والمصدر المقترحة للجمهور في مستودع GitHub الخاص بنا.
توليد الاستجابات الإعلامية والمناسبة صعبة ولكنها مهمة لبناء أنظمة الحوار يشبه الإنسان. على الرغم من أن نماذج المحادثة المختلفة المعرفة قد اقترحت، إلا أن هذه النماذج لها قيود في الاستفادة من المعرفة التي تحدث بشكل غير منتظم في بيانات التدريب، ناهيك عن دمج المعرفة غير المرئية في جيل المحادثة. في هذه الورقة، نقترح طريقة تعلم التمثيل المتعصب للكيان (EARL) لإدخال الرسوم البيانية المعرفة لتوليد المحادثة بالمعلومات. على عكس الأساليب التقليدية التي تقترب المعلمة التمثيل المحدد لكل كيان، فإن إيرل يستخدم سياق المحادثات والهيكل العلائقي لرسوم البيان البيئية لمعرفة تمثيل الفئة للكيانات، المعمم لإدماج كيانات غير مرئية في الرسوم البيانية المعرفة في جيل المحادثة. التقييمات التلقائية واليدوية توضح أن طرازنا يمكن أن يولد ردود أكثر إعلامية ومتماسكة وغير طبيعية من النماذج الأساسية.
لتحديث ترجمات النظام الأساسي الياباني بناء على تعديلاتهم، نحتاج إلى النظر في الترجمة؛ "وهذا هو، يجب علينا فقط تعديل التعبيرات ذات الصلة بالتعديل والاحتفاظ بالآخرين لتجنب سوء فهم محتوياتها. في هذه الورقة، نقدم تقييما تقييما وجزعة لتحسين تقييمات التركي ز. يسمى Metric لدينا درجة شاملة للترجمة التفاضلية: (ISDIT). يتكون ISDIT من عاملين: (1) يتذكر N-Gram التعبيرات التي تتأثر بتعديلها و (2) الدقة N-Gram للمخرجات مقارنة بالرجوع إليها. يحل هذه المترية محل واحد موجود للهوية من خلال حساب جودة الترجمة في وقت واحد من التعبيرات التي تم تغييرها بالإضافة إلى ذلك من التعبيرات دون تغيير. كما نصدر حديثا على تجميع وجزعة للترجمة اليابانية للتعديل جزئيا تؤمن الترجمات بعد التعديل، في حين أن كوربوس التقييم الحالي لا. مع متري والجوربوس، ندرس أداء طرق الترجمة الحالية لترجمات التعديل الجزئي الياباني.
الملخص ندرس التعلم التعرف على الكيان المسمى في وجود التعليقات التوضيحية في الكيان المفقود.نحن نقترب من هذا الإعداد باسم وضع علامات مع المتغيرات الكامنة واقتراح خسارة جديدة، ونسبة الكيان المتوقعة، لتعلم النماذج بحضور العلامات المفقودة بشكل منهجي.نظرا لأن نهجنا صوتي من الناحية النظرية ومفيدة تجريبيا.تجريفيا، نجد أنه يجتمع أو يتجاوز أداء خطوط أساس قوية وحديثة من بين الفنون عبر مجموعة متنوعة من اللغات والسيناريوهات التوضيحية ومبالغ البيانات المسمى.على وجه الخصوص، نجد أنه يتفوق بشكل كبير على الطرق السابقة من الأساليب السابقة من Mayhew et al.(2019) ولي وآخرون.(2021) بواسطة +12.7 و +2.3 F1 النتيجة في بيئة صعبة مع فقط 1000 عرض توضيحية متحيزة، بلغ متوسطها عبر 7 مجموعات من مجموعات البيانات.نظهر أيضا أنه عندما يقترن نهجنا، فإن مخطط التعليق التوضيحي رواية متفوقة تفوق التعليق التوضيحي الشامل لميزانيات التوضيحية المتواضعة

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا