ترغب بنشر مسار تعليمي؟ اضغط هنا

الجيل القائم على الشبكة العصبية من الملخصات الرياضية: دراسة أولية

Neural Network-Based Generation of Sport Summaries: A Preliminary Study

303   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة طريقة تلخيص عالمية لتعليقات الرياضة الحية التي لدينا ملخص مكتوب بشري متاح.تستند هذه الطريقة إلى ملخص مولد عصبي.يتم تقييد كمية البيانات المتاحة للتدريب مقارنة بالشريعة المستخدمة عادة من قبل الملخصات العصبية.نقترح لمساعدة الملخص على التعلم من كمية محدودة من البيانات عن طريق الحد من انتروبيا من نصوص الإدخال.يتم تنفيذ هذه الخطوة من خلال تصنيف إلى فئات مستمدة من تحليل مفصل للملخصات التي كتبها الإنسان.نظهر أن الترشيح يساعد نظام التلخيص للتغلب على نقص الموارد.ومع ذلك، ظهرت عدة نقاط تحسين من هذه الدراسة الأولية، والتي نناقشها وتخطط لتنفيذها في العمل في المستقبل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يشير العمل السابق إلى أن معلومات خطاب المعلومات المتعلقة بالتلخيص.في هذه الورقة، نستكشف ما إذا كان هذا التآزر بين الخطاب والتلخيص ثنائي الاتجاه، من خلال استنتاج أشجار الخطاب على مستوى المستند من الملخصات العصبية المدربة مسبقا.على وجه الخصوص، نولد أشج ار خطاب على الطراز الأول غير المسموح به من مصفوفات الانتباه الذاتي لنموذج المحول.تكشف التجارب عبر النماذج ومجموعات البيانات أن الملخصات تتعلم كل من معلومات الخطاب على حد سواء، والاعتماد على نمط الدوائر الانتخابية، والتي يتم ترميزها عادة في رأس واحد، تغطي تبعيات الخطاب طويلا وقصيرا.بشكل عام، تشير النتائج التجريبية إلى أن معلومات الخطاب المستفادة عامة ومباشرة قابلة للتحويل.
مقاييس التقييم التلقائية المستندة إلى المرجعية محدودة بشكل ملحوظ ل NLG بسبب عدم قدرتها على التقاط مجموعة كاملة من النواتج المحتملة.نحن ندرس بديلا للإشارة: تقييم كفاية الرسوم البيانية من جمل اللغة الإنجليزية التي تم إنشاؤها من الرسوم البيانية التمثيل المعنى التجريدي (AMR) عن طريق التحليل في عمرو ومقارنة التحليل مباشرة إلى المدخلات.نجد أن الأخطاء التي أدخلتها تحليل عمرو التلقائي تقيص بشكل كبير من فعالية هذا النهج، ولكن دراسة تحرير يدوية تشير إلى أنه نظرا لأن التحليل يحسن، فإن التقييم القائم على التحلل يحتوي على إمكانية تفوق معظم المقاييس المرجعية.
الأساليب الحديثة لتحليل الدوائر الانتخابية هي مناهج إشراف أحادية اللغات التي تتطلب كمية كبيرة من البيانات المسمى التي سيتم تدريبها على، مما يحد من فائدتها إلى حفنة فقط من لغات الموارد العالية فقط. لمعالجة هذه المسألة في هذه المسألة لغات الموارد المنخ فضة، نقترح نواعد الشبكة العصبية المتكررة عالمية (UNIRNNG) وهي متغير متعدد اللغات من نموذج قواعد الشبكة العصبية المتكررة (RNNG) المتكررة (RNNG) لتحليل الدوائر الانتخابية. ينطوي UNIRNNG على تعلم التحويل عبر اللغات لمهمة تحليل الدوائر الانتخابية. يتم إلهام بنية UNIRNNG من حيث المبدأ ونظرية المعلمة التي اقترحها نام تشومسكي. تستخدم UNIRNNG المعرفة النموذجية اللغوية المتاحة كقيم ميزة داخل قاعدة بيانات WALS، للتعميم على لغات متعددة. بمجرد التدريب على Corpus PolyGlot PolyGlot المتنوع بما فيه الكفاية، يمكن تطبيقه على أي لغة طبيعية مما يجعلها محلل الدائرة الانتخابية اللازمة للغات. تكشف التجارب أن نهج خطوط خط الأساس المتوفرة في UNIRNNG المتفوقة بالنسبة لنا أكبر من أجل معظم اللغات المستهدفة التي تم اختبارها.
في الترجمة الآلية المتزامنة، والعثور على وكيل مع تسلسل العمل الأمثل للقراءة والكتابة التي تحتفظ بمستوى عال من جودة الترجمة مع التقليل من التأخر المتوسط ​​في إنتاج الرموز المستهدفة لا يزال مشكلة صعبة للغاية. نقترح نهج تعليمي تحت إشراف رواية لتدريب وكي ل يمكنه اكتشاف الحد الأدنى لعدد القراءة المطلوبة لتوليد كل رمزية مستهدفة من خلال مقارنة الترجمات المتزامنة ضد ترجمات الجملة الكاملة أثناء التدريب لإنشاء تسلسل عمل أوراكل. يمكن بعد ذلك استخدام تسلسل أوراكل هذه لتدريب نموذج إشراف لتوليد العمل في وقت الاستدلال. يوفر نهجنا بديلا عن طرق التشكيل الحالية في الترجمة المتزامنة من خلال تقديم هدف تدريب جديد، وهو أمر أسهل للتدريب من المحاولات السابقة في تدريب الوكيل باستخدام تقنيات تعليم التعزيز لهذه المهمة. تظهر نتائجنا التجريبية أن طريقة التدريب الجديدة لتوليد العمل تنتج ترجمات عالية الجودة مع تقليل التأخر المتوسط ​​في الترجمة الفورية.
يسمح دفتر Jupyter لعلماء البيانات كتابة رمز تعلم الآلة مع وثائقها في الخلايا.في هذه الورقة، نقترح مهمة جديدة من توليد وثائق التعليمات البرمجية (CDG) لأجهزة الكمبيوتر المحمولة الحسابية.على النقيض من مهام CDG السابقة التي تركز على توليد وثائق لفظات شفر ة واحدة، في دفتر ملاحظات حسابي، غالبا ما يتوافق وثائق في خلية في خلية تخطيطية مع خلايا التعليمات البرمجية المتعددة، ولديها خلايا التعليمات البرمجية هذه هيكل متأصل.اقترحنا نموذجا جديدا (Haconvgnn) الذي يستخدم آلية اهتمام هرمي للنظر في خلايا التعليمات البرمجية ذات الصلة ومعلومات الرموز التعليمية ذات الصلة عند إنشاء الوثائق.تم اختباره على كوربوس جديد تم إنشاؤه من أجهزة كمبيوتر دفاتر Kaggle موثقة جيدا، نظرا لأن نموذجنا يفوق النماذج الأساسية الأخرى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا