ترغب بنشر مسار تعليمي؟ اضغط هنا

التنبؤ بأشجار الخطاب من الملخصات العصبية القائمة على المحولات

Predicting Discourse Trees from Transformer-based Neural Summarizers

387   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يشير العمل السابق إلى أن معلومات خطاب المعلومات المتعلقة بالتلخيص.في هذه الورقة، نستكشف ما إذا كان هذا التآزر بين الخطاب والتلخيص ثنائي الاتجاه، من خلال استنتاج أشجار الخطاب على مستوى المستند من الملخصات العصبية المدربة مسبقا.على وجه الخصوص، نولد أشجار خطاب على الطراز الأول غير المسموح به من مصفوفات الانتباه الذاتي لنموذج المحول.تكشف التجارب عبر النماذج ومجموعات البيانات أن الملخصات تتعلم كل من معلومات الخطاب على حد سواء، والاعتماد على نمط الدوائر الانتخابية، والتي يتم ترميزها عادة في رأس واحد، تغطي تبعيات الخطاب طويلا وقصيرا.بشكل عام، تشير النتائج التجريبية إلى أن معلومات الخطاب المستفادة عامة ومباشرة قابلة للتحويل.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

ينطوي تقسيم الجملة تجزئة جملة إلى جملتين أقصرين أو أكثر. إنه مكون رئيسي لبسط الجملة، وقد ثبت أن تساعد الفهم البشري وهي خطوة مسبقة مسبقة مسبقة مفيدة لمهام NLP مثل استخراج التلخيص والعلاقات. في حين أن العديد من الطرق والجماعات البيانات المقترحة قد اقتر حت لتطوير نماذج تقسيم الجملة، فقد تم إيلاء القليل من الاهتمام لكيفية تفاعل تقسيم الجملة مع هيكل الخطاب. في هذا العمل، نركز على الحالات التي يحتوي فيها نص الإدخال على اتصال خطاب، والتي نشير إليها كقامة عقوبة قائمة على الخطاب. نقوم بإنشاء مجموعات بيانات صناعية وعضوية لتقسيم الخطاب واستكشاف طرق مختلفة للجمع بين مجموعات البيانات هذه باستخدام بنية نموذجية مختلفة. نظهر أن نماذج خطوط الأنابيب التي تستخدم هيكل الخطاب للتوسط في جملة تقسيم النماذج المنفقة المناسبة في تعلم الطرق المختلفة للتعبير عن علاقة خطاب ولكن توليد نص أقل نحوية؛ توفر تلك البيانات الاصطناعية على نطاق واسع أساسا أفضل للتعلم من البيانات العضوية النطاق الصغيرة؛ وهذا التدريب على التركيز على الخطاب، وليس على بيانات تقسيم الجملة العامة يوفر أساسا أفضل لتقسيم الخطاب.
ركزت معظم الدراسات الحالية للاستخدام اللغوي في محتوى الوسائط الاجتماعية على الميزات اللغوية على مستوى السطح (على سبيل المثال، كلمات الوظائف وعلامات الترقيم) وجوانب المستوى الدلالي (على سبيل المثال، الموضوعات والمعنويات والعواطف) للتعليقات. لم يتم است كشاف استراتيجيات الكاتب لبناء وربط قطاعات النص على نطاق واسع على الرغم من أن هذه المعرفة من المتوقع أن تتخلص الضوء على كيفية سبب الناس في البيئات عبر الإنترنت. المساهمة في هذا الاتجاه التحليل لدراسات وسائل التواصل الاجتماعي، نبني نظام تحليل عصبي عصبي يمكن الوصول إليه علنا ​​يحلل علاقات الخطاب في تعليق عبر الإنترنت. توضح تجاربنا أن هذا النظام يحقق أداء مماثل بين جميع أنظمة التحليل العصبي العصبي. لإظهار استخدام هذه الأداة في تحليل وسائل التواصل الاجتماعي، فإننا نطبق عليه لتحديد علاقات الخطاب في تعليقات مقنعة وغير مقنعة وفحص العلاقات بين عمق شجرة الخطاب الثنائي، وعلاقات الخطاب، والإقناع المتصور للتعليقات عبر الإنترنت. يوضح عملنا إمكانية تحليل هياكل خطاب التعليقات عبر الإنترنت مع نظامنا وآثار هذه الهياكل لفهم الاتصالات عبر الإنترنت.
تقدم هذه الورقة طريقة تلخيص عالمية لتعليقات الرياضة الحية التي لدينا ملخص مكتوب بشري متاح.تستند هذه الطريقة إلى ملخص مولد عصبي.يتم تقييد كمية البيانات المتاحة للتدريب مقارنة بالشريعة المستخدمة عادة من قبل الملخصات العصبية.نقترح لمساعدة الملخص على الت علم من كمية محدودة من البيانات عن طريق الحد من انتروبيا من نصوص الإدخال.يتم تنفيذ هذه الخطوة من خلال تصنيف إلى فئات مستمدة من تحليل مفصل للملخصات التي كتبها الإنسان.نظهر أن الترشيح يساعد نظام التلخيص للتغلب على نقص الموارد.ومع ذلك، ظهرت عدة نقاط تحسين من هذه الدراسة الأولية، والتي نناقشها وتخطط لتنفيذها في العمل في المستقبل.
المعردات التفسيرية مجردة للتوقعات النموذجية هي حاسمة في التطبيقات العملية.نحن نطور النماذج العصبية التي تمتلك عملية استنتاجية مفسضة لتحليل التبعية.تتبنى نماذجنا الاستدلال المستند إلى المثيل، حيث يتم استخراج حواف التبعية ومسمى من خلال مقارنةها بالحواف في مجموعة تدريبية.يتم استخدام حواف التدريب صراحة للتنبؤات؛وبالتالي، من السهل فهم مساهمة كل حافة إلى التنبؤات.تظهر تجاربنا أن النماذج القائمة على مثيل لدينا تحقق دقة تنافسية مع النماذج العصبية القياسية ولديها المعقول المعقولة من التفسيرات القائمة على المثيل.
آلة قراءة الآلة (MRC) هي واحدة من أكثر المهام تحديا في مجال معالجة اللغة الطبيعية. تم تحقيق نتائج أحدث حديثة ل MRC بنماذج اللغة المدربة مسبقا، مثل بيرت وتعديلاتها. على الرغم من ارتفاع الأداء لهذه النماذج، إلا أنهم لا يزالون يعانون من عدم القدرة على ا سترداد الإجابات الصحيحة من الممرات التفصيلية الطويلة. في هذا العمل، نقدم مخططا جديدا لإدماج هيكل الخطاب للنص في شبكة انتباهي، وبالتالي إثراء التضمين الذي تم الحصول عليه من ترميز بيرت القياسي مع المعرفة اللغوية الإضافية. نحقق أيضا في تأثير أنواع مختلفة من المعلومات اللغوية عن قدرة النموذج على الإجابة على الأسئلة المعقدة التي تتطلب فهم عميق للنص بأكمله. أظهرت التجارب التي تم إجراؤها على مرجع الفريق وأكثر تعقيدا عن مجموعات بيانات الأجابة أن المعزز اللغوي يعزز أداء نموذج بيرت القياسي بشكل كبير.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا