يشير العمل السابق إلى أن معلومات خطاب المعلومات المتعلقة بالتلخيص.في هذه الورقة، نستكشف ما إذا كان هذا التآزر بين الخطاب والتلخيص ثنائي الاتجاه، من خلال استنتاج أشجار الخطاب على مستوى المستند من الملخصات العصبية المدربة مسبقا.على وجه الخصوص، نولد أشجار خطاب على الطراز الأول غير المسموح به من مصفوفات الانتباه الذاتي لنموذج المحول.تكشف التجارب عبر النماذج ومجموعات البيانات أن الملخصات تتعلم كل من معلومات الخطاب على حد سواء، والاعتماد على نمط الدوائر الانتخابية، والتي يتم ترميزها عادة في رأس واحد، تغطي تبعيات الخطاب طويلا وقصيرا.بشكل عام، تشير النتائج التجريبية إلى أن معلومات الخطاب المستفادة عامة ومباشرة قابلة للتحويل.
Previous work indicates that discourse information benefits summarization. In this paper, we explore whether this synergy between discourse and summarization is bidirectional, by inferring document-level discourse trees from pre-trained neural summarizers. In particular, we generate unlabeled RST-style discourse trees from the self-attention matrices of the transformer model. Experiments across models and datasets reveal that the summarizer learns both, dependency- and constituency-style discourse information, which is typically encoded in a single head, covering long- and short-distance discourse dependencies. Overall, the experimental results suggest that the learned discourse information is general and transferable inter-domain.
المراجع المستخدمة
https://aclanthology.org/
ينطوي تقسيم الجملة تجزئة جملة إلى جملتين أقصرين أو أكثر. إنه مكون رئيسي لبسط الجملة، وقد ثبت أن تساعد الفهم البشري وهي خطوة مسبقة مسبقة مسبقة مفيدة لمهام NLP مثل استخراج التلخيص والعلاقات. في حين أن العديد من الطرق والجماعات البيانات المقترحة قد اقتر
ركزت معظم الدراسات الحالية للاستخدام اللغوي في محتوى الوسائط الاجتماعية على الميزات اللغوية على مستوى السطح (على سبيل المثال، كلمات الوظائف وعلامات الترقيم) وجوانب المستوى الدلالي (على سبيل المثال، الموضوعات والمعنويات والعواطف) للتعليقات. لم يتم است
تقدم هذه الورقة طريقة تلخيص عالمية لتعليقات الرياضة الحية التي لدينا ملخص مكتوب بشري متاح.تستند هذه الطريقة إلى ملخص مولد عصبي.يتم تقييد كمية البيانات المتاحة للتدريب مقارنة بالشريعة المستخدمة عادة من قبل الملخصات العصبية.نقترح لمساعدة الملخص على الت
المعردات التفسيرية مجردة للتوقعات النموذجية هي حاسمة في التطبيقات العملية.نحن نطور النماذج العصبية التي تمتلك عملية استنتاجية مفسضة لتحليل التبعية.تتبنى نماذجنا الاستدلال المستند إلى المثيل، حيث يتم استخراج حواف التبعية ومسمى من خلال مقارنةها بالحواف
آلة قراءة الآلة (MRC) هي واحدة من أكثر المهام تحديا في مجال معالجة اللغة الطبيعية. تم تحقيق نتائج أحدث حديثة ل MRC بنماذج اللغة المدربة مسبقا، مثل بيرت وتعديلاتها. على الرغم من ارتفاع الأداء لهذه النماذج، إلا أنهم لا يزالون يعانون من عدم القدرة على ا