ترغب بنشر مسار تعليمي؟ اضغط هنا

ليس فقط التصنيف: التعرف على علاقة خطاب ضمني على النمذجة المشتركة للتصنيف والجيل

Not Just Classification: Recognizing Implicit Discourse Relation on Joint Modeling of Classification and Generation

360   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التعرف على علاقة الخطاب الضمني (IDRR) هو مهمة حاسمة في تحليل الخطاب. الدراسات السابقة فقط اعتبارها مهمة التصنيف وتفتقر إلى فهم متعمق لدل العلاقات المختلفة. لذلك، نرى أولا EDRR كامرأة توليد ومزيد من اقتراح طريقة النمذجة المشتركة للتصنيف والجيل. على وجه التحديد، نقترح نموذجا مشتركا، CG-T5، للتعرف على تسمية العلاقة وتوليد الجملة المستهدفة التي تحتوي على معنى العلاقات في وقت واحد. علاوة على ذلك، نقوم بتصميم ثلاث نماذج جملة مستهدفة، بما في ذلك نموذج الأسئلة، لنموذج الجيل لإدماج المعرفة السابقة. لمعالجة مشكلة أن وحدات الخطاب الكبيرة غير متضمنة بالكاد في الجملة المستهدفة، نقترح أيضا آلية بناء الجملة المستهدفة التي تستخرج الجمل الأساسية تلقائيا من تلك الوحدات الخطابية الكبيرة. تظهر النتائج التجريبية على حد سواء على مجموعات بيانات MCDTB والإنجليزية الصينية أن نموذج CG-T5 لدينا يحقق أفضل أداء ضد العديد من الأنظمة الحديثة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تصف هذه الورقة تقديمنا إلى Thesemeval'21: المهمة 7- Hahackathon: الكشف عن الفكاهة والجريمة.في هذا التحدي، نستكشف معدل تكبير متوسطة، وتعزيز الترجمة، والتعلم المتعدد الكثافة، وتمييز نماذج اللغة المختلفة.من الغريب، لا يحسن الثمينة والخلفية المتوسطة الأد اء، في حين أن التعلم المتعدد والكمال يحسن الأداء.نستكشف لماذا لا توفر الدفعة المتوسطة والخلفية نفس الفائدة مثل مهام معالجة اللغة الطبيعية الأخرى وتوفر نظرة ثاقبة في الأخطاء التي يصنعها طرازنا.أفضل نظام أداء لدينا يحتل المرتبة السابعة على المهمة 1BWith RMSE من 0.5339
تهدف التعرف على علاقة الخطاب الضمني (IDRR) إلى تحديد العلاقات المنطقية بين جملتين مجاورة في الخطاب.تفشل النماذج الحالية في الاستفادة الكاملة من المعلومات السياقية التي تلعب دورا مهما في تفسير كل جملة محلية.في هذه الورقة، فإننا نقترحنا بالتالي شبكة تت بع السياق في الرسم البياني القائمة على الرسم البياني (شبكة CT) لنموذج سياق الخطاب ل IDRR.تقوم CT-Net أولا بتحويل الخطاب في الرسم البياني لرابطة الفقرة (PAG)، حيث تتبع كل جملة سياقها المرتبطة ارتباطا وثيقا من الخطاب المعقد من خلال أنواع مختلفة من الحواف.بعد ذلك، استخراج CT-NET تمثيل سياقي من PAG من خلال آلية تحديث تم تصميمه خصيصا، مما يمكن أن يدمج بفعالية من كل من دلالات السياق على مستوى الجملة ومستوى الرمز المميز.تشير التجارب على PDTB 2.0 إلى أن شبكة CT-NET أكبر أداء أفضل من النماذج التي نموذجها تقريبا السياق.
يتعرف محللون المحاورون على العلاقات المتعمدة والتنزاعية التي تنظم النصوص الموسعة. لقد كان لديهم تأثير كبير على مجموعة متنوعة من مهام NLP وكذلك الدراسات النظرية في اللغويات والعلوم المعرفية. ومع ذلك، غالبا ما يكون من الصعب تحقيق نتائج جيدة من نماذج ال خطاب الحالية، ويعزى ذلك إلى حد كبير إلى صعوبة المهمة، لا سيما الاعتراف بعلاقات الخطاب الضمني. أظهرت التطورات الأخيرة في النماذج القائمة على المحولات وعد كبير على هذه التحليلات، لكن التحديات لا تزال تبقى. نقدم ورقة وضع توفر تحليلا منهيا لحالة محلل خطاب الفن. نحن نهدف إلى فحص أداء نماذج تحليل الخطاب الحالي عبر نوبة المجال التدريجي: داخل Corpus، على النصوص داخل المجال، وعلى النصوص خارج المجال، ونناقش الاختلافات بين النماذج القائمة على المحولات والنماذج السابقة في التنبؤ بأنواع مختلفة من العلاقات الضمنية كل من العلاقات الأساسية. نستنتج عن طريق وصف العديد من أوجه القصور في النماذج الحالية ومناقشة حول كيفية اتباع العمل في المستقبل هذه المشكلة.
في تصنيف علاقة الخطاب الضمني، نريد التنبؤ بالعلاقة بين الجمل المجاورة في غياب أي اتصال خطاب علني. هذا أمر صعب حتى بالنسبة للبشر، مما يؤدي إلى نقص البيانات المشروح، وهي حقيقة تجعل المهمة أكثر صعوبة في نهج التعلم الآلي الإشراف. في الدراسة الحالية، نؤدي تصنيف علاقة الخطاب الضمني دون الاعتماد على أي علاقة ضمنية المسمى. نحن غاضب من عدم وجود بيانات من خلال تفسير العلاقات الضمنية لتقليل المهمة إلى مشكلتين فرعيين: نمذجة اللغة وتصنيف علاقة خطاب صريحة، مشكلة أسهل بكثير. تبين نتائجنا التجريبية أن هذه الطريقة يمكن أن تتفوق حتى الآن على الرغم من أن الحديث، على الرغم من أن تكون أبسط بكثير من النماذج البديلة لأداء مماثل. علاوة على ذلك، نوضح أن الأداء المحقق قوي عبر المجالات كما اقترحته التجارب الصفرية في مجال مختلف تماما. يشير هذا إلى أن التطورات الحديثة في النمذجة اللغوية جعلت نماذج لغة جيدة بما فيه الكفاية في التقاط علاقات بين الجملة دون مساعدة من علامات الخطاب الصريحة.
في مهام توليد اللغة الطبيعية، يتم استخدام نموذج لغة عصبي لتوليد سلسلة من الكلمات التي تشكل جملة.يمكن اعتبار مصفوفة الوزن الأعلى من طراز اللغة، المعروف باسم طبقة التصنيف، كمجموعة من المتجهات، كل منها يمثل كلمة مستهدفة من قاموس الهدف.يتم تعلم ومكافحة ا لكلمات المستهدفة، إلى جانب بقية المعلمات النموذجية، أثناء التدريب.في هذه الورقة، نقوم بتحليل الممتلكات المشفرة في المتجهات المستهدفة والسؤال على ضرورة تعلم هذه المتجهات.نقترح تعيين ناقلات المستهدفة بشكل عشوائي وتحديدها على أنها ثابتة حتى يتم إجراء تحديثات للأوزان أثناء التدريب.نظهر أنه من خلال استبعاد ناقلات التحسين، ينخفض عدد المعلمات بشكل كبير مع تأثير هامشي على الأداء.نوضح فعالية طريقتنا في التسمية التوضيحية للصورة والترجمة الآلية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا