تهدف مهمة إعادة كتابة الحوار إلى إعادة بناء أحدث كلام الحوار عن طريق نسخ المحتوى المفقود من سياق الحوار.حتى الآن، تعاني النماذج الحالية لهذه المهمة من مشكلة المتانة، أي أن يؤدي العروض بشكل كبير عند الاختبار على مجموعة مختلفة.نحن نتطلع إلى هذه القضية المتناقصة من خلال اقتراح نموذج يستند إلى تسلسل الرواية بحيث يتم تقليل مساحة البحث بشكل كبير، ومع ذلك، فإن جوهر هذه المهمة لا يزال مغطى جيدا.كمسألة مشتركة من طرازات العلامات في توليد النص، قد تفتقر مخرجات النموذج إلى الطلاقة.لتخفيف هذه المسألة، نفنق إشارة الخسارة من بلو أو GPT-2 بموجب إطار تعزيز.تظهر التجارب تحسينات هائلة في النموذج لدينا عبر الأنظمة الحالية التي من بين الفنون عند النقل إلى مجموعة بيانات أخرى.
The task of dialogue rewriting aims to reconstruct the latest dialogue utterance by copying the missing content from the dialogue context. Until now, the existing models for this task suffer from the robustness issue, i.e., performances drop dramatically when testing on a different dataset. We address this robustness issue by proposing a novel sequence-tagging-based model so that the search space is significantly reduced, yet the core of this task is still well covered. As a common issue of most tagging models for text generation, the model's outputs may lack fluency. To alleviate this issue, we inject the loss signal from BLEU or GPT-2 under a REINFORCE framework. Experiments show huge improvements of our model over the current state-of-the-art systems when transferring to another dataset.
المراجع المستخدمة
https://aclanthology.org/
نقدم مجموعة بيانات جديدة لإعادة كتابة الأسئلة في سياق المحادثة (QRECC)، والتي تحتوي على محادثات 14 ألف مع أزواج من الإجابات السؤال 80k.تتمثل المهمة في QRECC في العثور على إجابات على أسئلة المحادثة داخل مجموعة من صفحات الويب 10 أمتار (تقسيم إلى 54 متر
تصف هذه الورقة نظام مقترح لمهمة IWPT 2021 المشتركة بشأن التحليل في التبعيات العالمية المعززة (EUD).نقترح نظام مقرها إعادة كتابة الرسم البياني لحساب التبعيات العالمية المحسنة، بالنظر إلى التبعيات العالمية الأساسية (UD).
إن دمج مصادر المعرفة الخارجية بفعالية في المحادثات هي مشكلة طويلة الأمد في أبحاث الحوار مفتوح المجال. إن الأدبيات الموجودة على اختيار المعرفة المفتوحة للمجال محدود ويقتصر بعض الافتراضات الهشة على مصادر المعرفة لتبسيط المهمة الشاملة، مثل وجود عقوبة مع
أصبحت الرسوم البيانية المستمدة وتعديل الرسوم البيانية من نص اللغة الطبيعية تقنية أساس متعدد الاستخدامات لاستخراج المعلومات مع التطبيقات في العديد من المواد الفرعية، مثل بناء الرسم البياني الدلالي أو المعرفة الرسم البياني. استخدم العمل الأخير هذه التق
تم تطبيق نماذج التسلسل إلى التسلسل على مجموعة واسعة من مهام NLP، ولكن كيفية استخدامها بشكل صحيح لتتبع حالة الحوار بشكل منهجي. في هذه الورقة، ندرس هذه المشكلة من وجهات نظر أهداف ما قبل التدريب وكذلك تنسيقات تمثيلات السياق. نوضح أن اختيار الهدف ما قبل