تتيح العديد من أنظمة المراسلة الحديثة الاتصالات النصية سريعة ومتزامنة بين العديد من المستخدمين. تسلسل الرسائل الناتجة يخفي بنية أكثر تعقيدا في محادثات فرعية مستقلة متشابكة مع بعضها البعض. يشكل هذا تحديا لأي مهمة تهدف إلى فهم محتوى سجلات الدردشة أو جمع المعلومات منها. تتمثل القدرة على فك هذه المحادثات بعد ذلك بمثابة نجاح العديد من المهام المصب مثل التلخيص والإجابة على الأسئلة. يتم استخدام المعلومات المهيكلة المصاحبة للنص مثل بدوره المستخدم، يذكر المستخدم، الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الزمنية، كإجراء يقدم من قبل المشاركين أنفسهم الذين يحتاجون إلى اتباع المحادثة ويبضاهم مهمين للإجراءات. تعد DAG-LSTMS، وتعميم الأشجار LSTMS التي يمكن أن تتعامل مع تبعيات أنديكليكوس الموجهة، وسيلة طبيعية لإدماج هذه المعلومات وطبيعتها غير المتسلسلة. في هذه الورقة، نطبق DAG-LSTMS بمهمة محادثة محادثة المحادثة. نحن نقوم بإجراء تجاربنا على مجموعة بيانات أوبونتو IRC. نظرا لأن النموذج الجديد الذي نقترحه يحقق حالة الوضع الفني في مهمة استعادة العلاقات الردية وتنافسية على مقاييس المنظمات الأخرى.
Many modern messaging systems allow fast and synchronous textual communication among many users. The resulting sequence of messages hides a more complicated structure in which independent sub-conversations are interwoven with one another. This poses a challenge for any task aiming to understand the content of the chat logs or gather information from them. The ability to disentangle these conversations is then tantamount to the success of many downstream tasks such as summarization and question answering. Structured information accompanying the text such as user turn, user mentions, timestamps, is used as a cue by the participants themselves who need to follow the conversation and has been shown to be important for disentanglement. DAG-LSTMs, a generalization of Tree-LSTMs that can handle directed acyclic dependencies, are a natural way to incorporate such information and its non-sequential nature. In this paper, we apply DAG-LSTMs to the conversation disentanglement task. We perform our experiments on the Ubuntu IRC dataset. We show that the novel model we propose achieves state of the art status on the task of recovering reply-to relations and it is competitive on other disentanglement metrics.
المراجع المستخدمة
https://aclanthology.org/
يستخدم تعليم التمثيل على نطاق واسع في NLP لمجموعة واسعة من المهام.ومع ذلك، غالبا ما تعكس التمثيلات المستمدة من Text Corpora التحيزات الاجتماعية.هذه الظاهرة منتشرة ومتسقة عبر نماذج عصبية مختلفة، مما تسبب في قلق شديد.تعتمد الأساليب السابقة في الغالب عل
يمكن أن أنظمة البحث عن المحادثة الناجحة تجربة تسوق طبيعية وتكيفية وتفاعلية لعملاء التسوق عبر الإنترنت. ومع ذلك، فإن بناء هذه الأنظمة من الصفر تواجه تحديات الكلمة الحقيقية من كل من مخطط المنتج / المعرفة غير الصحيحة ونقص بيانات حوار التدريب. في هذا الع
حققت نماذج اللغة المدربة مسبقا نجاحا كبيرا على مجموعة واسعة من مهام NLP. ومع ذلك، فإن التمثيلات السياقية من النماذج المدربة مسبقا تحتوي على معلومات دلالية ومتنامية متشابكة، وبالتالي لا يمكن استخدامها مباشرة لاستخلاص مدينات جملة دلالية مفيدة لبعض المه
الشبكات العصبية العميقة لمعالجة اللغات الطبيعية هشة في مواجهة أمثلة الخصومة --- اضطرابات صغيرة في الإدخال، مثل استبدال مرادف أو تكرار Word، والذي يسبب شبكة عصبية لتغيير تنبؤها.نقدم نهجا لإنشاء متانة LSTMS (وملحقات LSTMS) ونماذج التدريب التي يمكن اعتم
تهدف الترجمة التكيفية إلى تضمين ملاحظات المستخدمين بشكل حيوي لتحسين جودة الترجمة. في سيناريو ما بعد التحرير، يتم إدراج تصحيحات المستخدم لإخراج الترجمة الآلي باستمرار في نماذج الترجمة، أو تقليل أو إلغاء تحرير الأخطاء المتكررة وزيادة فائدة الترجمة الآل