تعد تتبع ولاية الحوار (DST) مهمة فرعية لأنظمة الحوار القائمة على المهام حيث يتم تتبع نية المستخدم من خلال ثلاثة أضعاف ثلاثة ثلاث مرات يمكن أن يكون من الصعب تمديد طرازات DST الحالية لمجموعات بيانات جديدة مع مجالات / فتحات أكبر ترجع أساسا إلى أي من السببين - 1) تنبؤ فتحة المجال كزوج، والثاني) تبعية المعلمات النموذجية على عدد الفتحات والمجالات وبعد في هذا العمل، نقترح معالجة هذه المشكلات باستخدام نموذج DST الهرمي (Hi-DS). بدور معين، يكتشف النموذج أولا تغيير في المجال متبوعا بتنبؤ المجال إذا لزم الأمر. ثم تقرر إجراء مناسب لكل فتحة في المجالات المتوقعة ويجد قيمتها وفقا لذلك. المعلمات النموذجية ل HI-DST مستقلة عن عدد المجالات / الفتحات. نظرا للنمذجة الهرمية، فإنه يحقق O (| M | + | N |) تنبؤ الدولة المعتقد بدوره واحد حيث M و N هي مجموعة من المجالات الفريدة والفتحات على التوالي. نقول أن الهيكل الهرمي يساعد في نموذج الشرح ويجعله قابل للتوسيع بسهولة إلى مجموعات بيانات جديدة. تشير التجارب في مجموعة بيانات MultiWoz إلى أن نموذجنا المقترح يحقق أداء دقة مشتركة قابلة للمقارنة بنماذج DST الحديثة.
Dialogue State Tracking (DST) is a sub-task of task-based dialogue systems where the user intention is tracked through a set of (domain, slot, slot-value) triplets. Existing DST models can be difficult to extend for new datasets with larger domains/slots mainly due to either of the two reasons- i) prediction of domain-slot as a pair, and ii) dependency of model parameters on the number of slots and domains. In this work, we propose to address these issues using a Hierarchical DST (Hi-DST) model. At a given turn, the model first detects a change in domain followed by domain prediction if required. Then it decides suitable action for each slot in the predicted domains and finds their value accordingly. The model parameters of Hi-DST are independent of the number of domains/slots. Due to the hierarchical modeling, it achieves O(|M|+|N|) belief state prediction for a single turn where M and N are the set of unique domains and slots respectively. We argue that the hierarchical structure helps in the model explainability and makes it easily extensible to new datasets. Experiments on the MultiWOZ dataset show that our proposed model achieves comparable joint accuracy performance to state-of-the-art DST models.
References used
https://aclanthology.org/
In task-oriented dialogue systems, recent dialogue state tracking methods tend to perform one-pass generation of the dialogue state based on the previous dialogue state. The mistakes of these models made at the current turn are prone to be carried ov
Dialogue State Tracking is central to multi-domain task-oriented dialogue systems, responsible for extracting information from user utterances. We present a novel hybrid architecture that augments GPT-2 with representations derived from Graph Attenti
Recently, the focus of dialogue state tracking has expanded from single domain to multiple domains. The task is characterized by the shared slots between domains. As the scenario gets more complex, the out-of-vocabulary problem also becomes severer.
Abstract Tracking dialogue states to better interpret user goals and feed downstream policy learning is a bottleneck in dialogue management. Common practice has been to treat it as a problem of classifying dialogue content into a set of pre-defined s
We present a fast and scalable architecture called Explicit Modular Decomposition (EMD), in which we incorporate both classification-based and extraction-based methods and design four modules (for clas- sification and sequence labelling) to jointly e