ترغب بنشر مسار تعليمي؟ اضغط هنا

في الآونة الأخيرة، تم توسيع تركيز تتبع حالة الحوار من مجال واحد إلى مجالات متعددة.تتميز المهمة بالفتحات المشتركة بين المجالات.نظرا لأن السيناريو يحصل على مزيد من المعقدة، تصبح مشكلة خارج المفردات أيضا شارما.النماذج الحالية ليست مرضية لحل تحديات تكامل الأطباق بين المجالات ومشاكل خارج المفردات.لمعالجة المشكلة، نستكشف الدلالية الهرمية من علم الأطباق ويعزز العلاقة بين الفتحات ذات الاهتمام الهرمي الملثم.في مرحلة فك قيمة الدولة، نحل المشكلة خارج المفردات من خلال الجمع بين طريقة التوليد وطريقة الاستخراج معا.نقيم أداء نموذجنا على مجموعة بيانات تمثيلية، MultiWoz باللغة الإنجليزية والكنيسة في الصينية.تظهر النتائج أن طرازنا يجرض مكسب أداء كبير على طراز تتبع الدولة الحديثة الحالية وهو أكثر قوة لمشكلة خارج المفردات مقارنة بالطرق الأخرى.
نماذج تتبع حكومية الحوار تلعب دورا مهما في نظام حوار موجه نحو المهام.ومع ذلك، فإن معظمهم يصطادون أنواع الفتحات بشكل مشروط بإدخال المدخلات بشكل مشروط.نكتشف أنه قد يتسبب في الخلط النموذج من خلال أنواع الفتحات التي تشترك في نفس نوع البيانات.لتخفيف هذه ا لمشكلة، نقترح Trippy-MRF و Trippy-LSTM النماذج التي تطرح الفتحات بشكل مشترك.تظهر نتائجنا أنهم قادرون على تخفيف الارتباك المذكور أعلاه، ويدفعون الحديث في DataSet MultiWoz 2.1 من 58.7 إلى 61.3.
تعد دول كيان تتبع مهمة معالجة لغات طبيعية تفترض أن تتطلب شرحا بشريا. من أجل تقليل الوقت والنفقات المرتبطة بالتعليق التوضيحي، نقدم طريقة جديدة لاستخراج حالات الكيان تلقائيا، بما في ذلك الموقع والوجود حالة الكيانات، بعد Dalvi et al. (2018) وتاندون وآخر ون. (2020). لهذا الغرض، نعتمد في المقام الأول على التمثيل الدلالي الناتج عن حالة محلل الحرف الحرفي الفن (Gung، 2020)، واستخراج الكيانات (مشاركين الأحداث) ودولهم، بناء على المسندات الدلالية للتمثيل الدليلي الذي تم إنشاؤه، وهو في تنسيق المنطق المقترح. للتقييم، استخدمنا Propara (Dalvi et al.، 2018)، وهي مجموعة بيانات لفهم القراءة التي يتم تفاحها مع الدول الكيانية في كل جملة، وتتبع تلك الدول في فقرات النصوص الإجرائية ذات التأليف البشري الطبيعي. بالنظر إلى القيود المقدمة من الطريقة، فإن خصائص شروح DataSet Propara، وأن نظامنا، Lexis، لا تستخدم بيانات التدريب الخاصة بمهام المهام وتعتمد فقط على Verbnet، والنتائج واعدة، وعرض قيمة الموارد المعجمية.
في أنظمة الحوار الموجهة نحو المهام، تميل أساليب تتبع حكومية الحوار الحديثة إلى أداء جيل تمرير واحد من حالة الحوار بناء على حالة الحوار السابقة. أخطاء هذه النماذج التي تم إجراؤها بدورها الحالي عرضة للنقل إلى المنعطف التالي، مما تسبب في نشر الأخطاء. في هذه الورقة، نقترح إنشاء جيل محدد للجانبين لتتبع حالة الحوار (AG-DST)، والذي يحتوي على عملية توليد تمريرة اثنين: (1) إنشاء حالة حوار بدائية تستند إلى حوار المنعطف الحالي ودولة الحوار السابقة و (2) تعديل حالة الحوار البدائي من المرور الأول. مع مرور الجيل المعدل الإضافي، يتم تكمل نموذجنا لمعرفة المزيد من تعقب حالة الحوار القوية من خلال تعديل الأخطاء التي لا تزال موجودة في حالة الحوار البدائية، والتي تلعب دور إعادة النظر في عملية الفحص المزدوج وتغطي بعد انتشار الأخطاء غير الضرورية. تظهر النتائج التجريبية أن AG-DST تتفوق بشكل كبير على الأعمال السابقة في مجموعة بيانات DST النشطة (MultiWoz 2.2 و Woz 2.0)، وتحقيق عروض جديدة من بين الفنون.
يتيح لنا إلينا التعلم عن تحويل طلقة الصفر لتتبع الدولة للحوار (DST) التعامل مع مجموعة متنوعة من مجالات الحوار الموجهة نحو المهام دون حساب جمع البيانات داخل المجال. في هذا العمل، نقترح نقل المعرفة عبر المهام من السؤال العام إجابة Corporing (QA) من أجل مهمة DST الصفرية. على وجه التحديد، نقترح TransforeQA، نموذج QA المولد القابل للتحويل يجمع بسلاسة بين QA الاستخراجية وجهاز QA متعدد الخيارات عبر إطار محول نص إلى نص، وتتبع كل من الفتحات الفئوية والفخات غير القشرية في DST. بالإضافة إلى ذلك، نقدم طريقتين فعاليتين لبناء أسئلة غير مرغوب فيها، أي أخذ عينات السؤال السلبية واقتطار السياق، مما تمكن نموذجنا للتعامل مع فتحات أي قيمة في إعداد DST الصفر. تشير التجارب الواسعة إلى أن نهجنا تحسن بشكل كبير من تسديدة صفرية القائمة وعدد قليل من النتائج على MultiWoz. علاوة على ذلك، مقارنة مع الأساس المدربين تدريبا كاملا في مجموعة بيانات الحوار الموجهة للمخطط، فإن نهجنا يظهر قدرة أفضل تعميم في المجالات غير المرئية.
تقارير الورقة هذه عن محرك الترجمة المصممة لاحتياجات حارس حدود الدولة البولندية.المحرك هو أحد مكونات نظام الباحث في منظمة العفو الدولية، الذي هو هدفه هو البحث عن نصوص الإنترنت، المكتوبة باللغة البولندية والروسية أو الأوكرانية أو البيلاروسية، والتي قد تؤدي إلى أعمال إجرامية على الحدود الشرقية للاتحاد الأوروبي.ويهدف النظام إلى المستخدمين البولنديين، وينبغي أن يعمل محرك الترجمة على مساعدة فهم المستندات غير البولندية.تم تدريب المحرك على نصوص المجال العام.تتألف التكيف عن النواب الإجرامي في الترجمة المناسبة للمصطلحات الجنائية والأسماء المناسبة، مثل الأسماء والألقاب والأعماد الجغرافية.تحتاج عملية الترجمة إلى مراعاة الانعطاف الغني الموجود في جميع لغات الاهتمام.تحقيقا لهذه الغاية، تم تطبيق طريقة استنادا إلى فك التشفير المقيد الذي يشتمل على المعجم المصنف في عملية الترجمة العصبية في المحرك.
نحن نقدم متعلما فونوتياكيا بسيطا وعالي للغاية يقوم بتحفيز شركة Automaton المحدودة المحدودة من بيانات نموذج Word.نحن تصف المتعلم وإظهار كيفية قيامه بتحديده للحث على اللغات العادية غير المقيدة، وكذلك كيفية تقييدها إلى بعض الفصول الدراسية غير النظامية م ثل لغات K-Local K-Local و K- الدقيقة.نقيم المتعلم في قدرته على تعلم القيود الشوئية في أمثلة اللعبة وفي مجموعات بيانات Quechua و Navajo.نجد أن المتعلم غير المقيد هو الأكثر دقة بشكل عام عند النمذجة أشكال تشهد في التدريب؛ومع ذلك، فإن المتعلم الذي يقتصر فقط على فئة اللغة بالعرق الصارم يلتقط بنجاح بعض القيود الفونية غير المخاطية.يخدم المتعلم لدينا كأساس أساليب أكثر تطورا.
الإدخال الإجمالي شائع في علم الصوتيات اللغوي والتشكيل.ومع ذلك، فإن النسخ بشكل رسمي على المطاعمين من الحجم غير المحدود، يتطلب الإدراج الكلي غير المقيد قوة حسابية خالية من السياق، في حين أن الأنماط الصوتية والمورفولوجية الأخرى منتظمة، أو حتى فرعية منتظ م.وبالتالي، فإن فئات اللغة الحالية التي تميز سلاسل مكررة تشمل حتما أنماط خالية من السياق بشكل حريص، مثل الانعكاسات.تمتد هذه الورقة لغات منتظمة لإدماج الإدراج عن طريق إدخال جهاز حسابي جديد: آلة مخزنة الحالة المختصة (FSBMS).نعطي التعريفات الرياضية وناقش بعض خصائص إغلاق المجموعة المقابلة من اللغات.نتيجة لذلك، تتميز فئة اللغات واللغات العادية المستمدة منها من خلال آلية النسخ.اقترحته الأدب السابق، يجب أن تتناول هذه الفئة من اللغات من توصيف مجموعات كلمة اللغة الطبيعية.
تعد تتبع ولاية الحوار (DST) مهمة فرعية لأنظمة الحوار القائمة على المهام حيث يتم تتبع نية المستخدم من خلال ثلاثة أضعاف ثلاثة ثلاث مرات يمكن أن يكون من الصعب تمديد طرازات DST الحالية لمجموعات بيانات جديدة مع مجالات / فتحات أكبر ترجع أساسا إلى أي من الس ببين - 1) تنبؤ فتحة المجال كزوج، والثاني) تبعية المعلمات النموذجية على عدد الفتحات والمجالات وبعد في هذا العمل، نقترح معالجة هذه المشكلات باستخدام نموذج DST الهرمي (Hi-DS). بدور معين، يكتشف النموذج أولا تغيير في المجال متبوعا بتنبؤ المجال إذا لزم الأمر. ثم تقرر إجراء مناسب لكل فتحة في المجالات المتوقعة ويجد قيمتها وفقا لذلك. المعلمات النموذجية ل HI-DST مستقلة عن عدد المجالات / الفتحات. نظرا للنمذجة الهرمية، فإنه يحقق O (| M | + | N |) تنبؤ الدولة المعتقد بدوره واحد حيث M و N هي مجموعة من المجالات الفريدة والفتحات على التوالي. نقول أن الهيكل الهرمي يساعد في نموذج الشرح ويجعله قابل للتوسيع بسهولة إلى مجموعات بيانات جديدة. تشير التجارب في مجموعة بيانات MultiWoz إلى أن نموذجنا المقترح يحقق أداء دقة مشتركة قابلة للمقارنة بنماذج DST الحديثة.
توضح هذه الورقة مشروعا فئة لدورة المرحلة الجامعية المرحلة الجامعية تم تقديمها مؤخرا يمنح طلاب علوم الكمبيوتر الفرصة لاستكشاف بيانات تحدي تتبع ولاية الحوار 2 (DSTC 2).تمت مناقشة خلفية الطلاب وخيارات المناهج الدراسية وتفاصيل المشروع.تختتم الورقة مع بعض المشورة المدرس والانعكاسات النهائية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا