ترغب بنشر مسار تعليمي؟ اضغط هنا

Dreecdial 2.0: مجموعة متوازية ثنائية اللغة توصية المحادثة

DuRecDial 2.0: A Bilingual Parallel Corpus for Conversational Recommendation

352   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم مجموعة بيانات توصية ثنائية اللغة بالتوازي ثنائية اللغة (Dreecdial 2.0) لتمكين الباحثين من استكشاف مهمة صعبة في توصية محادثة متعددة اللغات ومتعددة اللغات. الفرق بين Dreecdial 2.0 ومجموعات بيانات توصية المحادثة الحالية هو أن عنصر البيانات (الملف الشخصي والهدف والمعرفة والسياق، والاستجابة) في Dreecdial 2.0 يتم تفاحيا بلغتين، الإنجليزية والصينية، في حين أن مجموعات البيانات الأخرى بنيت مع إعداد لغة واحدة. نقوم بجمع مربعات الحوار 8.2k محاذاة على اللغات الإنجليزية والصينية (16.5 ألف مربع حوار وأحدث 255 ألفا في المجموع) المشروح من قبل عمال التعيد الجماعي مع إجراء مراقبة الجودة الصارم. ثم نقوم ببناء خطوط خطوط خطوط محادثة محادثة مونولجة متعددة اللغات متعددة اللغات على Dreecdial 2.0. تشير نتائج التجربة إلى أن استخدام بيانات اللغة الإنجليزية الإضافية يمكن أن يحقق تحسين الأداء لتوصية التحدث الصينية، مما يشير إلى فوائد Dreecdial 2.0. أخيرا، توفر هذه البيانات هذه البيانات اختبارا صعبة للدراسات المستقبلية لتوصية محادثة مونولينغ متعددة اللغات والتعددية اللغوية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

المحادثات التي تهدف إلى تحديد التوصيات الجيدة هي تكرار الطبيعة. غالبا ما يعبر الناس عن تفضيلاتهم من حيث نقد التوصية الحالية (على سبيل المثال، لا يبدو جيدا لتاريخ "")، مما يتطلب درجة من الحس السليم للحصول على تفضيل يستنتج. في هذا العمل، نقدم طريقة لتح ويل نقد المستخدم إلى تفضيل إيجابي (E.G.، أفضل المزيد من الرومانسية ") من أجل استرداد المراجعات المتعلقة بالتوصيات التي يحتمل أن تكون أفضل (على سبيل المثال، مثالية لعشاء رومانسي"). نستفيد نموذجا كبيرا باللغة العصبية (LM) في بيئة قليلة لإجراء تحول من النقد إلى التفضيل، ونحن نختبر طريقتين لاسترداد التوصيات: واحد يطابق المضبوطات، وآخر أن يضغط غرامة على المهمة وبعد نحن نبذ هذا النهج في مجال المطعم وتقييمه باستخدام مجموعة بيانات جديدة من انتقادات المطعم. في دراسة الاجتثاث، نوضح أن استخدام التحول في النقد إلى تحسين التوصيات يحسن التوصيات، وأن هناك ثلاثة قضايا عامة على الأقل تفسر هذا الأداء المحسن.
تقدم هذه الورقة طريقة لتحديد أنماط قواعد اللغة الثنائية الثابتة وتستقل مثيلات العبارات ثنائية اللغة من زوج الجملة الإنجليزي - الصينية.في نهجنا، يتم تحليل زوج الجملة الإنجليزية الصينية لتحديد أنماط القواعد الإنجليزية والنظرات الصينية.تنطوي الطريقة على توليد ترجمات كل نمط قواعد اللغة الإنجليزية وحساب احتمال ترجمة الكلمات من كورسا الموازية الكلمة المحاذاة.تسمح لنا النتائج باستخراج أزواج العبارات الإنجليزية الأكثر احتمالا في زوج الجملة.نقدم نظام نموذجي ينطبق الطريقة لاستخراج أنماط القواعد والعبارات في الجمل الموازية.يوضح التقييم بشأن الأمثلة المختارة بشكل عشوائي من القاموس أن نهجنا لديه أداء جيد بشكل معقول.نحن نستخدم قاضي الإنسان لتقييم العبارات الثامنة الناتجة عن طريقنا.النتائج لديها إمكانية مساعدة تعلم اللغة وأبحاث الترجمة الآلية.
يوفر مورد Slokining تعيينات بين مجموعة متنوعة من العناصر الدلالية المعجمية، كل منها بنقاط القوة والضعف.للاستفادة من هذه الاختلافات، فإن القدرة على التحرك بين الموارد أمر ضروري.يصف هذا العمل التقدم المحرز لتحسين قابلية استخدام مورد SemLink: الإضافة ال تلقائية للحالات والتعيينات الجديدة والتصحيحات اليدوية والمتجهات اليدوية ومعلومات الرواد، والهندسة المعمارية التي تم بناؤها تلقائيا تحديث المورد عند إصدارات تغيير الموارد الأساسية.تعمل هذه التحديثات على تحسين التغطية، وتوفر أدوات جديدة للاستفادة من قدرات هذه الموارد، وتسهيل تحديثات سلسة، وضمان الاتساق وتطبيق هذه التعيينات في المستقبل.
تم إحراك المصالح المتزايدة في أنظمة الموافقة على المحادثة (CRS)، والتي تستكشف تفضيل المستخدم من خلال تفاعلات المحادثة من أجل تقديم توصية مناسبة. ومع ذلك، لا يزال هناك نقص في القدرة في CRS الحالية إلى (1) اجتياز مسارات التفكير المتعددة على المعرفة الأ ساسية لإدخال العناصر والسمات ذات الصلة، و (2) ترتيب كيانات مختارة بشكل مناسب بموجب نود النظام الحالي للسيطرة على جيل الاستجابة. لمعالجة هذه المشكلات، نقترح Walker CR-Walker في هذه الورقة، وهو نموذج يقوم بتنفيذ التفكير منظم في الأشجار في رسم بياني للمعرفة، ويولد أعمال حوار إعلامية لتوجيه توليد اللغة. ينظر المخطط الفريد من المنطق المنظم في الأشجار إلى الكيان اجتاز كل قفزة كجزء من أعمال الحوار لتسهيل توليد اللغة، والذي يربط كيف يتم اختيار الكيانات والأعرب عنها. تظهر التقييمات التلقائية والبشرية أن CR-Walker يمكن أن يصل إلى توصية أكثر دقة، وتوليد استجابات أكثر إعلامية وجذابة.
يسعى هذا البحث إلى تقديم بعض الاستراتيجيات التي يمكن اتباعها في دورات و مقرر ات المحادثة لمساعدة الطلاب على تخطي هذه العقبات من أجل الوصول إلى مُبتغاهم في التحدث باللغة الإنكليزية بطلاقة. فبالإضافة إلى التركيز على الدور المُناط بكل من المُدرس و ال مُتعلم نفسه و المادة العلمية و العملية التعليمية و سياقها في تعزيز الدافعية لدى المُتعلم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا