ترغب بنشر مسار تعليمي؟ اضغط هنا

تقدم هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى المهمة المشتركة MT Triangular 2021.نشارك في المهمة الروسية إلى الصينية بموجب الحالة المقيدة.نحن نستخدم بنية المحولات والحصول على أفضل أداء عبر متغير بأحجام أكبر معلمة.نقوم بإجراء بيانات مفصل ة مسبقا وتصفية البيانات المقدمة على نطاق ثنائي اللغة قدمها.تستخدم العديد من الاستراتيجيات لتدريب نماذجنا، مثل الترجمة متعددة اللغات، الترجمة الترجمة متعددة اللغات، الترجمة إلى الأمام، وتنظيم البيانات، ونقطة التفتيش المتوسطة، والوقاحة، والضبط الجميل، وما إلى ذلك. يحصل نظامنا على 32.5 بلو على مجموعة DEAS و 27.7 بلو على مجموعة الاختبار، أعلى الدرجات بين جميع التقديمات.
لفتت تلخيص الحوار اهتماما كبيرا مؤخرا. خاصة في مجال خدمة العملاء، يمكن للوكلاء استخدام ملخصات الحوار للمساعدة في زيادة أعمالهم من خلال معرفة قضايا العملاء بسرعة وتقدم الخدمة. تتطلب هذه التطبيقات ملخصات لاحتواء منظور مكبر صوت واحد ولديك هيكل تدفق موضو ع واضح، في حين لا يتوفر في مجموعات البيانات الحالية. لذلك، في هذه الورقة، نقدم مجموعة بيانات صينية جديدة لتلخيص حوار خدمة العملاء (CSDS). يعمل CSDS على تحسين الملخصات الإفراطية في جوانب: (1) بالإضافة إلى الملخص العام للحوار بأكمله، كما يتم تقديم ملخصات الأدوار أيضا للحصول على وجهات نظر مكبرات صوت مختلفة. (2) تلخص جميع الملخصات لكل موضوع بشكل منفصل، وبالتالي تحتوي على هيكل مستوى الموضوع للحوار. نحدد المهام في CSDS كمولية الملخص الشامل والملخصات المختلفة الموجهة نحو الأدوار لحوار معين. بعد ذلك، نقارن العديد من طرق التلخيص على CSDS، وإظهار نتائج التجربة أن الطرق الحالية عرضة لتوليد ملخصات زائدة وغير متماسكة. علاوة على ذلك، يصبح الأداء أسوأ بكثير عند تحليل الأداء في ملخصات الأدوار وهياكل الموضوعات. نأمل أن تتمكن هذه الدراسة من مراجعة تلخيص الحوار الصيني وفائدة المزيد من الدراسات.
يمكن أن تساعد تقنيات توصيات الأخبار المستخدمين على منصات الأخبار للحصول على معلومات الأخبار المفضلة لديهم. تعتمد معظم طرق توصيات الأخبار الحالية على بيانات سلوك المستخدم المخزنة مركزيا لتدريب نماذج وخدمة المستخدمين. ومع ذلك، فإن بيانات المستخدم عادة ما تكون حساسة خصوصية عالية، وتخزينها مركزيا في منصة الأخبار قد تثير مخاوف الخصوصية والمخاطر. في هذه الورقة، نقترح إطار توصية أخبار موحدة، والتي يمكن أن تستخدم بيانات المستخدم المخزنة محليا في عملاء المستخدمين لتدريب النماذج وخدمة المستخدمين بطريقة محافظة الخصوصية. بعد النموذج المستخدمة على نطاق واسع في أنظمة التوصية في العالم الحقيقي، يحتوي إطار عملنا على مرحلة للجيل الأخبار المرشح (I.E.، استدعاء) ومرحلة لترتيب الأخبار المرشح (أي، الترتيب). في مرحلة الاستدعاء، يتعلم كل عميل محليا تمثيلات فائدة متعددة من الأخبار النقر باهتمامات المستخدم النموذجية الشاملة. تم تحميل هذه التمثيلات إلى الخادم لاستدعاء أخبار المرشحين من تجمع أخبار كبير، والتي يتم توزيعها بشكل إضافي على عميل المستخدم في مرحلة الترتيب لعرض الأخبار المخصص. بالإضافة إلى ذلك، نقترح طريقة Decomposer-Decomposer-Decomposer مع ضوضاء الاضطرابات لتحسين حماية معلومات المستخدم الخاصة المشفرة في تمثيلات اهتمام المستخدم. علاوة على ذلك، فإننا نتدرب بشكل تعاوني في تذكر نماذج الترتيب والترتيب على البيانات اللامركزية في عدد كبير من عملاء المستخدمين بطريقة الحفاظ على الخصوصية. تبين التجارب في مجموعات بيانات الأخبار الحقيقية في العالم أن طريقتنا يمكن أن تفوق أساليب خط الأساس وتحمي خصوصية المستخدم بشكل فعال.
في سيناريو دردشة خدمة العملاء النموذجي، اتصل العملاء بمركز دعم لطلب المساعدة أو رفع الشكاوى، وحاول الوكلاء البشريون حل المشكلات.في معظم الحالات، يطلب من الوكلاء في نهاية المحادثة كتابة ملخص قصير يؤكد على المشكلة والحل المقترح، عادة من أجل فائدة الوكل اء الآخرين الذين قد يتعين عليهم التعامل مع نفس العميل أو المشكلة.الهدف من هذه المقالة يدعى إلى أتمتة هذه المهمة.نقدم مجموعة بيانات ملخصات حوار عملاء عالية الجودة وعالية الجودة ذات الجودة العالية مع مقربة من 1400 ملخصات مشروح بشرية.تعتمد البيانات على مربعات اتصال دعم العملاء في العالم الحقيقي وتتضمن ملخصات خارجية ومخفية.نحن نقدم أيضا طريقة تلخيص غير مخالفات جديدة غير محددة
تصف هذه الورقة تقديم مركز خدمة الترجمة Huawei (HW-TSC) إلى مهمة الترجمة الطبية الحيوية WMT21 في أزواج لغتان باللغة: Chinese↔english و German↔english (اسم فريقنا المسجل هو Huaweitsc).يتم تقديم التفاصيل الفنية في هذه الورقة، بما في ذلك الإطار النموذجي وطريقة معالجة البيانات مسبقا واستراتيجيات تحسين النماذج.بالإضافة إلى ذلك، باستخدام مجموعة الاختبار الطبية الحيوية WMT20 OK- محاذاة، نقارن وتحليل عروض النظام بموجب استراتيجيات مختلفة.على مهمة الترجمة الطبية الحيوية WMT21، أنظمتنا في اللغة الإنجليزية → الصينية والإنجليزية → اتجاهات ألمانية تحصل على أعلى درجات بلو بين جميع التقديمات وفقا لنتائج التقييم الرسمي.
توفر منصة خدمة البث مثل YouTube وظيفة مناقشة للجماهير في جميع أنحاء العالم لمشاركة التعليقات. YouTubers الذين يقومون بتحميل مقاطع الفيديو على منصة YouTube ترغب في تتبع أداء مقاطع الفيديو التي تم تحميلها. ومع ذلك، فإن مهام التحليل الحالية من YouTube ت وفر فقط بعض مؤشرات الأداء مثل متوسط ​​مدة العرض، سجل التصفح، والتباين في التركيبة السكانية للجمهور، وما إلى ذلك، ونقص تحليل المعنويات بشأن تعليقات الجمهور. لذلك، تقترح الورقة مؤشرات المعنويات متعددة الأبعاد مثل تفضيلات YouTuber وتفضيلات الفيديو ومستوى الإثارة لالتقاط مشاعر شاملة بشأن تعليقات الجمهور لمقاطع الفيديو ويوتيوغتر. لتقييم أداء الطبقات المختلفة، نقوم بتجربة معصوص قائما على التعلم والتعلم ومقرها في التعلم، ويكتشف تلقائيا ثلاثة مؤشرات معنويات لتصريحات الجمهور. تشير النتائج التجريبية إلى أن المصنف المستند إلى BERT يعد نموذج تصنيف أفضل من الطبقات الأخرى وفقا لنتيجة F1، ومؤشر المعنويات على مستوى الإثارة هو تحسن تماما. لذلك، يمكن حل مهام الكشف عن المعنويات المتعددة على منصة خدمة تدفق الفيديو من خلال مؤشرات المعنويات متعددة الأبعاد المقترحة مصحوبة مع مصنف Bert للحصول على أفضل نتيجة.
التغطية الواسعة التي تعني تعني التمثيلات في NLP التركيز في الغالب على المحتوى المعبر عنه صراحة. والأهم من ذلك أن ندرة مجموعات البيانات التلقائية للأدوار الضمنية المتنوعة يحد من الدراسات التجريبية في الدقوق اللغوي. على سبيل المثال، في مراجعة الويب خدم ة رائعة! ''، المزود والمستهلك حجج ضمنية لأنواع مختلفة. نحن ندرس وجعة مشروحة من الحجج الضمنية الضمنية الجميلة (CUI و Hershcovich، 2020) من خلال إعادة النظر في ذلك بعناية، وحل العديد من التناقضات. في وقت لاحق، نقدم أول محلل عصبي يستند إلى الانتقال يمكن أن يتعامل مع الحجج الضمنية بشكل حيوي، وتجربة نظاميين انتقالين مختلفين على مجموعة بيانات محسنة. نجد أن أنواع معينة من الوسائط الضمنية أكثر صعوبة من غيرها من غيرها وأن النظام الأكثر دقة أكثر دقة في استرداد الوسائط الضمنية، على الرغم من وجود نقاط تحليل إجمالية أقل، مما يشهد قيود التفكير الحالية لنماذج NLP. سيسهل هذا العمل فهم أفضل للغة الضمنية والكشفية، من خلال دمجها بشكل كلي في تمثيلات المعنى.
في تطبيقات خدمة العملاء الخاصة بالمجال على الإنترنت، تكافح العديد من الشركات بنشر نماذج NLP المتقدمة بنجاح، بسبب توفر وضوضاء محدودة في مجموعات البيانات الخاصة بهم.في حين أن الأبحاث المسبقة أظهرت إمكانية ترحيل النماذج الكبيرة المسبقة للمجال المفتوحة ل لمهام الخاصة بالمهام الخاصة بالمجال، فإن استراتيجيات التدريب المناسبة (قبل) لم يتم تقييمها بشدة في إعدادات خدمة العملاء في وسائل التواصل الاجتماعي، خاصة في ظل ظروف متعددة اللغات.نحن نتعامل مع هذه الفجوة من خلال جمع وجعة إعلامية اجتماعية متعددة اللغات تحتوي على محادثات خدمة العملاء (تغريدات 865K)، ومقارنة خطوط أنابيب مختلفة من الأساليب المحددة والفصل، وتطبيقها على 5 مهام مختلفة مختلفة.نوضح أنه يلاحظ نموذج محول عام متعدد اللغات على مجموعة بياناتنا داخل المجال، قبل التصميم في مهام نهاية محددة، يعزز الأداء باستمرار، خاصة في الإعدادات غير الإنجليزية.
يتم البحث في المسؤولية المدنية لمزودي خدمة الإنترنت بنوعيها العقدية و التقصيرية من خلال عرض الأركان التقليدية للمسؤولية المدنية من خطأ و ضرر و العلاقة السببية بينهما, مع محاولة تطبيق بعض الأحكام الخاصة المتعلقة بهذا الشأن الواردة في قانون تنظيم التواصل على الشبكة و مكافحة الجريمة المعلوماتية السوري.
تنشأ المسؤولية المدنية لمزودي خدمة الإنترنت في سورية عادة لسببين: الأول أن يكون سببها إخلال مقدم خدمات الإنترنت بالتزاماته التعاقدية و تكون مسؤوليته عقدية, و الثاني أن ترجع إلى إخلاله بواجب عدم الإضرار بالغير , كنشره لمضمون معلوماتي غير مشروع مع علمه بمضمونه و مسؤوليته هنا تقصيرية.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا