ترغب بنشر مسار تعليمي؟ اضغط هنا

يتطلب تصنيف النوايا الإضافية تعيين ملصقات النوايا إلى الكلام الجزئي. ومع ذلك، لا تحتوي الكلام الجزئي بالضرورة على معلومات كافية يتم تعيينها إلى فئة النية من كلامها الكامل (بشكل صحيح وبدرجة معينة من الثقة). باستخدام التفسير النهائي كحقيقة أرضية لقياس دقة المصنف أثناء تصنيف النوايا للكلمات الجزئية مشكلة. نقوم بإصدار شامل، مجموعة بيانات من الكلام الجزئي والكامل مع شروح بشرية من علامات النية المعقولة عن أجزاء مختلفة من كل كلام، كأساس العلوي (البشري) لتصنيف النية الشديدة. نقوم بتحليل التعليقات التوضيحية الإضافية واقتراح تخفيض الانتروبيا كمقياس لتقارب المعلقين البشري بشأن تفسير (أي ملصق النية). نقول أنه عندما لا يتوقف المحن المعلقون على واحد أو قليل من التفسيرات المحتملة، ومع ذلك فإن المصنف يحدد بالفعل فئة النوايا النهائية في وقت مبكر، فهي علامة تجارية يمكن أن تعزى إلى القطع الأثرية في DataSet.
توفر أنظمة ترجمة الآلات الحالية (MT) نتائج جيدة للغاية على مجموعة متنوعة متنوعة من أزواج اللغات ومجموعات البيانات. ومع ذلك، من المعروف أن إنتاج مخرجات ترجمة بطلاقة يمكن أن تحتوي على أخطاء ذات معنى مهم، وبالتالي تقويض موثوقيتها في الممارسة العملية. تق دير الجودة (QE) هي مهمة تقييم أداء MT تلقائيا في وقت الاختبار. وبالتالي، من أجل أن تكون مفيدة، يجب أن تكون أنظمة QE قادرا على اكتشاف هذه الأخطاء. ومع ذلك، لم يتم بعد اختبار هذه القدرة في ممارسات التقييم الحالية، حيث يتم تقييم أنظمة QE فقط من حيث ارتباطها بالأحكام البشرية. في هذا العمل، نسرج هذه الفجوة من خلال اقتراح منهجية عامة لاختبار الخصم من QE ل MT. أولا، نظرا لأنه على الرغم من الارتباط العالي بالأحكام البشرية التي حققتها سوتا الأخيرة، لا تزال أنواع معينة من الأخطاء المعنية مشكلة في الكشف عن QE. ثانيا، نظهر أنه في المتوسط، فإن قدرة نموذج معين على التمييز بين الاضطرابات المعنية التي تحافظ مع المعنى وتغيير المعنى هي التنبؤ بأدائها العام، وبالتالي يحتمل أن يسمح بمقارنة أنظمة QE دون الاعتماد على تشريح الجودة اليدوية.
في هذه الورقة، نصف إنشادنا إلى المهمة المشتركة بمقاييس WMT 2021.نستخدم الأسئلة والأجوبة التي تم إنشاؤها تلقائيا لتقييم جودة أنظمة الترجمة الآلية (MT).إن تقديمنا يبني على إطار MTEQA المقترح مؤخرا.تظهر التجارب على مجموعات بيانات تقييم WMT20 أنه على مست وى النظام، يحقق Mteqa Metric أداء قابلا للمقارنة مع حلول حديثة أخرى، مع مراعاة كمية معينة فقط من الترجمة بأكملها.
نحن تصف أنظمة NMT الخاصة بنا المقدمة إلى المهمة المشتركة WMT2021 في ترجمة الأخبار الإنجليزية - التشيكية: CUNI-DOCTRANSFORMER (CUBBITT على مستوى المستند) و Cuni-Marian-Baselines.نحن نحسن السابق بمعالجة أفضل من تجزئة الجملة وعلاج ما بعد معالجة الأخطاء في تحديد الأرقام والوحدات.نحن نستخدم الأخير للتجارب مع تقنيات الخلفية المختلفة.
في هذا العمل، نقوم بتصميم نموذج نهاية إلى نهاية لتوليد الشعر على أساس نماذج لغة الشبكة العصبية المتكررة مشروطة (RNN) تهدف إلى تعلم الميزات الأسلوبية (طول القصيدة والشعور والتقاليد والتقييم) من الأمثلة وحدها.نعرض أن هذا النموذج يتعلم بنجاح معنى "الطول والشعور، حيث يمكننا التحكم في ذلك لتوليد أطول أو أقصر بالإضافة إلى قصائد أكثر إيجابية أو أكثر سلبية.ومع ذلك، فإن النموذج لا يفهم الظواهر الصوتية مثل الجناس والقفا، ولكن بدلا من ذلك يغمر الإشارات الإحصائية ذات المستوى المنخفض.الأسباب المحتملة تشمل حجم بيانات التدريب، وتردد منخفض نسبيا وصعوبة هذه الظواهر الصربية وكذلك التحيزات النموذجية.نظهر أن نماذج GPT-2 الأخيرة لديها أيضا مشاكل في تعلم ظواهر soblexical مثل القافية من الأمثلة وحدها.
نحصل على نتائج جديدة باستخدام آلات الترجمة المرجعية (RTMS) مع توقعات مختلطة للحصول على مزيج أفضل من التنبؤ بالخبراء.نتائج المتعلم لدينا سوبر تحسين النتائج وتوفير نموذج مزيج قوي.
التحيز منتشر لنماذج NLP، تحفز تطوير تقنيات الدخل التلقائي.يقتصر تقييم أساليب ديوان NLP إلى حد كبير على السمات الثنائية في العزلة، على سبيل المثال، الدخان فيما يتعلق بالجنس أو العرق الثنائي، إلا أن العديد من الشركات تشمل العديد من هذه الصفات، وربما مع ارتفاع كرادة.في هذه الورقة، نقول أن نموذجا عادلا حقيقيا يجب أن يفكر في مجموعات GerryMandering التي تضم سمات مفردة فحسب، بل أيضا مجموعات تقاطع أيضا.نحن نقيم شكل من أشكال النموذج المحيزي الجديد الذي هو جديد على NLP، وكذلك امتداد تقنية الإسقاط Nullspace التكراري يمكن أن تتعامل مع هويات متعددة.
توصية الأخبار أمر بالغ الأهمية للوصول إلى الأخبار المخصصة. تعتمد أساليب توصيات الأخبار الموجودة على معظم طرق التخزين المركزي للأخبار التاريخية للمستخدمين النقر فوق بيانات السلوك، والتي قد تؤدي إلى مخاوف الخصوصية والمخاطر. يعد التعلم الفيدرالي إطارا ل لحفاظ على الخصوصية لعملاء متعددين نماذج قطار تعاوني دون مشاركة بياناتهم الخاصة. ومع ذلك، فإن حساب التكاليف والاتصال في تعلم العديد من نماذج توصية الأخبار الموجودة بطريقة غير مقبولة غير مقبولة لعملاء المستخدمين. في هذه الورقة، نقترح إطارا تعليميا فائضا فعالا لتوصية الأخبار التي تحافظ على الخصوصية. بدلا من تدريب وتوصيل النموذج بأكمله، نقوم بتحلل نموذج توصية الأخبار إلى نموذج أخبار كبير يحتفظ به في الخادم ونموذج مستخدم إضاءة الوزن مشتركا على كل من الخادم والعملاء، حيث يتم توصيل تمثيل الأخبار ونموذج المستخدم بين الخادم والعملاء وبعد وبشكل أكثر تحديدا، يطلب العملاء طراز المستخدم والتمثيلات الأخبار من الخادم، وإرسال تدرجاتهم المحسوبة محليا إلى الخادم للتجميع. يقوم الخادم بتحديث نموذج المستخدم العالمي الخاص به مع التدرجات المجمعة، ويقوم كذلك بتحديث نموذج الأخبار الخاص به لاستنتاج تمثيلات أخبار محدثة. نظرا لأن التدرجات المحلية قد تحتوي على معلومات خاصة، فإننا نقترح طريقة تجميع آمنة للتدرجات الإجمالية في طريقة الحفاظ على الخصوصية. تظهر التجارب في مجموعات بيانات عالمية حقيقية أن طريقتنا يمكن أن تقلل من حساب حساب الاتصالات والاتصال على العملاء مع الحفاظ على أداء نموذج واعد.
مجاملات واهتمامات في المراجعات هي قيمة لفهم اهتمامات التسوق للمستخدمين وآرائهم فيما يتعلق بجوانب محددة من العناصر المعينة.تفضل التوصيات الموجودة القائمة على المراجعة المراجعة ترميز اللغة الكبيرة والمعقدة التي يمكن أن تتعلم فقط تمثيلات نص كامنة وغير ق ابلة للتوجيه.إنهم يفتقرون إلى نماذج انتباه المستخدم والسلع الصريحة، والتي يمكن أن توفر معلومات قيمة تتجاوز القدرة على التوصية بالعناصر.لذلك، نقترح نهجا بإحكام مقرونة من مرحلتين، بما في ذلك مستخرج زوج من جانب جوانب (ASPE) ومقدر تصنيف إيلائي - إدراك العقار (ARE).الأزواج من الألغام من الألغام من الألغام من جانب الجوانب (AS-Pairs) وتنبؤ التصنيفات باستخدام أزواج كأدلة على مستوى الجانب ملموسة.تجارب واسعة على سبعة مجموعات بيانات مراجعة الأمازون العالمية في الواقعية تثبت أن ASPE يمكن أن تستخرج بفعالية من أزواج الشركات التي تمكن ARE لتسليم دقة فائقة عبر الأساس الرائدة.
تتضمن ممارسة شائعة في بناء مجموعات بيانات NLP، خاصة استخدام التعليقات التوضيحية من قبل الجمهور، الحصول على أحكام معلقية متعددة على نفس حالات البيانات، والتي يتم تسويتها بعد ذلك لإنتاج حقائق أو درجة أرضية واحدة، من خلال التصويت الأغلبية، المتوسط، أو ا لحكموبعدفي حين أن هذه النهج قد تكون مناسبة في مهام توضيحية معينة، تطل مثل هذه التجمعات على الطبيعة التي تم إنشاؤها اجتماعيا للتصورات الإنسانية التي تهدف الشروح عن المهام ذاتية نسبيا إلى الاستيلاء عليها.على وجه الخصوص، فإن الخلافات المنهجية بين المحن المعلقين بسبب خلفياتهم الاجتماعية والثقافية والتجارب العاشية غالبا ما يتم توعيتها من خلال هذه التجمعات.في هذه الورقة، نوضح تجريبيا أن تجميع الملصقات قد يعرض تحيزات تمثيلية من وجهات النظر الفردية والمجموعة.بناء على هذا النتيجة، نقترح مجموعة من توصيات لزيادة فائدة وشفافية مجموعات البيانات في حالات استخدام المصب.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا