أوراق بحثية, رسائل ماجستير ودكتوراه منشورة من قبل جمعية اللغويات الحاسوبية ACL

ليس بسرعة كبيرة، والتصنيف - الدقة والحد من الانتروبيا في تصنيف نية تدريجية

145 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتطلب تصنيف النوايا الإضافية تعيين ملصقات النوايا إلى الكلام الجزئي. ومع ذلك، لا تحتوي الكلام الجزئي بالضرورة على معلومات كافية يتم تعيينها إلى فئة النية من كلامها الكامل (بشكل صحيح وبدرجة معينة من الثقة). باستخدام التفسير النهائي كحقيقة أرضية لقياس دقة المصنف أثناء تصنيف النوايا للكلمات الجزئية مشكلة. نقوم بإصدار شامل، مجموعة بيانات من الكلام الجزئي والكامل مع شروح بشرية من علامات النية المعقولة عن أجزاء مختلفة من كل كلام، كأساس العلوي (البشري) لتصنيف النية الشديدة. نقوم بتحليل التعليقات التوضيحية الإضافية واقتراح تخفيض الانتروبيا كمقياس لتقارب المعلقين البشري بشأن تفسير (أي ملصق النية). نقول أنه عندما لا يتوقف المحن المعلقون على واحد أو قليل من التفسيرات المحتملة، ومع ذلك فإن المصنف يحدد بالفعل فئة النوايا النهائية في وقت مبكر، فهي علامة تجارية يمكن أن تعزى إلى القطع الأثرية في DataSet.

incremental intent classification intent classification intent تصنيف نية تدريجية تصنيف نية نية صناعة حمض الفوسفور المزيد..

دفع الأزرار المناسبة: تقييم الخصم لتقدير الجودة

198 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

توفر أنظمة ترجمة الآلات الحالية (MT) نتائج جيدة للغاية على مجموعة متنوعة متنوعة من أزواج اللغات ومجموعات البيانات. ومع ذلك، من المعروف أن إنتاج مخرجات ترجمة بطلاقة يمكن أن تحتوي على أخطاء ذات معنى مهم، وبالتالي تقويض موثوقيتها في الممارسة العملية. تق دير الجودة (QE) هي مهمة تقييم أداء MT تلقائيا في وقت الاختبار. وبالتالي، من أجل أن تكون مفيدة، يجب أن تكون أنظمة QE قادرا على اكتشاف هذه الأخطاء. ومع ذلك، لم يتم بعد اختبار هذه القدرة في ممارسات التقييم الحالية، حيث يتم تقييم أنظمة QE فقط من حيث ارتباطها بالأحكام البشرية. في هذا العمل، نسرج هذه الفجوة من خلال اقتراح منهجية عامة لاختبار الخصم من QE ل MT. أولا، نظرا لأنه على الرغم من الارتباط العالي بالأحكام البشرية التي حققتها سوتا الأخيرة، لا تزال أنواع معينة من الأخطاء المعنية مشكلة في الكشف عن QE. ثانيا، نظهر أنه في المتوسط، فإن قدرة نموذج معين على التمييز بين الاضطرابات المعنية التي تحافظ مع المعنى وتغيير المعنى هي التنبؤ بأدائها العام، وبالتالي يحتمل أن يسمح بمقارنة أنظمة QE دون الاعتماد على تشريح الجودة اليدوية.

quality estimation current machine translation buttons تقدير الجودة ترجمة الجهاز الحالي أزرار صناعة حمض الفوسفور المزيد..

Mteqa في مقاييس WMT21 المهمة المشتركة

291 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة، نصف إنشادنا إلى المهمة المشتركة بمقاييس WMT 2021.نستخدم الأسئلة والأجوبة التي تم إنشاؤها تلقائيا لتقييم جودة أنظمة الترجمة الآلية (MT).إن تقديمنا يبني على إطار MTEQA المقترح مؤخرا.تظهر التجارب على مجموعات بيانات تقييم WMT20 أنه على مست وى النظام، يحقق Mteqa Metric أداء قابلا للمقارنة مع حلول حديثة أخرى، مع مراعاة كمية معينة فقط من الترجمة بأكملها.

اللغة المدربة مسبقا صناعة حمض الفوسفور

أنظمة CUNI في WMT21: إعادة النظر في تقنيات خلفية إعادة النظر في NMT English-Czech

231 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نحن تصف أنظمة NMT الخاصة بنا المقدمة إلى المهمة المشتركة WMT2021 في ترجمة الأخبار الإنجليزية - التشيكية: CUNI-DOCTRANSFORMER (CUBBITT على مستوى المستند) و Cuni-Marian-Baselines.نحن نحسن السابق بمعالجة أفضل من تجزئة الجملة وعلاج ما بعد معالجة الأخطاء في تحديد الأرقام والوحدات.نحن نستخدم الأخير للتجارب مع تقنيات الخلفية المختلفة.

revisiting backtranslation techniques cuni systems revisiting backtranslation إعادة النظر في تقنيات الخلفية أنظمة CUNI إعادة النظر وراء الترجمة صناعة حمض الفوسفور المزيد..

جيل الشعر المطهر على الطراز المنتهي: ما الذي يتطلبه الأمر للتعلم من أمثلة وحدها؟

211 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذا العمل، نقوم بتصميم نموذج نهاية إلى نهاية لتوليد الشعر على أساس نماذج لغة الشبكة العصبية المتكررة مشروطة (RNN) تهدف إلى تعلم الميزات الأسلوبية (طول القصيدة والشعور والتقاليد والتقييم) من الأمثلة وحدها.نعرض أن هذا النموذج يتعلم بنجاح معنى "الطول والشعور، حيث يمكننا التحكم في ذلك لتوليد أطول أو أقصر بالإضافة إلى قصائد أكثر إيجابية أو أكثر سلبية.ومع ذلك، فإن النموذج لا يفهم الظواهر الصوتية مثل الجناس والقفا، ولكن بدلا من ذلك يغمر الإشارات الإحصائية ذات المستوى المنخفض.الأسباب المحتملة تشمل حجم بيانات التدريب، وتردد منخفض نسبيا وصعوبة هذه الظواهر الصربية وكذلك التحيزات النموذجية.نظهر أن نماذج GPT-2 الأخيرة لديها أيضا مشاكل في تعلم ظواهر soblexical مثل القافية من الأمثلة وحدها.

style-conditioned poetry generation poetry generation style-conditioned poetry توليد الشعر مشروط على الطراز توليد الشعر شعر مكيف صناعة حمض الفوسفور المزيد..

RTM لا ينتج عنه المتعلم السوبر في مهمة تقدير الجودة

233 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نحصل على نتائج جديدة باستخدام آلات الترجمة المرجعية (RTMS) مع توقعات مختلطة للحصول على مزيج أفضل من التنبؤ بالخبراء.نتائج المتعلم لدينا سوبر تحسين النتائج وتوفير نموذج مزيج قوي.

quality estimation task estimation task مهمة تقدير الجودة مهمة التقدير صناعة حمض الفوسفور

تقييم تقنيات الدخل لتحيزات القتالية

190 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

التحيز منتشر لنماذج NLP، تحفز تطوير تقنيات الدخل التلقائي.يقتصر تقييم أساليب ديوان NLP إلى حد كبير على السمات الثنائية في العزلة، على سبيل المثال، الدخان فيما يتعلق بالجنس أو العرق الثنائي، إلا أن العديد من الشركات تشمل العديد من هذه الصفات، وربما مع ارتفاع كرادة.في هذه الورقة، نقول أن نموذجا عادلا حقيقيا يجب أن يفكر في مجموعات GerryMandering التي تضم سمات مفردة فحسب، بل أيضا مجموعات تقاطع أيضا.نحن نقيم شكل من أشكال النموذج المحيزي الجديد الذي هو جديد على NLP، وكذلك امتداد تقنية الإسقاط Nullspace التكراري يمكن أن تتعامل مع هويات متعددة.

intersectional biases evaluating debiasing techniques biases التحيزات القاتلة تقييم تقنيات debias التحيزات صناعة حمض الفوسفور المزيد..

كفاءة-فيدريك: إطار التعلم الفيدرالي الفعال لتوصية الأخبار المحفوظة للخصوصية

329 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

توصية الأخبار أمر بالغ الأهمية للوصول إلى الأخبار المخصصة. تعتمد أساليب توصيات الأخبار الموجودة على معظم طرق التخزين المركزي للأخبار التاريخية للمستخدمين النقر فوق بيانات السلوك، والتي قد تؤدي إلى مخاوف الخصوصية والمخاطر. يعد التعلم الفيدرالي إطارا ل لحفاظ على الخصوصية لعملاء متعددين نماذج قطار تعاوني دون مشاركة بياناتهم الخاصة. ومع ذلك، فإن حساب التكاليف والاتصال في تعلم العديد من نماذج توصية الأخبار الموجودة بطريقة غير مقبولة غير مقبولة لعملاء المستخدمين. في هذه الورقة، نقترح إطارا تعليميا فائضا فعالا لتوصية الأخبار التي تحافظ على الخصوصية. بدلا من تدريب وتوصيل النموذج بأكمله، نقوم بتحلل نموذج توصية الأخبار إلى نموذج أخبار كبير يحتفظ به في الخادم ونموذج مستخدم إضاءة الوزن مشتركا على كل من الخادم والعملاء، حيث يتم توصيل تمثيل الأخبار ونموذج المستخدم بين الخادم والعملاء وبعد وبشكل أكثر تحديدا، يطلب العملاء طراز المستخدم والتمثيلات الأخبار من الخادم، وإرسال تدرجاتهم المحسوبة محليا إلى الخادم للتجميع. يقوم الخادم بتحديث نموذج المستخدم العالمي الخاص به مع التدرجات المجمعة، ويقوم كذلك بتحديث نموذج الأخبار الخاص به لاستنتاج تمثيلات أخبار محدثة. نظرا لأن التدرجات المحلية قد تحتوي على معلومات خاصة، فإننا نقترح طريقة تجميع آمنة للتدرجات الإجمالية في طريقة الحفاظ على الخصوصية. تظهر التجارب في مجموعات بيانات عالمية حقيقية أن طريقتنا يمكن أن تقلل من حساب حساب الاتصالات والاتصال على العملاء مع الحفاظ على أداء نموذج واعد.

federated learning framework efficient federated learning federated learning إطار التعلم الفيدرالي التعلم الفعال الكفء التعلم الاتحادي صناعة حمض الفوسفور المزيد..

يوصي لسبب ما: فتح قوة الاستخراج المشارك في جوانب الجوانب غير المنشأة

146 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

مجاملات واهتمامات في المراجعات هي قيمة لفهم اهتمامات التسوق للمستخدمين وآرائهم فيما يتعلق بجوانب محددة من العناصر المعينة.تفضل التوصيات الموجودة القائمة على المراجعة المراجعة ترميز اللغة الكبيرة والمعقدة التي يمكن أن تتعلم فقط تمثيلات نص كامنة وغير ق ابلة للتوجيه.إنهم يفتقرون إلى نماذج انتباه المستخدم والسلع الصريحة، والتي يمكن أن توفر معلومات قيمة تتجاوز القدرة على التوصية بالعناصر.لذلك، نقترح نهجا بإحكام مقرونة من مرحلتين، بما في ذلك مستخرج زوج من جانب جوانب (ASPE) ومقدر تصنيف إيلائي - إدراك العقار (ARE).الأزواج من الألغام من الألغام من الألغام من جانب الجوانب (AS-Pairs) وتنبؤ التصنيفات باستخدام أزواج كأدلة على مستوى الجانب ملموسة.تجارب واسعة على سبعة مجموعات بيانات مراجعة الأمازون العالمية في الواقعية تثبت أن ASPE يمكن أن تستخرج بفعالية من أزواج الشركات التي تمكن ARE لتسليم دقة فائقة عبر الأساس الرائدة.

unlocking the power unsupervised aspect-sentiment co-extraction power of unsupervised فتح السلطة استخراج المشاعر الجوانب غير المنسقة قوة غير مؤظفة صناعة حمض الفوسفور المزيد..

عند إطلاق ملصقات ومعلومات على مستوى Annotator في مجموعات البيانات

226 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تتضمن ممارسة شائعة في بناء مجموعات بيانات NLP، خاصة استخدام التعليقات التوضيحية من قبل الجمهور، الحصول على أحكام معلقية متعددة على نفس حالات البيانات، والتي يتم تسويتها بعد ذلك لإنتاج حقائق أو درجة أرضية واحدة، من خلال التصويت الأغلبية، المتوسط، أو ا لحكموبعدفي حين أن هذه النهج قد تكون مناسبة في مهام توضيحية معينة، تطل مثل هذه التجمعات على الطبيعة التي تم إنشاؤها اجتماعيا للتصورات الإنسانية التي تهدف الشروح عن المهام ذاتية نسبيا إلى الاستيلاء عليها.على وجه الخصوص، فإن الخلافات المنهجية بين المحن المعلقين بسبب خلفياتهم الاجتماعية والثقافية والتجارب العاشية غالبا ما يتم توعيتها من خلال هذه التجمعات.في هذه الورقة، نوضح تجريبيا أن تجميع الملصقات قد يعرض تحيزات تمثيلية من وجهات النظر الفردية والمجموعة.بناء على هذا النتيجة، نقترح مجموعة من توصيات لزيادة فائدة وشفافية مجموعات البيانات في حالات استخدام المصب.

releasing annotator-level labels releasing annotator-level building nlp datasets إطلاق ملصقات على مستوى المعلقين الإفراج عن المستوى بناء مجموعات البيانات NLP. صناعة حمض الفوسفور المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد