التحقيق تجارب التحقيق في مدى جعل التمثيل العصبي الممتلكات - مثل جزء من الكلام --- يمكن التنبؤ بها. يشير المرء إلى أن التمثيل يرمز عقار إذا كان التحقيق في هذا التمثيل ينتج دقة أعلى من التحقيق في تمثيل خط أساس مثل تضمين الكلمات غير السياقية. بدلا من استخدام خطوط الأساس كنقطة مقارنة، نحن مهتمون بقياس المعلومات الواردة في التمثيل ولكن ليس في الأساس. على سبيل المثال، يمكن للطرق الحالية اكتشافها عندما يكون التمثيل مفيدا أكثر من هوية الكلمة (خط الأساس) للتنبؤ بجزء خطاب؛ ومع ذلك، لا يمكنهم اكتشاف متى تمثل التمثيل من مجرد جوانب جزء من الكلام، ولا يفسره كلمة الهوية. في هذا العمل، نقوم بتوسيع نظرية المعلومات القابلة للاستخدام المسماة معلومات V واقتراح التحقيق الشريطي، والذي ظروف صراحة بشأن المعلومات في الأساس. في دراسة الحالة، نجد أنه بعد تكييفها على أشرطة الكلمات غير السياقية، يمكن الوصول إلى العقارات مثل جزء من الكلام في طبقات أعمق من الشبكة مما كان يعتقد سابقا.
Probing experiments investigate the extent to which neural representations make properties---like part-of-speech---predictable. One suggests that a representation encodes a property if probing that representation produces higher accuracy than probing a baseline representation like non-contextual word embeddings. Instead of using baselines as a point of comparison, we're interested in measuring information that is contained in the representation but not in the baseline. For example, current methods can detect when a representation is more useful than the word identity (a baseline) for predicting part-of-speech; however, they cannot detect when the representation is predictive of just the aspects of part-of-speech not explainable by the word identity. In this work, we extend a theory of usable information called V-information and propose conditional probing, which explicitly conditions on the information in the baseline. In a case study, we find that after conditioning on non-contextual word embeddings, properties like part-of-speech are accessible at deeper layers of a network than previously thought.
المراجع المستخدمة
https://aclanthology.org/
يعرض هذا العمل رواية خط أنابيب QA مفتوحة من أربعة مراحل R2-D2 (رتبة مرتين، اقرأ مرتين).يتكون خط الأنابيب من المسترد والمرور Reranker وقارئ استخراجي وقارئ عام وآلية تعزز التنبؤ النهائي من جميع مكونات النظام.نوضح قوتها عبر ثلاث مجموعات بيانات QA المجال
هدف البحث إلى دراسة عوامل قياس الجودة في نظم المعلومات المطبقة في شركات الاتصالات، و قد قسمت هذه العوامل إلى أربعة هي عامل الوقت و يتضمن العوامل الفرعية (التوقيت، و التحديث، و التكرار، و الجاهزية) و عامل الشكل و يتضمن عوامل فرعية هي (الوضوح و التفاص
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا
في هذه الورقة، نستكشف مهمة توليد أوصاف اللغة الطبيعية تلقائيا لأنماط بارزة في سلسلة زمنية، مثل أسعار الأسهم لشركة أكثر من أسبوع. يجب أن يكون نموذج لهذه المهمة قادرا على استخراج أنماط رفيعة المستوى مثل وجود ذروة أو تراجع. في حين أن النماذج العصبية الم
نقترح استخدام مهمة مكتملة متعددة الطبق لتقييم تمثيلات مورفوسنيتشية ل Adgeddings Word متعددة اللغات. هذا القرص في التحقيق الكنسي يجعل من السهل استكشاف تمثيلات مورفوسنيتشية، كلاهما بشكل كلي وعلى مستوى الميزات الفردية (على سبيل المثال، النوع الاجتماعي و