ترغب بنشر مسار تعليمي؟ اضغط هنا

التحقيق الشرطي: قياس المعلومات القابلة للاستخدام وراء خط الأساس

Conditional probing: measuring usable information beyond a baseline

165   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

التحقيق تجارب التحقيق في مدى جعل التمثيل العصبي الممتلكات - مثل جزء من الكلام --- يمكن التنبؤ بها. يشير المرء إلى أن التمثيل يرمز عقار إذا كان التحقيق في هذا التمثيل ينتج دقة أعلى من التحقيق في تمثيل خط أساس مثل تضمين الكلمات غير السياقية. بدلا من استخدام خطوط الأساس كنقطة مقارنة، نحن مهتمون بقياس المعلومات الواردة في التمثيل ولكن ليس في الأساس. على سبيل المثال، يمكن للطرق الحالية اكتشافها عندما يكون التمثيل مفيدا أكثر من هوية الكلمة (خط الأساس) للتنبؤ بجزء خطاب؛ ومع ذلك، لا يمكنهم اكتشاف متى تمثل التمثيل من مجرد جوانب جزء من الكلام، ولا يفسره كلمة الهوية. في هذا العمل، نقوم بتوسيع نظرية المعلومات القابلة للاستخدام المسماة معلومات V واقتراح التحقيق الشريطي، والذي ظروف صراحة بشأن المعلومات في الأساس. في دراسة الحالة، نجد أنه بعد تكييفها على أشرطة الكلمات غير السياقية، يمكن الوصول إلى العقارات مثل جزء من الكلام في طبقات أعمق من الشبكة مما كان يعتقد سابقا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يعرض هذا العمل رواية خط أنابيب QA مفتوحة من أربعة مراحل R2-D2 (رتبة مرتين، اقرأ مرتين).يتكون خط الأنابيب من المسترد والمرور Reranker وقارئ استخراجي وقارئ عام وآلية تعزز التنبؤ النهائي من جميع مكونات النظام.نوضح قوتها عبر ثلاث مجموعات بيانات QA المجال المفتوحةيوضح تحليلنا على ما يلي: (1) الجمع بين القارئ الاستخراجي والمؤدي يحقق تحسينات مطلقة تصل إلى 5 مباراة محددة، وعلى الأقل ضعف كفاءة مثل الفرع الخلفي من نفس النماذج مع معلمات مختلفة، (2) القارئ الاستخراجي مع أقليمكن للممعلمات مطابقة أداء قارئ التوليد في مجموعات بيانات QA الاستخراجية.
هدف البحث إلى دراسة عوامل قياس الجودة في نظم المعلومات المطبقة في شركات الاتصالات، و قد قسمت هذه العوامل إلى أربعة هي عامل الوقت و يتضمن العوامل الفرعية (التوقيت، و التحديث، و التكرار، و الجاهزية) و عامل الشكل و يتضمن عوامل فرعية هي (الوضوح و التفاص يل، و التقديم (العرض)، و الترتيب، و الوسائط )، أما العامل الثالث فهو عامل المحتوى و يتضمن عوامل فرعية هي (الدقة، و الارتباط، و الاكتمال، و الإيجاز، و المدى, و الأمان، و الموثوقية، و الاقتصاد، و الكفاءة) . أما العامل الرابع فهو العامل الفني و يتضمن عاملي (جودة البرمجيات، و جودة الأجهزة). و اختُبِر هذا البحث في شركة سيرياتل، و كانت النتيجة النهائية أن من أهم عوامل قياس الجودة في نظم المعلومات المطبقة في شركات الاتصالات هما عاملا المحتوى و الوقت.
تصف هذه الورقة التقديم من قبل الفريق من قسم اللغويات الحاسوبية، جامعة زيوريخ، إلى مهمة تحويل Grapheme-To-PhoneMe متعددة اللغات 1 من تحدي Sigmorphon 2021 في الإعدادات المنخفضة والمتوسطة. التقديم هو اختلاف في نظامنا 2020 G2P، الذي يعمل كأساس لتحدي هذا العام. النظام عبارة عن محول عصبي يعمل على إجراءات تحرير صريحة ويتم تدريبه على التعلم التقليد. لهذا التحدي، جربنا التغييرات التالية: أ) شرائح صوتية تنبعث منها بدلا من صوتيات الشخصيات الفردية، ب) تسرب حرف الإدخال، ج) فك تشفير Mogrovifier LSTM (Melis et al.، 2019)، D) إثراء مدخلات وحدة فك الترميز حضر حاليا حرف الإدخال، ه) تشفير Bilstm الموازية، و) جدولة حجم الدفعة التكيفية. في الإعداد المنخفض، تحسن أفضل فرمنا على الأساس، ومع ذلك، في الإعداد المتوسطة، كان الأساس أقوى في المتوسط، على الرغم من أن تحسينات بعض اللغات يمكن ملاحظتها.
في هذه الورقة، نستكشف مهمة توليد أوصاف اللغة الطبيعية تلقائيا لأنماط بارزة في سلسلة زمنية، مثل أسعار الأسهم لشركة أكثر من أسبوع. يجب أن يكون نموذج لهذه المهمة قادرا على استخراج أنماط رفيعة المستوى مثل وجود ذروة أو تراجع. في حين أن النماذج العصبية الم عاصرة النموذجية مع آليات الاهتمام يمكن أن تولد أوصاف إخراج بطلاقة لهذه المهمة، فإنها غالبا ما تولد أوصاف غير صحيحة في الواقع. نقترح نموذجا حسابيا مع بنية شرائط للحقيقة تعمل أولا البرامج المستفادة الصغيرة على سلسلة وقت الإدخال، ثم يحدد البرامج / الأنماط التي تمسك بالإدخال المحدد، وأخيرا ظروف * فقط * البرنامج الصحيح الذي تم اختياره (بدلا من ذلك من سلسلة وقت الإدخال) لتوليد وصف نص الإخراج. يتم إنشاء برنامج في طرازنا من الوحدات النمطية، وهي شبكات عصبية صغيرة مصممة لالتقاط الأنماط العددية والمعلومات الزمنية. يتم تقاسم الوحدات النمطية عبر برامج متعددة، مما يتيح التركيبية وكذلك التعلم الفعال لمعلمات الوحدة النمطية. إن الوحدات النمطية، وكذلك تكوين الوحدات النمطية، غير مقصودة في البيانات، ونحن نتعلمهم في أزياء نهاية إلى نهاية مع إشارة التدريب الوحيدة القادمة من أوصاف نص اللغة الطبيعية المصاحبة. نجد أن النموذج المقترح قادر على توليد التسميات التوضيحية عالية الدقة على الرغم من أننا نعتبر مساحة صغيرة وبسيطة من أنواع الوحدات النمطية.
نقترح استخدام مهمة مكتملة متعددة الطبق لتقييم تمثيلات مورفوسنيتشية ل Adgeddings Word متعددة اللغات. هذا القرص في التحقيق الكنسي يجعل من السهل استكشاف تمثيلات مورفوسنيتشية، كلاهما بشكل كلي وعلى مستوى الميزات الفردية (على سبيل المثال، النوع الاجتماعي و العدد والحالة)، ويؤدي بشكل طبيعي إلى دراسة كيفية تعامل نماذج اللغة بالميزات المشتركة (على سبيل المثال ، ظواهر الاتفاقية). نوضح هذه المهمة مع بيرت متعددة اللغات (ديفلين وآخرون.، 2018)، تحقيقات تدريبية لسبعة لغات متنوعة من النطباء: الأفريكان، الكرواتية والفنلندية والعبرية والكورية والإسبانية والتركية. من خلال هذا النموذج البسيط ولكن القوي، نتحقق من أن الرصاص متعدد اللغات يتجه العديد من ميزات مورفوستينكتاكيتش في وقت واحد قابل للاستخراج. سنقوم كذلك بتقييم تحقيقات على ست لغات محمولة: العربية والصينية والماراثية والسلوفينية والتغالوغ و Yoruba. يحتوي هذا النمط المرتفع من التحقيق الصفرية على الاستفادة الإضافية للكشف عن الخصائص الشاملة اللغوية نموذج لغة يعترف بأنه مشترك لغات متعددة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا