ترغب بنشر مسار تعليمي؟ اضغط هنا

التحقيق المنخفض التعقيد عبر العثور على الشبكات الفرعية

Low-Complexity Probing via Finding Subnetworks

263   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تتمثل النهج المهيمن في التحقيق في الشبكات العصبية للعقارات اللغوية في تدريب Perceptron متعدد الطبقات الضحلة (MLP) على رأس التمثيلات الداخلية للنموذج. يمكن لهذا النهج اكتشاف الخصائص المشفرة في النموذج، ولكن بتكلفة إضافة معلمات جديدة قد تتعلم المهمة مباشرة. نقترح بدلا من ذلك، حيث نقترح مسبارا شبه جذاب، حيث نجد شبكة فرعية حالية تؤدي المهمة اللغوية المصالحة. بالمقارنة مع MLP، تحقق مسبار الشبكة الفرعية كلتا الدقة العليا على النماذج المدربة مسبقا ودقة منخفضة على النماذج العشوائية، لذلك فهي أفضل في العثور على خصائص ذات أهمية وأسوأ من التعلم بمفردها. بعد ذلك، من خلال اختلاف تعقيد كل مسبار، نوضح أن التحقيق في الشبكة الفرعية التي يسيطر عليها البريتو - يحقق في تحقيق الدقة العليا التي تحقق أي ميزانية تعقيد التحقيق. أخيرا، نقوم بتحليل شبكات فرعية الناتجة الناتجة في مختلف المهام لتحديد مكان ترميز كل مهمة، ونتجد أن المهام ذات المستوى الأدنى يتم التقاطها في طبقات أقل، إعادة إنتاج نتائج مماثلة في العمل الماضي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تضمين الجملة تشفير المعلومات المتعلقة باستخدام التعابير في جملة.تقارير هذه الورقة مجموعة من التجارب التي تجمع بين المنهجية التحقيق مع اخفاء المدخلات لتحليل مكان وجود هذه المعلومات الاصطلاحية هذه، وما شكله.تشير نتائجنا إلى أن المفتاح الاصطلاعي لمصدر ب يرت موجود في المقام الأول داخل تعبير اصطلاحي، ولكنه يرسم أيضا معلومات من السياق المحيط.أيضا، يستطيع بيرت التمييز بين الاضطراب في جملة ناتجة عن الكلمات المفقودة والتعارض الناتج عن الاستخدام الاصطلاعي.
لقد أظهرت نماذج اللغة المدربة على كورسا كبيرة جدا مفيدة لمعالجة اللغة الطبيعية. كأداة أثرية ثابتة، أصبحوا موضوعا للدراسة المكثفة، حيث يحكم العديد من الباحثين "مدى الحصول عليها والذي يثبت بسهولة التجريد اللغوي ومعرفة الواقعية والعمومية وقدرات التفكير. تطبيق العمل الحديث عدة تحقيقات مراحل التدريب المتوسطة لمراقبة العملية التنموية للنموذج الواسع النطاق (شيانغ وآخرون، 2020). بعد هذا الجهد، نجيب بشكل منهجي على سؤال: لأنواع مختلفة من المعرفة يتعلم نموذج اللغة، عند التدريب أثناء (قبل) هل تم الحصول عليها؟ باستخدام روبرتا كدراسة حالة، نجد: يتم الحصول على المعرفة اللغوية بسرعة، ثابتة، قوية عبر المجالات. الحقائق والعموم أبطأ وأكثر حساسية للنطاق. القدرات المنطقية هي، بشكل عام، لا تكتسب بشكل ثابت. كشركات بيانات جديدة، بروتوكولات محدبة، بروتوكولات وبروتوكولات وإثبات تظهر، نعتقد أن التحليلات الواردة في الوقت المحدد يمكن أن تساعد الباحثين على فهم التعلم المعقدة والخيول أن هذه النماذج تخضع لنا وتوجيهنا نحو نهج أكثر كفاءة التي تحقق التعلم اللازم بشكل أسرع.
تحتوي الوثائق العلمية على درجة كبيرة من الاختلاف، سواء من حيث المحتوى (الدلالات) والهيكل (البراغماتية). تؤكد العمل المسبق في الوثيقة العلمية التفاهم على دلالات من خلال تلخيص المستندات ونمذجة موضوع Corpus ولكن تميل إلى حذف البراغماتية مثل تنظيم الوثائ ق وتدفقها. باستخدام مجموعة من الوثائق العلمية عبر 19 تخصصات وتقنيات النمذجة باللغة الحديثة، نتعلم مجموعة ثابتة من واصفات المجال الأذرع لمقاطع المستندات وإعادة التحديث "" The Corpus إلى هذه الواصفات (يشار إليها أيضا باسم "التطبيع" '). بعد ذلك، نقوم بتحليل موقف وطلب هذه الواصفات عبر المستندات لفهم العلاقة بين الانضباط والهيكل. نبلغ عن ضمنيات الأنماط الهيكلية داخل الانضباط، وتقليل التباينات، وبين الإصابة، ودعم الفرضية التي تشترك فيها المجتمعات العلمية، على الرغم من حجمها، وتنوعها، واتساعها، مشترك في طرق مماثلة للتعبير عن عملها. تضع نتائجنا الأساس للعمل في المستقبل في تقييم جودة البحث ونقل نمط المجال، وعمليات التحليل العملي.
التقييم البشري لمهام التلخيص موثوقة ولكن يجلب قضايا التكاثر والتكاليف العالية. المقاييس التلقائية رخيصة وغير قابلة للتكرار ولكن في بعض الأحيان ترتبط بشكل سيء بحكمات بشرية. في هذا العمل، نقترح Nemiautomatic مرنة لمقاييس التقييم الموجز التلقائي، بعد طر يقة التقييم البشري الهرم. يحتفظ Lite2Pyramid شبه التلقائي بوحدات المحتوى الموجزة ذات العلامة البشرية القابلة لإعادة الاستخدام (SCU) للإشارة (SCU)، لكنها تحل محل العمل اليدوي للحكم على وجود قاضم في ملخصات النظام مع نموذج استنتاج اللغة الطبيعية (NLI). تستبدل Lite3pyramid التلقائي بالكامل مزيد من البدائل SCUS مع الوحدات الثلاثية الدلالية المستخرجة تلقائيا (STUS) عبر نموذج العلامات الدلالية (SRL). أخيرا، نقترح مقاييس، Lite2.xpyramid، حيث نستخدم نموذجا بسيطا للتنبؤ بمدى محاكاة STUS محاكاة SCUS والاحتفاظ ب SCUs الأكثر صعوبة في محاكاة، والتي توفر عملية انتقال سلسة وتوازن بين الأتمتة والتقييم اليدوي وبعد مقارنة 15 مقاييس موجودة، نقوم بتقييم الارتباطات المترية البشرية على 3 مجموعات بيانات تقييم التلوث الحالية و Pyrxsum التي تم جمعها حديثا (مع أمثلة / أنظمة / أنظمة 100/10 XSUM). يظهر أن Lite2Pyramid لديها باستمرار أفضل الارتباطات على مستوى الملخص؛ يعمل Lite3pyramid بشكل أفضل من أو قابلة للمقارنة مع مقاييس أوتوماتيكية أخرى؛ يتداول Lite2.XPyramID قبالة قطرات الارتباط الصغيرة لخفض الجهد اليدوي الأكبر، والتي يمكن أن تقلل من تكاليف جمع البيانات المستقبلية.
وقد لوحظت مفارقة خسارة التعقيد، التي توضح أن الأفراد الذين يعانون من الأمراض من مرض ديناميات سلوكية يمكن التنبؤ بها بشكل مدهش، وقد لوحظ في مجموعة متنوعة من النظم الفسيولوجية البشرية والحيوانية. يعرض ظهور العلاج المستند عبر الإنترنت حديثا فرصة جديدة ل تحليل مفارقة فقدان التعقيد في التشغيل الجديد: فقدان التعقيد اللغوي في محادثات العلاج بالنصوص. في هذه الورقة، نقوم بتحليل التعقيد اللغوي يرتبط بالصحة العقلية في رسائل العلاج عبر الإنترنت المرسلة بين المعالجين و 7170 عملاء قدموا 30،437 ردود للمسح المقابلة على قلقهم. وجدنا أنه عندما أبلغ العملاء المزيد من القلق، أظهروا انخفاض التنوع المعجمي على النحو الذي يقدر بمتوسط ​​نسبة TECE-TECEN المتوسطة. يستخدم المعالجون، من ناحية أخرى، لغة صعوبة في القراءة، التعقيد النحوي، وعمر الاستحواذ عندما كان العملاء أكثر قلقا. أخيرا، وجدنا أن العملاء، وإلى حد كبير، المعالجين، عرضوا مستويات متسقة من العديد من تدابير التعقيد اللغوي. توضح هذه النتائج كيفية الاستفادة من التحليل اللغوي للاتصالات القائمة على النص كعلامة للقلق، وهو احتمال مثير في وقت زيادة الاتصال عبر الإنترنت وزيادة قضايا الصحة العقلية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا