ترغب بنشر مسار تعليمي؟ اضغط هنا

تأثيرات التردد على التعلم القاعدة النحوية في المحولات

Frequency Effects on Syntactic Rule Learning in Transformers

362   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تؤدي نماذج اللغة المدربة مسبقا بشكل جيد في مجموعة متنوعة من المهام اللغوية التي تتطلب منطق رمزي، مما رفع مسألة ما إذا كانت هذه النماذج تمثل ضمنيا الرموز والقواعد المجردة. نحن نحقق في هذا السؤال باستخدام دراسة حالة أداء بيرت على اتفاقية الفعل الإنجليزي - الفعل. على عكس العمل السابق، ندرب حالات متعددة من بيرت من نقطة الصفر، مما يسمح لنا بإجراء سلسلة من التدخلات التي تسيطر عليها وقت ما قبل التدريب. نظرا لأن بيرت تعميم غالبا جيدا حتى تخضع أزواج الفعل التي لم تحدث أبدا في التدريب، مما يشير إلى درجة من السلوك الذي تحكم القواعد. ومع ذلك، نجد أيضا أن هذا الأداء يتأثر بشدة بتردد الكلمات، مع وجود تجارب تظهر أن كل من التردد المطلق لنموذج الفعل، وكذلك التردد بالنسبة إلى الانعطاف البديل، يتم تورطه سببابيا في تنبؤات Bert في وقت الاستدلال وبعد يكشف التحليل الأقرب من تأثيرات التردد هذه أن سلوك بيرت يتوافق مع النظام الذي يطبق بشكل صحيح قاعدة SVA بشكل عام ولكنه يكافح من أجل التغلب على بظر تدريب قوي وتقدير ميزات الاتفاقية (المفرد مقابل الجمع) على البنود المعجمية النادرة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

القواعد قوانين مستنبطة من كلام العرب الذين لم تفسد سلائقهم، و الشاهد يمثل روح القاعدة، إذ يضفي عليها الحياة و المتعة و الأصالة، و الكلام العربي الذي يستشهد به هو القرآن الكريم و الحديث النبوي الشريف و ما أُثر من كلام العرب شعراً و نثراً منذ الجاهلية حتى نهاية عصر الاحتجاج. و مصطلح الشاهد مصطلح عربي أصيل ظهر نتيجة خوف العرب على لغتهم من اللحن، و يعد القرآن الكريم الأصل الأول للاستشهاد، فهو الدعامة التي ترتكز عليها مصادر الاستشهاد الأخرى. يحاول هذا البحث دراسة العلاقة بين القاعدة النحوية و الشواهد، و إظهار دوافع الاستشهاد و طرقه و أركانه و مصادره، و الوقوف عند بعض مرادفاته كالاحتجاج و الاستدلال و التمثيل.
يقوم هذا البحث على دراسة العلاقة بين القياس و القاعدة النحوية؛ إذ يعد القياس أحد أصول النحو العربي و أركانه في مرحلة التقعيد و بناء الأحكام، و قد انقسم العلماء فيه بين مؤيد و رافض، و كان النحاة أكثر ميلاً إلى القياس من الرواة؛ لأن بحوثهم تقوم على الت شابه الموجود بين الألفاظ و العبارات و الأساليب المستعملة في الكلام الذي رواه الرواة مما سمع عن العرب، فاتخذوا هذا التشابه أساساً بنوا عليه قواعد قياسهم و أصوله، و اهتموا به و عنوا بتبيان أركانه، و إيضاح أنواعه. و قد أدخل أصحاب القياس كثيراً من الكلمات الأجنبية التي عربت في أثناء الفتوحات الإسلامية، و اشتقوا من هذه الكلمات ألفاظاً جديدة على نحو ما يشتقون من الألفاظ العربية المشابهة تبعاً لما تسمح به قواعد القياس فيها. و قد بالغ بعض النحاة في قياسهم حتى غدا بعيداً عن واقع اللغة، و صار ضرباً من الأحاجي و الألغاز، مما أدى إلى النفور من القياس، تبعه نفور من النحو، إذ أصبح القياس هدفاً بذاته، فابتعد عن التقعيد الذي كان غايته الرئيسة، و صار يتجلى بتقعيد الكلام القائم على الفطرة.
مجردة أن هذه الدراسة تنفذ تقييم جوهري منهجي للتمثيل الدلالي الذي تعلمته المحولات متعددة الوسائط المدربة مسبقا. يزعم هذه التمثيلات أنها غير ملائمة للمهمة وأظهرت للمساعدة في العديد من مهام اللغة والرؤية المصب. ومع ذلك، فإن المدى الذي يتماشى فيه مع الحد س الدلالي البشري لا يزال غير واضح. نقوم بتجربة نماذج مختلفة والحصول على تمثيلات كلمة ثابتة من تلك السياق التي يتعلمونها. ثم قمنا بتقييمها ضد الأحكام الدلالية التي قدمها مكبرات الصوت البشرية. تمشيا مع الأدلة السابقة، نلاحظ ميزة معممة للتمثيلات متعددة الوسائط على اللغات فقط على أزواج كلمة ملموسة، ولكن ليس على تلك المجردة. من ناحية، يؤكد ذلك فعالية هذه النماذج لمحاذاة اللغة والرؤية، مما يؤدي إلى تحسين تمثيلات الدلالية للمفاهيم التي ترتكز في الصور. من ناحية أخرى، تبين أن النماذج تتبع أنماط تعليم التمثيل المختلفة، والتي سفي بعض الضوء على كيفية وعند تنفيذ تكامل متعدد الوسائط.
نماذج المحولات باهظة الثمن لحن النغمة، والبطيئة للتناسم، ولديها متطلبات تخزين كبيرة.تتناول النهج الحديثة هذه أوجه القصور عن طريق تدريب النماذج الأصغر، مما يقلل ديناميكيا حجم النموذج، وتدريب محولات الوزن الخفيف.في هذه الورقة، نقترح Adapterdrop، وإزالة محولات من طبقات محول أقل أثناء التدريب والاستدلال، مما يشتمل على المفاهيم من الاتجاهات الثلاثة.نظهر أن Adapterdrop يمكن أن تقلل ديناميكيا من العلامة الحسابية الحسابية عند إجراء الاستدلال على مهام متعددة في وقت واحد، مع انخفاض الحد الأدنى في عروض العمل.سنقوم بمزيد من المحولات من Adaperfusion، مما يحسن كفاءة الاستدلال مع الحفاظ على أداء العمل بالكامل.
أدت التقدم المحرز الأخير في معالجة اللغات الطبيعية إلى أن تصبح هياكل المحولات النموذجية السائدة المستخدمة لمهام اللغة الطبيعية.ومع ذلك، في العديد من مجموعات البيانات في العالم، يتم تضمين طرائق إضافية التي لا يستوفي المحول مباشرة.نقدم مجموعة أدوات متع ددة الوسائط، حزمة بيثون مفتوحة المصدر لتضمين بيانات النص والمجدول (القاطع والرقمي) مع المحولات لتطبيقات المصب.تدمج مجموعة أدواتنا جيدا مع تعانق واجهة برمجة التطبيقات الموجودة في وجه المعانقة مثل التوت والمركز النموذجي الذي يتيح تنزيل سهلة من مختلف النماذج المدربة مسبقا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا