ترغب بنشر مسار تعليمي؟ اضغط هنا

السكتات الدماغية المختلفة للناس المختلفة: التحقيق في المزيد من الأساليب المسبقة التدريبية المناسبة لمهام الحوار المتنوعة

Different Strokes for Different Folks: Investigating Appropriate Further Pre-training Approaches for Diverse Dialogue Tasks

344   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تحميل النماذج المدربة مسبقا على الكائنات الكبيرة على نطاق واسع في المجال العام وتوضعها على مهام محددة من المصب هي تدريجيا نموذجا في معالجة اللغة الطبيعية. يمكن أن تثبت التحقيقات السابقة أن إدخال مراحل ما قبل التدريب الإضافي بين مراحل ما قبل التدريب والضبط بشكل جيد لتكييف النموذج على البيانات الخاصة بالمجال الخاصة بالمجال يمكن أن يؤدي إلى إثبات تأثيرات إيجابية. ومع ذلك، فإن معظم هذه أعمال التدريب المسبق الإضافية هذه فقط استمر في تشغيل المهمة التقليدية السابقة للتدريب، على سبيل المثال، نموذج اللغة الملثم، والتي يمكن اعتبارها كتكيف مجال إلى سد فجوة توزيع البيانات. بعد مراعاة المهام المتنوعة المصب، نقترح أن المهام المختلفة قد تحتاج أيضا إلى مرحلة أخرى قبل التدريب مع مهام التدريب المناسبة لسد فجوة صياغة المهمة. للتحقيق في ذلك، نقوم بدراسة لتحسين مهام تسليم الحوار الموجهة نحو المهام المتعددة من خلال تصميم المهام المختلفة في مرحلة ما قبل التدريب المسبق. توضح التجربة أن المهام المختلفة المصب تفضل مزيد من المهام التدريبية المسبقة المختلفة، والتي لها علاقة جوهرية وأكبر مهام التدريب المسبق بشكل كبير تحسين المهام المستهدفة بشكل كبير بدلا من ذلك. يشير تحقيقنا إلى أنه من الأهمية والفعالية الكبرى لتصميم مهام التدريب المسبق المناسبة نمذجة معلومات محددة تفيد بمهام المصب. بالإضافة إلى ذلك، نقدم استنتاجات تجريبية بناءة متعددة لتعزيز الحوارات الموجهة نحو المهام.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن استخدام أساليب تحضير التربة الزراعية مع السماد البقري تعد من أهم العمليات التي تقوم بتحويل التربة و جعلها صالحة لاستقبال الوحدات التكاثرية للمحاصيل المراد زراعتها و تأمين الظروف المناسبة لتغذية النبات فيما بعد، و زيادة إنتاجه كما" و نوعا" مع الم حافظة على خصائص التربة الزراعية، و انطلاقا" من هذه الأهمية تم تنفيذ بحث في المنطقة الشرقية من محافظة حمص خلال الموسم الزراعي (2013-2014) باستخدام خمسة أساليب لحراثة التربة الزراعية مع إضافة السماد البلدي.
مزيد من النماذج اللغوية المسبقة للتدريب على البيانات داخل المجال (التدريب المسبق مسبقا، Dapt) أو البيانات ذات الصلة (TAME-APT-APTICTIVE، TAPT) قبل أن تؤدي إلى تحسين أداء المهام المصب.ومع ذلك، في نمذجة الحوار الموجهة نحو المهام، نلاحظ أن مزيد من الامت يازات التدريبية قبل التدريب لا تعزز دائما الأداء في مهمة المصب.نجد أن DIST مفيد في إعداد الموارد المنخفضة، ولكن نظرا لأن حجم بيانات ضبط الرصيف ينمو، يصبح DIST أقل فائدة أو حتى عديمة الفائدة، وتوسيع نطاق حجم بيانات Dapt لا يساعد.من خلال تحليل التشابه التمثيلي، نستنتج أن المزيد من البيانات الخاصة بالضبط بشكل جيد غلة تغيير أكبر في تمثيلات النموذج وبالتالي تقلل من تأثير التهيئة.
يمكن فهم لغات الموارد المنخفضة كنغات أكثر شحيحة، وأقل دراستها، أقل امتيازا، أقل شيوعا، والتي تكون أقل شيوعا والتي توجد فيها موارد أقل (Singh، 2008؛ Cieri et al.، 2016؛ Magueresse et al.، 2020) وبعد يركز البحث والتكنولوجيا لمعالجة اللغة الطبيعية (NLP) بشكل أساسي على تلك اللغات التي توجد بها مجموعات بيانات كبيرة متاحة. لتوضيح الاختلافات في توافر البيانات: هناك 6 ملايين مقالة في ويكيبيديا المتاحة للغة الإنجليزية، 2 مليون للهولندية، ومجرد 82 ألف للألبانية. تصبح قضية البيانات الشحيحة واضحة بشكل متزايد عندما تكون مجموعات البيانات المتوازية الكبيرة مطلوبة للتطبيقات مثل الترجمة الآلية العصبية (NMT). في هذا العمل، يمكننا التحقيق في أي مدى من الممكن الترجمة بين الألبانية (SQ) والهولندية (NL) مقارنة نموذج واحد إلى واحد (SQ↔AL)، نهج يستند إلى موارد منخفضة الموارد (الإنجليزية (EN) Pivot) والترجمة الصفرية بالرصاص (ZST) (جونسون وآخرون، 2016؛ نظام ماتوني وآخرون.، 2017). من تجاربنا، فإنه ينتج عن تفوق نموذج EN-PIVOT على حد سواء من طراز Zst المباشر. منذ غالبا ما تكون كميات صغيرة من البيانات الموازية متاحة لغات الموارد المنخفضة أو الإعدادات المنخفضة، أجريت التجارب باستخدام مجموعات صغيرة من بيانات NL↔SQ الموازية. بدا أن Zst هو أسوأ نماذج أداء. حتى عندما تمت إضافة البيانات الموازية المتاحة (nl↔sq)، أي في إعداد قليل من اللقطة (FST)، ظلت أسوأ نظام أداء وفقا ل Automatic (Bleu and Ter) والتقييم البشري.
الهدف: أجريت هذه الدراسة المستقبلية لتحليل الاختلاطات خلال الجراحة و بعدها بين استئصال الرحم عن طريق البطن و استئصال الرحم عن طريق المهبل. مواد و طرق البحث: شملت الدراسة 120 مريضة (85 مريضة خضعن لاستئصال بطني و 35 مريضة خضعن لاستئصال رحم مهبلي ) و ذلك بقسم النسائية في مشفى الأسد الجامعي في اللاذقية في الفترة بين 1/7/2013 و 1/7/2014 . النتائج: كان معدل فترة العمل الجراحي في مجموعة الاستئصال البطني 103 دقيقة مقارنة مع 91 دقيقة في مجموعة الاستئصال المهبلي p=0,0192)). كانت أخماج الشق الجراحي أشيع سبب لارتفاع الحرارة بعد العمل الجراحي في مجموعة الاستئصال البطني بينما كانت الأخماج البولية أشيع سبب لذلك في مجموعة الاستئصال المهبلي. كان هناك 3 (3,5%) حالات لإصابة المثانة و حالتين (2,8%) لإصابات الحالب في مجموعة الاستئصال البطني بينما لم تسجل حالات لإصابة المثانة أو الحالب في مجموعة الاستئصال المهبلي. كانت هناك 3 (3,5%) حالات لنزف ثانوي بعد الجراحة في مجموعة الاستئصال البطني بينما سجلت حالة واحدة (2,8%) في مجموعة الاستئصال المهبلي. كان هناك 8 (9,4%) حالات من انسداد الأمعاء الشللي في مجموعة الاستئصال البطني بينما لم تجل أي حالة في مجموعة الاستئصال المهبلي . أما مجمل الاختلاطات فكانت 45 (52,9%) حالة في مجموعة الاستئصال البطني مقارنة مع 12 (34,2%) حالة في مجموعة الاستئصال المهبلي ((p=0,029.الاستنتاج : أظهرت هذه الدراسة أن استئصال الرحم عن طريق المهبل يترافق مع اختلاطات أقل خلال و بعد الجراحة مقارنة مع استئصال الرحم عن طريق البطن.
عادة ما يتم تدريب نماذج الترجمة الآلية العصبية (NMT) باستخدام فقدان انتروبيا Softmax حيث يتم مقارنة توزيع SoftMax بالملصقات الذهبية. في سيناريوهات منخفضة الموارد ونماذج NMT تميل إلى الأداء بشكل سيئ لأن التدريب النموذجي يتقارن بسرعة إلى نقطة حيث يتجاه ل توزيع SoftMax باستخدام تسجيل الدخول إلى توزيع تسمية الذهب. على الرغم من أن تجانس الملصقات هو حل مشهور لمعالجة هذه المشكلة، فإننا نقترح مزيد من اقتراح تقسيم السجلات بواسطة معامل درجة الحرارة أكبر من واحد وإجبار توزيع SoftMax على أن يكون أكثر سلاسة أثناء التدريب. هذا يجعل من الصعب على النموذج بسرعة أكثر من اللازم. في تجاربنا على 11 أزواج لغوية في مجموعة بيانات Treebank الآسيوية المنخفضة الموارد، لاحظنا تحسينات كبيرة في جودة الترجمة. يركز تحليلنا على إيجاد التوازن الصحيح من تجانس الملصقات و SoftMax STIVING والتي تشير إلى أنها طرق متعامدة. وأخيرا، تكشف دراسة الانترشيات والتجميلات SoftMax عن تأثير طريقتنا على السلوك الداخلي لنماذج NMT الخاصة بنا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا