أوراق بحثية, رسائل ماجستير ودكتوراه حول اختيار

النوع كما هو ضعف الإشراف على تحليل التبعية عبر اللغات

276 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

لقد أظهر العمل الحديث أن نماذج اللغة المحظورة غير المؤمنة تعلمت تمثيل مفاهيم تقلص البيانات من تباين اللغة والتي يمكن استخدامها لتحديد بيانات التدريب المستهدف بالمجال. تتوفر تسميات أنواع DataSet في كثير من الأحيان، ومع ذلك لا تزال غير مستكشفة إلى حد ك بير في الإعدادات عبر اللغات. نستفيد هذا النوع من البيانات الوصفية باعتباره إشارة إشرافية ضعيفة لتحديد البيانات المستهدف في تحليل التبعية الصفرية. على وجه التحديد، نقوم بتعيين معلومات النوع من Treebank-Level لمستوى الجملة على مستوى الجملة الدقيقة، بهدف تضخيم المعلومات المخزنة ضمنيا في تمثيلات سياقية غير مدفوعة غير المدعومة. نوضح أن هذا النوع قابل للاسترداد من المدينات السياقية متعددة اللغات وأنه يوفر إشارة فعالة لتحديد بيانات التدريب في السيناريوهات عبر اللغات والصفرية. بالنسبة إلى 12 لغة Low-Resource Treebanks، ستة منها اختبار فقط، فإن أساليبنا الخاصة النوعية تفوقها بشكل كبير خطوط الأساس التنافسية وكذلك الأساليب القائمة على التضمين الحديثة لتحديد البيانات. علاوة على ذلك، يوفر اختيار البيانات المستندة إلى النوع من النوعين نتائج جديدة من الفنادق الجديدة لمدة ثلاثة من هذه اللغات المستهدفة.

تحديد العمل data selection اختيار البيانات صناعة حمض الفوسفور

تقول صورة متحركة ألف كلمة على الأقل: تحديد ردود GIF المستندة إلى GIF في مربع حوار MultiModal

122 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

المحادثات عبر الإنترنت تشمل أكثر من مجرد نص.على نحو متزايد، تعمل الاستجابات القائمة على الصور مثل الميمات وحلويات الرسوم المتحركة استجابات معترف بها ثقافيا وغالبا ما تكون روح الدعابة في المحادثة.ومع ذلك، في حين أن NLP تم توسيعها إلى نماذج متعددة الوس ائط، فإن أنظمة حوار المحادثة تركز إلى حد كبير على توليد الردود النصية فقط.هنا، نقدم مجموعة بيانات جديدة تبلغ 1.56 مليون محادثة Text-GIF تتحول وإدخال نموذج محادثة متعددة الوسائط جديد Pepe جمبري الملك لتحديد الردود القائمة على GIF.نوضح أن نموذجنا ينتج استجابات GIF ذات الصلة وعالية الجودة، وفي تجربة مراقبة عشوائية كبيرة ترد على المستخدمين الحقيقيين، نظين على أن ردودنا النموذجية لدينا مع صور متحركة يتم استلامها بشكل أفضل من قبل المجتمع.

selecting gif-based replies selecting gif-based اختيار الردود القائمة على GIF اختيار gif القائمة صناعة حمض الفوسفور

مجموعة بيانات تقييم واستراتيجية لبناء نموذج اختيار استجابة الاستجابة متعددة الدوران

413 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أظهرت نماذج اختيار الاستجابة متعددة الدوران مؤخرا أداء مماثل للبشر في العديد من البيانات القياسية.ومع ذلك، في البيئة الحقيقية، غالبا ما تحتوي هذه النماذج على نقاط ضعف، مثل اتباع تنبؤات غير صحيحة تستند بشكل كبير على الأنماط السطحية دون فهم شامل للسياق .على سبيل المثال، غالبا ما تعطي هذه النماذج درجات عالية مرشحة للاستجابة الخاطئة التي تحتوي على العديد من الكلمات الرئيسية المتعلقة بالسياق ولكن باستخدام المضارع غير المتناقص.في هذه الدراسة، نقوم بتحليل نقاط الضعف في نماذج اختيار استجابة الاستجابة الكورية من هذا المجال ونشر مجموعة بيانات الخصومة لتقييم هذه نقاط الضعف.نقترح أيضا استراتيجية لبناء نموذج قوي في هذه البيئة الخصومة.

multi-turn response selection building robust multi-turn response selection models اختيار الاستجابة المتعددة بناء قوي الدوران نماذج اختيار الاستجابة صناعة حمض الفوسفور المزيد..

النمذجة السياق على مستوى المستند للكشف عن الحدث من خلال اختيار السياق الهام

263 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تهدف مهمة اكتشاف الحدث (ED) في استخراج المعلومات إلى الاعتراف وتصنيف كلمات الأحداث في النص. تميز التقدم الأخير نماذج لغوية متقدمة للمحولات المتقدمة (على سبيل المثال، بيرت) كعنصر حاسم في النماذج الحديثة للإد. ومع ذلك، فإن الحد الطول لنصوص الإدخال هو ح اجز لمثل هذه النماذج المحددة لأنها لا تستطيع تشفير سياق مستوي المستند طويل المدى الذي ثبت أنه مفيد لإد إد. لمعالجة هذه المشكلة، نقترح طريقة رواية لنموذج سياق مستوى المستندات لتحديد الجمل ذات الصلة بشكل حيوي في وثيقة التنبؤ بالحدث بالسجن الهدف. سيتم بعد ذلك زيادة الجملة المستهدفة بالجمل المختارة وتستهلكها النماذج اللغوية القائمة على المحولات لتعلم التمثيل المحسن. تحقيقا لهذه الغاية، يتم استخدام خوارزمية التعزيز لتدريب اختيار الجملة ذات الصلة من أجل إد. يتم بعد ذلك تقديم العديد من أنواع المعلومات لتشكيل وظيفة المكافآت لعملية التدريب، بما في ذلك أداء إد، وإشراك الجملة، وعلاقات الخطاب. تجاه تجاربنا الواسعة على مجموعات البيانات القياسية المتعددة تكشف عن فعالية النموذج المقترح، مما يؤدي إلى أداء جديد من الفنادق الجديدة.

important context selection important context اختيار السياق الهامة سياق مهم صناعة حمض الفوسفور

عندما يكون الجدار بقلية ومتى مورو؟: قواعد استخراج تحكم اختيار المعجم

319 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يعد تعلم الفروق المحتمات الدقيقة بين العناصر المفردات تحديا رئيسيا في تعلم لغة جديدة.على سبيل المثال، يحتوي جدار الاسم "على مظاهر معجمية مختلفة باللغة الإسبانية - قلص" "يشير إلى جدار داخلي بينما يشير مورو" إلى جدار خارجي.ومع ذلك، قد لا يكون هذا التنو ع من التمييز المعجمي واضحا للمتعلمين غير الأصليين ما لم يتم تفسير التمييز بهذه الطريقة.في هذا العمل، نقدم طريقة لتحديد التفرقات المعجمية المحتلة تلقائيا، واستخراج القواعد في توضيح هذه الفروق بتنسيق قابل للقراءة بين الإنسان والآلات.نحن نؤكد جودة هذه القواعد المستخرجة في إعداد تعلم اللغة لغتين وإسبانيا واليونانيين، حيث نستخدم القواعد لتدريس الناطقين غير الأصلية عند ترجمة كلمة غامضة معينة في ترجماتها المختلفة المحتملة.

governing lexical selection extracting rules governing rules governing lexical الحاكمة اختيار المعجم استخراج القواعد الحاكمة القواعد التي تحكم معجمية صناعة حمض الفوسفور المزيد..

هيكل الجملة ونمذجة علاقة الكلمة للتأكيد

397 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

التحديد التركيز هو مهمة مقترحة حديثا تركز على اختيار الكلمات للتأكيد في جمل قصيرة.الطريقة التقليدية تنظر فقط في معلومات التسلسل من الجملة مع تجاهل هيكل الجملة الغنية ومعلومات علاقة الكلمة.في هذه الورقة، نقترح إطارا جديدا يعتبر هيكل الجملة عبر رسم بيا ني هيكل الجملة وعلاقة كلمة عبر الرسم البياني للكلمة التشابه.يتم اشتقاق الرسم البياني هيكل الجملة من شجرة التحليل من الجملة.يسمح الرسم البياني للكلمة التشابه العقد بمشاركة المعلومات مع جيرانها لأننا نقول أنه في التركيز على التحديد، من المرجح أن يتم التأكيد على كلمات مماثلة معا.يتم استخدام الشبكات العصبية الرسم البياني لتعلم تمثيل كل عقدة لهذين الرسوم البيانية.تظهر النتائج التجريبية أن إطارنا يمكن أن يحقق أداء متفوقا.

word relationship modeling emphasis selection relationship modeling كلمة العلاقة النمذجة التركيز اختيار نموذج النمذجة صناعة حمض الفوسفور المزيد..

استخدام التصفية التعاونية لتحديد الوساطة النموذجية

155 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقيم هذه الدراسة ما إذا كان يمكن استخدام خوارزميات الترشيح التعاونية التعاونية النموذجية (CF)، والتي تمت دراستها على نطاق واسع وتستخدم على نطاق واسع لبناء أنظمة التوصية، للتنبؤ بالأسماء المشتركة التي يمكن أن تتخذها المسند ككمل لها. نجد أنه عند تدريب البيانات المشتركة في الفعل الفعل المنسق من كوربوس الأمريكيين المعاصرين - الإنجليزية (COCA)، اثنين من خوارزميات CF شعبية تعتمد على النموذج، وتحلل القيمة المفرد وعوامل مصفوفة غير سلبية، تؤدي بشكل جيد في هذه المهمة ، يحقق كل منها AUROC من 0.89 على الأقل وتجاوز العديد من خطوط الأساس المختلفة. نوضح بعد ذلك أن ناقلات التضمين للأفعال والأسماء المستفادة من طرازات CF يمكن قياسها (عبر تطبيق K- يعني التجميع) مع الحد الأدنى من فقدان الأداء في مهمة التنبؤ مع استخدام عدد صغير فقط من الأفعال والأسماء (بالنسبة لعدد الأفعال والأسماء المتميزة). أخيرا، نقيم المحاذاة بين ناقلات التضمين الكمي للأفعال وفئات الفعل ليفين، وتجدر عن أن المحاذاة تجاوزت العديد من خطوط الأساس العشوائية. نستنتج عن طريق مناقشة كيفية تطبيق خوارزميات CF النموذجية القائمة على قيود التعلم على الاختيار المكونات بين مختلف الفئات المعجمية وكيف يمكن بعد ذلك استخدام هذه النماذج (المستفادة) لزيادة قواعد الدائرة الانتخابية (القاعدة).

model-based collaborative filtering model argument selection الترشيح التعاونية القائمة على النموذج تصفية التعاونية اختيار الحجة النموذجية صناعة حمض الفوسفور

التدريب الذاتي ل NLG العصبي التركيبي في الحوار الموجه نحو المهام

435 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

عادة ما تتطلب النهج العصبية لتوليد اللغة الطبيعية في الحوار الموجه في المهام كميات كبيرة من بيانات التدريب المشروح لتحقيق أداء مرض، خاصة عند توليد المدخلات التركيبية. لمعالجة هذه المشكلة، نظهر أن التدريب الذاتي المعزز مع فك التشفير المقيد غلة مكاسب ك بيرة في كفاءة البيانات على مجموعة بيانات الطقس التي توظف تمثيلات المعنى المتراكم. على وجه الخصوص، تشير تجاربنا إلى أن التدريب الذاتي مع فك التشفير المقيد يمكن أن تمكن نماذج التسلسل إلى التسلسل لتحقيق جودة مرضية باستخدام بيانات أقل من خمسة إلى عشرة أضعاف بيانات أقل من خط الأساس الخاضع للإشراف العادي؛ علاوة على ذلك، من خلال الاستفادة من النماذج المحددة، يمكن زيادة كفاءة البيانات إلى خمسين مرة. نؤكد النتائج التلقائية الرئيسية مع التقييمات البشرية وإظهار أنها تمتد إلى نسخة محسنة وتركيبية من DataSet E2E. والنتيجة النهائية هي نهج يجعل من الممكن تحقيق أداء مقبول على مهام NLG التركيبية باستخدام المئات بدلا من عشرات الآلاف من عينات التدريب.

اختيار المعرفة compositional neural nlg neural nlg التركيب العصبي nlg. nlg. nlg. صناعة حمض الفوسفور

اختيار المعرفة متعددة الجملة في الحوار مفتوح المجال

446 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إن دمج مصادر المعرفة الخارجية بفعالية في المحادثات هي مشكلة طويلة الأمد في أبحاث الحوار مفتوح المجال. إن الأدبيات الموجودة على اختيار المعرفة المفتوحة للمجال محدود ويقتصر بعض الافتراضات الهشة على مصادر المعرفة لتبسيط المهمة الشاملة، مثل وجود عقوبة مع رفة واحدة ذات صلة لكل سياق. في هذا العمل، نقوم بتقييم حالة اختيار معرفة محادثة المحادثة مفتوحة للمجموعات، حيث تظهر المنهجيات الحالية المتعلقة بالبيانات والتقييم معيبة. ثم نحسنها من خلال اقتراح إطار جديد لجمع المعرفة ذات الصلة، وإنشاء مجموعة بيانات معدنية بناء على معالج كوربوس ويكيبيديا (WOW)، والتي نسميها نجاح باهر ++. WOW ++ المتوسطات 8 جمل المعرفة ذات الصلة لكل سياق حوار، واحتضان الغموض المتأصل من اختيار معرفة حوار المجال المفتوح. بعد ذلك، نقدر خوارزميات تصنيف المعرفة المختلفة على هذه البيانات المعززة مع كل من التقييم الجوهري وتدابير خارجية لجودة الاستجابة، والتي تبين أن Rerankers العصبية التي تستخدم WOW ++ يمكن أن تفوق المهاحين المدربين على مجموعات البيانات القياسية.

multi-sentence knowledge selection open-domain dialogue knowledge selection اختيار المعرفة متعددة الجملة الحوار مفتوح المجال اختيار المعرفة صناعة حمض الفوسفور المزيد..

اختيار طبقة لينة مع التعلم التلوي لنقل الصفر القصير عبر اللغات

311 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

حققت نماذج التضمين السياقية المدربة مسبقا متعددة اللغات (Devlin et al.، 2019) أداء مثير للإعجاب على مهام نقل اللغات الصفرية.من خلال إيجاد استراتيجية ضبط الدقيقة الأكثر فعالية لضبط هذه النماذج على لغات الموارد عالية الموارد بحيث تقوم بتحويلاتها جيدا ل غات اللغات الصفرية هي مهمة غير تافهة.في هذه الورقة، نقترح رواية ميتا المحسن إلى طبقات ناعمة في طبقات النموذج المدرب مسبقا لتجميدها أثناء الضبط.نحن ندرب ميتا المحسن عن طريق محاكاة سيناريو نقل الصفر بالرصاص.تشير النتائج على الاستدلال اللغوي المتبادل اللغوي إلى أن نهجنا يحسن على خط الأساس البسيط للضبط و X-Maml (Nooralahzadeh et al.، 2020).

soft layer selection selection with meta-learning layer selection اختيار طبقة لينة اختيار مع التعلم التعريف اختيار طبقة صناعة حمض الفوسفور المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد