ترغب بنشر مسار تعليمي؟ اضغط هنا

ESC: إعادة تصميم WSD مع فهم المعنى الاستخراجي

ESC: Redesigning WSD with Extractive Sense Comprehension

174   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تعد Disambiguation Sense (WSD) مهمة تاريخية NLP تهدف إلى ربط الكلمات في سياقات المخزونات المنفصلة، ​​وعادة ما يلقي بمثابة مهمة تصنيف متعدد العلامات. في الآونة الأخيرة، استخدمت العديد من الأساليب العصبية تعاريف المعنى التي تمثل أفضل معاني الكلمة. ومع ذلك، فإن هذه الأساليب لا تلاحظ جملة الإدخال والمرشحين لتعريف الشعور مرة واحدة، وبالتالي يحتمل أن يقلل من أداء النموذج وقوة التعميم. نحن نتعامل مع هذه المشكلة عن طريق إعادة صياغة WSD كمشكلة استخراج تمتد --- ما الذي وصفناه بالمعنى الاستخراجي الفهم (ESC) --- واقتراح إشراف، وهي عبارة عن بنية عصبية قائمة على المحولات لهذه الصيغة الجديدة. عن طريق مجموعة واسعة من التجارب، نظهر أن ESC أطلق العنان للإمكانات الكاملة لطرازنا، مما يؤدي إلى تجاوز جميع منافسيها ووضع دولة جديدة من الفن في مهمة WSD الإنجليزية. في السيناريو القليل من اللقطات، يثبت الإشراق استغلال بيانات التدريب بكفاءة، حيث تحقق نفس الأداء كأقرب منافسها أثناء الاعتماد على التعليقات التوضيحية أقل ثلاث مرات تقريبا. علاوة على ذلك، يمكن للإنسير أن تجمع بين البيانات المشروحة مع الحواس من الموارد المعجمية المختلفة، وتحقيق العروض التي كانت خارج متناول الجميع. يتوفر النموذج مع البيانات في https://github.com/sapienzanlp/sc.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

الفهم القراءة الآلة التفاعلية (IMRC) هو مهام فهم الجهاز حيث تكون مصادر المعرفة يمكن ملاحظتها جزئيا.يجب أن يتفاعل الوكيل مع بيئة بالتتابع لجمع المعرفة اللازمة من أجل الإجابة على سؤال.نحن نفترض أن تمثيلات الرسم البياني هي تحيزات حثي جيدة، والتي يمكن أن تكون بمثابة آلية ذاكرة الوكيل في مهام IMRC.نستكشف أربع فئات مختلفة من الرسوم البيانية التي يمكنها التقاط معلومات نصية على مختلف المستويات.نحن تصف الأساليب التي تقوم ببناء وتحديث هذه الرسوم البيانية هذه ديناميكيا أثناء جمع المعلومات، وكذلك النماذج العصبية لتشفير تمثيلات الرسم البياني في وكلاء RL.تشير تجارب واسعة النطاق على ISquad إلى أن تمثيلات الرسم البياني يمكن أن تؤدي إلى تحسينات كبيرة في الأداء لعوامل RL.
تلخيص استخراج الجملة تقصر وثيقة عن طريق اختيار الجمل للحصول على ملخص مع الحفاظ على محتوياتها المهمة.ومع ذلك، فإن إنشاء ملخص متماسك وغني مفيد صلب باستخدام ترميز مدرب مسبقا مدربا مسبقا لأنه لا يتم تدريبه صراحة على تمثيل معلومات الجمل في وثيقة.نقترح نمو ذج تلخيص الاستخراج المستخرج في الأشجار المتداخلة على روبرتا (Neroberta)، حيث تتكون هياكل الأشجار المتداخلة من أشجار النحوية والخطاب في وثيقة معينة.النتائج التجريبية على Dataset CNN / DailyMail أظهرت أن Neroberta تتفوق النماذج الأساسية في Rouge.كما أظهرت نتائج التقييم البشري أن Neroberta تحقق نتائج أفضل بكثير من خطوط الأساس من حيث الاتساق وتصل إلى درجات قابلة للمقارنة إلى النماذج التي من بين الفنون.
الملخص نقدم المحول الكمي (كيو تي)، نظام غير مؤظفي لتلخيص الرأي الاستخراجي.يستلهم كيو تي عن طريق السيارات الآلية المتناقلة الكمية، والتي نعدها لتلخيص الشعبية.يستخدم تفسير تجميع الفضاء الكمي وقواريل استخراج جديدة لاكتشاف الآراء الشعبية بين مئات من المر اجعات، وهي خطوة كبيرة نحو تلخيص الرأي للنطاق العملي.بالإضافة إلى ذلك، تتيح كيو تي تلخيص قابل للتحكم دون مزيد من التدريب، من خلال الاستفادة من خصائص المساحة الكمي لاستخراج الملخصات الخاصة بالجانب.كما نجعل مساحة متاحة للجمهور، معيار تقييم واسع النطاق لرموز الرأي، يشتمل على ملخصات عامة وجوقية خاصة ب 50 فندقا.توضح التجارب وعد نهجنا، والتي تتم التحقق من صحتها عن طريق الدراسات الإنسانية حيث أظهر القضاة تفضيل واضح لطريقنا على خطوط الأساس التنافسية.
أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض التقييد، بالنظر إلى سياق، يمكن إزالة كل كلمة بشكل فردي دون أي حساب من الخيارات الأخرى بالمعنى. لمعالجة هذا القيد وإسقاط هذا الافتراض، نقترح الفهم المعنى المستمر (CONSEC)، ونهج جديد في WSD: الاستفادة من إعادة تأكيد مؤخرا لهذه المهمة كمحالة استخراج النص، نحن نتكيافقها على صياغةنا وإدخال حلقة ردود الفعل الاستراتيجية التي تسمح بالغزانة للكلمة المستهدفة لا تتضمن فقط في سياقها ولكن أيضا على الحواس الصريحة المخصصة للكلمات القريبة. نقيم Consec وفحص كيف تقود مكوناتها إلى تجاوز جميع منافسيها وتحديد حالة من الفن الجديد على WSD الإنجليزية. نستكشف أيضا كيفية فرايس Consec في الإعداد المتبادل اللغوي، مع التركيز على 8 لغات مع درجات مختلفة من توفر الموارد، وإبلاغ تحسينات كبيرة على النظم السابقة. نطلق سردنا في https://github.com/sapienzanlp/consec.
نقدم إطار جيل الحوار الاصطناعي، Velocidapter، الذي يعالج مشكلة توافر Corpus لفهم الحوار. DEVERSITS VELOCIDAPTER DEDASTS من خلال محاكاة المحادثات الاصطناعية مجال حوار موجه نحو المهام، تتطلب كمية صغيرة من أعمال Bootstrapping لكل مجال جديد. نحن نقيم فعا لية إطار عملنا على DataSet من فهم الحوار الموجهة نحو المهام، MRCWOZ، الذي نحرشه من خلال التخلص من الأسئلة للحصول على فتحات في المطعم وسيارات الأجرة ومجالات الفنادق من مجموعة بيانات MultiWoz 2.2 (Zang et al.، 2020). نحن ندير تجارب ضمن إعداد موارد منخفضة، حيث نقعمنا نموذجا على الفريق، قم بضبطها على بيانات أصلية صغيرة أو على البيانات الاصطناعية الناتجة عن طريق الإطار الخاص بنا. يظهر VeloCidapter تحسينات كبيرة في استخدام Bertbase والمادة المستندة إلى المحولات كطرازات أساسية. نظل كذلك أن الإطار سهل الاستخدام من قبل مستخدمي المبتدئين واختتموا أن Velocidaper يمكن أن يساعد بشكل كبير في التدريب على الحوارات الموجهة نحو المهام، خاصة بالنسبة لمجالات الناشئة المنخفضة الموارد.

الأسئلة المقترحة

التعليقات (0)
no comments...
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا