ترغب بنشر مسار تعليمي؟ اضغط هنا

مقارنة بتمثيل النص: نهج يحركه النظرية

Comparing Text Representations: A Theory-Driven Approach

231   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

لقد جاء الكثير من التقدم المحرز في NLP المعاصر من تمثيلات التعلم، مثل Embeddings Manked Language Model (MLM)، يتحول إلى مشاكل تحديا في مهام التصنيف البسيطة. ولكن كيف يمكننا تحديد وتفسير هذا التأثير؟ نحن نتكيف مع أدوات عامة من نظرية التعلم الحاسوبية لتناسب الخصائص المحددة لمجموعات البيانات النصية وتقديم طريقة لتقييم التوافق بين التمثيلات والمهام. على الرغم من أن العديد من المهام يمكن حلها بسهولة مع تمثيلات بسيطة من الكلمات (القوس)، فإن القوس لا ضعيف على مهام الاستدلال باللغة الطبيعية الثابت. لأحد هذه المهمة، نجد أن القوس لا يستطيع التمييز بين اللقطات الحقيقية والعشوائية، في حين تظهر تمثيلات الامتيازات المدربة مسبقا تمييزا أكبر بنسبة 72x بين وضع علامات حقيقية وعشوائية من القوس. توفر هذه الطريقة مقياسا معايرة وكمية لصعوبة مهمة NLP القائمة على التصنيف، مما يتيح المقارنات بين التمثيلات دون الحاجة إلى تقييمات تجريبية قد تكون حساسة للتهيئة والفظايات. توفر الطريقة منظورا جديدا على الأنماط الموجودة في مجموعة بيانات ومحاذاة تلك الأنماط مع ملصقات محددة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تعد التطبيع المعجمي، بالإضافة إلى تقسيم الكلمات وعلامات جزء من الكلام، مهمة أساسية لمعالجة النصية اليابانية التي أنشأها المستخدم.في هذه الورقة، نقترح نموذج تحرير النصوص لحل المهمة الثلاثة المشتركة وطرق توليد البيانات المسمى Pseudo للتغلب على مشكلة نق ص البيانات.أظهرت تجاربنا أن النموذج المقترح حقق أداء تطبيع أفضل عند التدريب على بيانات أكثر تنوعا المصممة بالقطرات.
يجب أن تكون أنظمة معالجة اللغة الطبيعية مثل وكلاء الحوار قادرة على سبب معتقدات الآخرين ونواياهم ورغباتهم. هذه القدرة، التي تسمى نظرية العقل (توم)، أمر بالغ الأهمية، حيث تتيح نموذج للتنبؤ وتفسير احتياجات المستخدمين بناء على حالاتهم العقلية. يقيم خط ال أبحاث الحديث إمكانية توم من النماذج العصبية المعززة بالذاكرة الحالية من خلال الإجابة على السؤال. تؤدي هذه النماذج بشكل سيء على مهام الاعتقاد الكاذبة حيث تختلف المعتقدات عن الواقع، خاصة عندما تحتوي مجموعة البيانات على جمل مشتتة. في هذه الورقة، نقترح نهجا جديدا مستنرا مؤقتا لتحسين قدرة توم النماذج العصبية المعززة بالذاكرة. يتضمن نموذجنا بشعورا حول عقول الكيانات وتتبع حالاتهم العقلية لأنهم يتطورون بمرور الوقت من خلال مرور موسع. ثم يستجيب للاستعلامات من خلال السفر النصي - I.E.، عن طريق الوصول إلى الذاكرة المخزنة لخطوة زمنية سابقة. نقوم بتقييم نموذجنا على TOM Datasets ويجد أن هذا النهج يحسن الأداء، خاصة من خلال تصحيح الحالات الذهنية المتوقعة مطابقة الاعتقاد الخاطئ.
تمثل التمثيلات من النماذج الكبيرة المحددة مسبقا مثل Bert مجموعة من الميزات في متجهات غير متجانسة، مما يوفر دقة تنبؤية قوية عبر مجموعة من المهام المصب. في هذه الورقة، نستكشف ما إذا كان من الممكن تعلم تمثيلات محددة من خلال تحديد الشبكات الفرعية الحالية داخل النماذج المحددة التي ترمز الجوانب المميزة والكمية. بشكل ملموس، نتعلم الأقنعة الثنائية على أوزان المحولات أو الوحدات المخفية للكشف عن مجموعات فرعية من الميزات التي ترتبط مع عامل اختلاف محدد؛ هذا يلغي الحاجة إلى تدريب نموذج DESTANGLED من الصفر لمهمة معينة. نقوم بتقييم هذه الطريقة فيما يتعلق بقدرتها على تحفيز تمثيلات المعنويات من النوع في مراجعات الأفلام، السمية من لهجة التغريدات، وبناء جملة من دلالات. من خلال الجمع بين التقليب مع تقليم الحجم، نجد أنه يمكننا تحديد الشبكات الفرعية المتنينة في بيرت التي ترمز بقوة جوانب معينة (على سبيل المثال، الدلالات) في حين ترميز الآخرين ضعيفة (E.G.، بناء الجملة). علاوة على ذلك، على الرغم من الأقنعة التعليمية فقط، فإن الإعفاء من عمليات الإخفاء فقط - - - وغالبا ما تكون أفضل من الأساليب المقترحة سابقا استنادا إلى السيارات الآلية المتنوعة والتدريب الخصم.
تعلم تمثيل كامن جيد ضروري لنقل نمط النص، والذي يولد جملة جديدة عن طريق تغيير سمات جملة معينة مع الحفاظ على محتواها.تعتمد معظم الأعمال السابقة تمثيل تمثيل كامن Disentangled تعلم تحقيق نقل النمط.نقترح خوارزمية نقل نمط النص الجديد مع تمثيل كامن متشابكا، وإدخال مصنف نمط يمكن أن ينظم الهيكل الكامن ونقل النقل.علاوة على ذلك، تنطبق خوارزمية لنقل النمط على كل من سمة واحدة ونقل السمة المتعددة.تظهر النتائج التجريبية الواسعة أن طريقتنا تتفوق بشكل عام على النهج الحديثة.
نحن نحفز واقتراح مجموعة من التحسينات البسيطة ولكنها فعالة لتوليد مفهوم إلى نص يسمى الياقوت: تعيين تعزز وبصورة ما بعد هوك تستلزم وإعادة التركيب.نوضح فعاليتها في مجال المنطق المنطقي الإنتاجية، A.K.a. مهمة Commongen، من خلال تجارب باستخدام نماذج BART و T5.من خلال التقييم التلقائي والبشري الواسع، نعرض أن الياقوت يحسن بشكل ملحوظ أداء النموذج.يوضح التحليل النوعي المتعمق أن الياقوت يتناول بفعالية العديد من القضايا من الأجيال النموذجية الأساسية، بما في ذلك قلة المنطقية وغير كافية من الخصوصية والطلاقة الفقراء.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا