ترغب بنشر مسار تعليمي؟ اضغط هنا

الارتباطات الزائفة في تعدين الوسيطة عبر الموضوع

Spurious Correlations in Cross-Topic Argument Mining

272   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يعمل العمل الحديث في محاولات تعدين الحجة عبر الموضوعات لتعلم النماذج التي تعزز عبر الموضوعات بدلا من الاعتماد فقط على الارتباطات الزائفة داخل الموضوع.نحن ندرس فعالية هذا النهج من خلال تحليل إخراج النماذج ذات المهمة الفردية ومتعدد المهام للتطوير عبر الموضوعات التعدين، من خلال مزيج من تقريبية خطية من حدود قراراتهم، وتجميع الميزات اليدوية، أمثلة التحدي، والاعتبارات عبر المدخلاتكلمات.من المستغرب أن نوضح أن النماذج عبر الموضوعات لا تزال تعتمد في الغالب على ارتباطات زائفة وتعميم فقط داخل مواضيع مرتبطة ارتباطا وثيقا، على سبيل المثال، نموذج مدرب فقط على الكلمات الفئة المغلقة وبعض الكلمات المفتوحة الشائعة تفوقت على حالة منالفن المتبادل نموذج المواضيع المستهدفة البعيدة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

من بين القيود الأكثر أهمية في نماذج NLP التعليمية العميقة هي عدم قابلية الترجمة الشفوية، واعتمادها على الارتباطات الزائفة.اقترح العمل السابق مناهج مختلفة لتفسير نماذج الصندوق الأسود للكشف عن الارتباطات الزائفة، ولكن تم استخدام البحث في المقام الأول ف ي سيناريوهات تفاعل الكمبيوتر البشري.لا يزال لا يزال غير متوقع سواء أم لا يمكن استخدام تفسيرات النمطية أو كيفية استخدامها تلقائيا "ميزات مربكة".في هذا العمل، نقترح التأثير على الضبط --- الإجراء الذي يرفع تفسيرات نموذجية لتحديث معلمات النموذج نحو تفسير معقول (بدلا من التفسير الذي يعتمد على الأنماط الزائفة في البيانات) بالإضافة إلى تعلم التنبؤ بالملصقات المهمة.نظرا لأنه في برنامج إعداد خاضع للرقابة، يمكن أن يساعد التأثير على الضبط في إزالة النموذج من الأنماط الزائفة في البيانات، مما يتفوق بشكل كبير على أساليب خط الأساس التي تستخدم التدريب الخصم.
بعد أداء متزايد لأنظمة الترجمة الآلية العصبية، تتم الآن دراسة نموذج استخدام البيانات المترجمة تلقائيا للتكيف عبر اللغات في العديد من المجالات المعمارية.لا تزال القدرة على شرح المشروع بدقة، ومع ذلك، فإن هناك مشكلة في مهام علامات التسلسل حيث يجب توقع ا لتوضيح بالمسافة الصحيحة.بالإضافة إلى ذلك، عندما تعني المهمة النص الناتج عن المستخدم صاخبة، يمكن أن تتأثر جودة الترجمة والترجمة التوضيحية.في هذه الورقة نقترحنا معالجة تسلسل تسلسل متعدد اللغات مع طريقة محاذاة سبين جديدة وتطبيقها على استخراج هدف الرأي من مراجعات العملاء.نظرا لأن توفير الاستدلال المناسبة، فإن البيانات المترجمة مع الإسقاط التلقائي التلقائي من المستوى التلقائي يمكن أن تسفر عن تحسينات التكيف عبر اللغات مقارنة بنقل الرصاص الصفر، وتعزيز البيانات مقارنة بناس خطي متعدد اللغات.
يتطلب محتوى الوسائط الاجتماعية المتغيرة بسرعة لنماذج الكشف عن إساءة الاستخدام قوية وممتع.ومع ذلك، فإن النماذج الخاضعة للإشراف على أحدث حدوث عرض الأداء المتدهورة عند تقييمها بشأن التعليقات المسيئة التي تختلف عن Training Corpus.نحقق في ما إذا كان أداء النماذج الخاضعة للإشراف للكشف عن إساءة استخدام سوريا يمكن تحسينه من خلال دمج معلومات إضافية من نماذج الموضوع، حيث يمكن أن يستنتج الأخير مخاليط الموضوعات الكامنة من العينات غير المرئية.على وجه الخصوص، نجمع بين المعلومات الموضعية مع التمثيلات من نموذج تم ضبطه لتصنيف التعليقات المسيئة.يكشف تحليل الأداء الخاص بنا أن نماذج الموضوعات قادرة على التقاط الموضوعات المتعلقة بالإساءة التي يمكنها نقلها عبر كوربورا، وتؤدي إلى تحسين التبرعات.
الحجج عالية الجودة هي جزء أساسي من صنع القرار.توقع جودة الوسيطة تلقائيا هي مهمة معقدة حصلت مؤخرا على الكثير من الاهتمام في تعدين الحجة.ومع ذلك، فإن جهود التوضيحية لهذه المهمة مرتفعة بشكل استثنائي.لذلك، نختبر أساليب التعلم النشطة القائمة على عدم اليقي ن (AL) على مجموعتين بيانات قوامها الشائعة لتقدير ما إذا كان يمكن تمكين التعلم الكفء للعينة.يدل تقييمنا التجريبي الواسع أن وظائف الاستحواذ القائمة على عدم اليقين لا يمكن أن تتجاوز الدقة التي تم التوصل إليها مع الاستحواذ العشوائي على مجموعات البيانات هذه.
تحليل Coreference Event Dockence (CDCR) هي مهمة تحديد الأحداث التي تشير إلى نفس الأحداث طوال مجموعة من المستندات. تعد شرح بيانات CDCR عملية شاقة ومكلفة، موضحا سبب وجود كورسا الموجودة صغيرة وتفتقر إلى تغطية المجال. للتغلب على هذه الاختناق، نستخلك تلقا ئيا بيانات Coreference من الارتباطات التشعبية في الأخبار عبر الإنترنت: عند الإشارة إلى حدث كبير في العالم الحقيقي، غالبا ما يقوم الكتاب في كثير من الأحيان بإضافة ارتباط تشعبي إلى مقالة أخرى تغطي هذا الحدث. نوضح أن جمع الارتباطات التشعبية التي تشير إلى نفس المقالة (الأقوالية) تنتج بيانات CDCR واسعة عالية الجودة وإنشاء كائن من وثائق 2M وذكر الحدث الفضي القياسي 2.7M يسمى HyperCoref. نقيم نظام أحدث على ثلاثة CDCR Corpora ويجد أن النماذج المدربة على مجموعات فرعية صغيرة من Hypercoref تنافسية للغاية، مع أداء مشابه للنماذج المدربة على البيانات الذهبية القياسية. مع عملنا، نقوم بحرية بحث CDCR من اعتمادا على بيانات التدريب المكلفة المشروح البشرية وتفتتح إمكانيات للبحث عن البحوث بعد أن يتم تكييف نهج استخراج البيانات لدينا بسهولة مع لغات أخرى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا