بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

Toxccin: تصنيف المحتوى السام مع الترجمة الشفوية

ToxCCIn: Toxic Content Classification with Interpretability

836 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

toxic content classification content classification classification with interpretability تصنيف المحتوى السام تصنيف المحتوى التصنيف مع الترجمة الشفوية صناعة حمض الفوسفور

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

على الرغم من النجاحات الأخيرة للنماذج المحول القائمة على المحولات من حيث الفعالية في مجموعة متنوعة من المهام، غالبا ما تظل قراراتها مبهمة للبشر.تعتبر التفسيرات مهمة بشكل خاص للمهام مثل اللغة الهجومية أو الكشف عن السمية على وسائل التواصل الاجتماعي لأن عملية الاستئناف اليدوية غالبا ما تكون في مكانها للتنازل عن المحتوى الموضح تلقائيا.في هذا العمل، نقترح تقنية لتحسين إمكانية تفسير هذه النماذج، بناء على افتراض بسيط وقوي: منشور على الأقل سميك مثل أكثر سبتمته سامة.نحن ندمج هذا الافتراض في نماذج المحولات من خلال تسجيل وظيفة بناء على الحد الأقصى للسمية من يمتد ويزيد عملية التدريب لتحديد المواقف الصحيحة.نجد هذا النهج فعال ويمكننا إنتاج تفسيرات تتجاوز جودة تلك المنصوص عليها في تحليل الانحدار اللوجستي (غالبا ما تعتبر نموذجا واضحا للغاية)، وفقا لدراسة بشرية.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

754 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نحن نركز على نوع من المنطق الرسمي اللغوي حيث يكون الهدف هو السبب في معرفة واضحة في شكل حقائق وقواعد لغوية طبيعية (كلارك وآخرون، 2020). يعمل عمل مؤخرا، يدعى Prover (Saha et al.، 2020)، من المنطق من خلال الإجابة على سؤال ويولد أيضا رسم بياني إثبات يشرح الجواب. ومع ذلك، فإن المنطق التركيبي ليس فريدا دائما وقد يكون هناك طرق متعددة للتوصل إلى الإجابة الصحيحة. وهكذا، في عملنا، نتعامل مع مشكلة جديدة وصعبة لتوليد رسوم بيانية إثبات متعددة للمناسبة في قواعد قواعد اللغة الطبيعية. يوفر كل دليل على الأساس المنطقي مختلف للإجابة، وبالتالي تحسين إمكانية تفسير أنظمة المنطق هذه. من أجل التعلم المشترك من جميع الرسوم البيانية المقررة واستغلال الارتباط بين البراهين المتعددة لسؤال، نطرح هذه المهمة كمشكلة توليد محددة على مساحات الإخراج المنظمة حيث يتم تمثيل كل دليل كشركة بيانية موجهة. نقترح اثنين من المتغيرات لطراز جيل مجموعة دليل، Multiprover. ينشئ النموذج الأول لدينا، Multilabel-multiprover، مجموعة من البراهين عبر تصنيف العلامات المتعددة والتكييف الضمني بين البراهين؛ في حين أن النموذج الثاني، Multrive-multriver، يولد دليلا بشكل مثالي من خلال تكييف صريح على البراهين التي تم إنشاؤها مسبقا. تكشف التجارب على مجموعات البيانات الاصطناعية الصفرية، والصفرية، وإشعال مجموعات البيانات، أن كلا من طرازات Multiprover Upperform بشكل كبير تفوق Prover على مجموعات البيانات التي تحتوي على برائق ذهبية متعددة. يحصل Merriative-MultiProver على أحدث دليل على السيناريوهات التي تتميز بالرصاص حيث تحتوي جميع الأمثلة على براهين صحيحة واحدة. كما تعمم بشكل أفضل للأسئلة التي تتطلب أعماق أعلى من التفكير حيث تكون البراهين المتعددة أكثر تواترا.

improved interpretability proofs reasoning تحسين إمكانية الترجمة الشفوية البراهين منطق صناعة حمض الفوسفور المزيد..

Universit \ "في Regensburg Maxs في Germeval 2021 المهمة 1: البيانات الاصطناعية في تصنيف التعليق السام

937 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نبلغ عن تقديمنا إلى المهمة 1 من تحدي جيرفال 2021 - تصنيف التعليق السام.نحقق في طرق مختلفة لتعزيز البيانات التدريبية النادرة لتحسين الأداء النموذجي خارج الرف على مهمة تصنيف سامة للتعليق.للمساعدة في معالجة قيود مجموعة بيانات صغيرة، نستخدم البيانات التي تم إنشاؤها مزخرف بواسطة نموذج GPT-2 الألماني.إن استخدام البيانات الاصطناعية لم تقلع مؤخرا كحل محتمل لبيانات التدريب التدريجي في مجال التصديق في NLP، والنتائج الأولية تعد.ومع ذلك، لم ير نموذجنا تحسنا قياسيا من خلال استخدام البيانات الاصطناعية.نناقش أسباب محتملة لهذا الاكتشاف واستكشاف الأعمال المستقبلية في هذا المجال.

تعليق سام صناعة حمض الفوسفور

الاهتمام المستند إلى المحتوى المستند إلى المحتوى مع محولات التوجيه

894 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تم اعتماد اهتمام الذات مؤخرا لمجموعة واسعة من مشاكل النمذجة التسلسلية. على الرغم من فعاليته، فإن اهتمام الذات يعاني من حساب التربيعي ومتطلبات الذاكرة فيما يتعلق بطول التسلسل. تركز النهج الناجحة للحد من هذا التعقيد على حضور النوافذ المنزلق المحلية أو مجموعة صغيرة من المواقع مستقلة عن المحتوى. يقترح عملنا تعلم أنماط الانتباه ديناميكية متناثرة تتجنب تخصيص الحساب والذاكرة لحضور المحتوى غير المرتبط باستعلام الفائدة. يبني هذا العمل على سطرين من الأبحاث: فهو يجمع بين مرونة النمذجة للعمل المسبق على اهتمام متمرد للمحتوى مع مكاسب الكفاءة من الأساليب القائمة على الاهتمام المحلي والزموني المتناثر. نموذجنا، محول التوجيه، ينفذ عن النفس مع وحدة توجيه متناثرة تعتمد على الوسائل K عبر الإنترنت مع تقليل التعقيد العام للانتباه إلى O (N1.5D) من O (N2D) لطول التسلسل N وبعد المخفي D. نظرا لأن نموذجنا يتفوق على نماذج انتباه متناثرة قابلة للمقارنة على نمذجة اللغة على Wikitext-103 (15.8 مقابل 18.3 حيرة)، وكذلك على جيل الصورة على Imagenet-64 (3.43 مقابل 3.44 بت / خافت) أثناء استخدام طبقات أقل من الاهتمام الذاتي. بالإضافة إلى ذلك، وضعنا مجموعة جديدة من مجموعة جديدة من مجموعة بيانات PG-19 التي تم إصدارها حديثا، والحصول على اختبار حيرة من 33.2 مع نموذج محول توجيه 22 طبقة مدرب على تسلسل الطول 8192. نحن نفتح المصدر لتحويل التوجيه في Tensorflow.1

sparse attention routing transformer efficient content-based sparse انتباه انتباه محول التوجيه فعالة متابعة المحتوى القائم على المحتوى صناعة حمض الفوسفور المزيد..

نمذجة المحتوى والسياق مع التعلم العلائقية العميقة

664 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يتطلب بناء نماذج لمهام اللغة الطبيعية الواقعية التعامل مع النصوص الطويلة والمحاسبة التبعيات الهيكلية المعقدة.ظهرت تمثيلات رمزية عصبية كوسيلة للجمع بين قدرات التفكير في الأساليب الرمزية، مع تعبير الشبكات العصبية.ومع ذلك، فقد صممت معظم الأطر الموجودة ل لجمع بين التمثيل العصبي والرمزي لمهام التعلم العلائقية الكلاسيكية التي تعمل على الكون من الكيانات والعلاقات الرمزية.في هذه الورقة، نقدم دراسنا، وهو إطار إعلاني مفتوح المصدر لتحديد النماذج العلائقية العميقة، مصممة لدعم مجموعة متنوعة من سيناريوهات NLP.يدعم إطارنا سهلا التكامل مع تشفير اللغة التعبيرية، ويوفر واجهة لدراسة التفاعلات بين التمثيل والاستدلالية والتعلم.

content and context modeling content context with deep المحتوى والسياق نمذجة المحتوى السياق مع عميق صناعة حمض الفوسفور المزيد..

نقل أسلوب النص غير مدهش مع تضيير المحتوى

862 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تأخذ مهمة نقل النمط (النمط هنا بمعنى "هنا" مع العديد من الجوانب بما في ذلك التسجيل، وهيكل الجملة، واختيار المفردات) إجراء إدخال النص وإعادة كتابةها في نمط مستهدف محدد يحافظ على المعنى، ولكن تغيير نمط نص المصدر لمطابقة ذلك من الهدف. يعتمد الكثير من ال أبحاث الموجودة في هذه المهمة على استخدام مجموعات البيانات المتوازية. في هذا العمل، نوظف نتائج مؤخرا في نمذجة اللغة المتقاطعة غير المتبادلة (XLM) والترجمة الآلية لنقل النمط أثناء التعامل مع بيانات الإدخال كما غير إجمالي. أولا، نوضح أن إضافة تضمين المحتوى "" إلى XLM والتي تلتقط مجموعة الموضوعات المحددة للإنسان يمكن أن تحسن الأداء على الطراز الأساسي. غالبا ما تعتمد تقييم نقل النمط على المقاييس المصممة للترجمة الآلية التي تلقت انتقاد مدى ملاءمتها لهذه المهمة. كمساهمة ثانية، نقترح استخدام مجموعة من الأنماط الكلاسيكية ككمل مفيد للتقييم. نقوم باختيار بعض هذه التدابير وتشمل هذه في تحليل نتائجنا.

كلمة السياق unsupervised text style نمط النص غير المنصوص عليها صناعة حمض الفوسفور

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2107 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة الأندلس للعلوم الطبية

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

Toxccin: تصنيف المحتوى السام مع الترجمة الشفوية

ToxCCIn: Toxic Content Classification with Interpretability

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة