ترغب بنشر مسار تعليمي؟ اضغط هنا

تقييم نموذج الكشف عن الخداع متواضع على التباين اللغوي

Evaluating Deception Detection Model Robustness To Linguistic Variation

266   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

مع الاستخدام المتزايد لأحكام الخوارزميات المدفوعة بالجهاز، من الأهمية بمكان تطوير النماذج القوية في المدخلات المتطورة أو التلاعب بها.نقترح تحليلا واسع النطاق من المتانة النموذجي ضد التباين اللغوي في تحديد الكشف الأخبار الخادع، وهي مهمة مهمة في سياق المعلومات الخاطئة المنتشرة عبر الإنترنت.نحن نفكر في مهام التنبؤ ومقارنة ثلاثة من المدينات الحديثة لتسليط الضوء على الاتجاهات المتسقة في الأداء النموذجي، وتظليل الثقة العالي، والإخفاقات عالية التأثير.من خلال قياس فعالية استراتيجيات الدفاع المشددي وتقييم الحساسية النموذجية للهجمات الخصومة باستخدام نص غير مضطرب للشخصية، نجد أن الطابع أو النماذج المختلطة هي الدفاعات الأكثر فعالية وأن تكتيكات الهجوم القائم على الاضطرابات الأكثر نجاحا.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

من المعروف أن حساسية النماذج العميقة العصبية لضوضاء الإدخال مشكلة صعبة.في NLP، يتدهور أداء النموذج غالبا مع الضوضاء التي تحدث بشكل طبيعي، مثل الأخطاء الإملائية.لتخفيف هذه المشكلة، قد تستفيد النماذج البيانات الوكيل بشكل مصطنع.ومع ذلك، تم تحديد كمية ون وع الضوضاء التي تم إنشاؤها حتى الآن بشكل تعسفي.لذلك نقترح نموذج الأخطاء الإحصائية من كورسا - تصحيح الأخطاء النحوية.نقدم تقييم شامل للعديد من متواك أنظمة NLP الحديثة لغات متعددة، مع المهام بما في ذلك التحليل المورفو النحوي، التعرف على الكيان المسمى، الترجمة الآلية العصبية، مجموعة فرعية من مرجع الغراء والفهم القراءة.نحن نقارن أيضا مناهضين لمعالجة انخفاض الأداء: أ) تدريب نماذج NLP مع البيانات الوكيل التي تم إنشاؤها بواسطة إطار عملائنا؛و ب) تقليل ضوضاء الإدخال بالنظام الخارجي لتصحيح اللغة الطبيعية.يتم إصدار الرمز في https://github.com/ufal/kazitext.
يمكن اكتشاف الوظائف الإخبارية الخادعة المشتركة في المجتمعات عبر الإنترنت مع نماذج NLP، وقد ركزت البحوث الحديثة الكثير على تطوير هذه النماذج.في هذا العمل، نستخدم خصائص المجتمعات والمؤلفين عبر الإنترنت --- سياق كيفية نشر المحتوى - - لشرح أداء نموذج كشف الخداع الشبكي العصبي وتحديد السكان الفرعيين الذين يتأثرون بشكل غير متناسب بدقة نموذجيةأو الفشل.نحن ندرس من يقوم بنشر المحتوى، وحيث يتم نشر المحتوى إليه.نجد أنه في حين أن خصائص المؤلف هي أفضل من المتنبئين من المحتوى الخادع من الخصائص المجتمعية، فإن كلا الخصائص مرتبطة بقوة بأداء نموذجي.قد تفشل مقاييس الأداء التقليدية مثل درجة F1 في التقاط أداء نموذجي ضعيف على السكان الفرعيين المعزولين مثل المؤلفين المحددين، وعلى هذا النحو، فإن التقييم الأكثر دقة لنماذج الكشف عن الخداع أمر بالغ الأهمية.
إن القدرة على التباين في استخدام اللغة ضروري للمتحدثين لتحقيق أهدافهم المحادثة، على سبيل المثال عند الإشارة إلى الكائنات في البيئات المرئية.نقول أن التنوع لا ينبغي أن يكون على غرار كهدف مستقل في الحوار، ولكن يجب أن يكون نتيجة لذلك أو منتج ثاني لتوليد اللغة الموجهة نحو الأهداف.تم التحقيق في خطوط عمل مختلفة في توليد اللغة العصبية طرق فك تشفيرها لتوليد المزيد من الكلمات المتنوعة، أو زيادة المعلوماتية من خلال التفكير العملي.نربط تلك خطوط العمل وتحليل كيفية تأثير المنطق العملي أثناء فك التشفير على تنوع التسميات التوضيحية الناتجة عنها.نجد أن تعزيز التنوع نفسه لا يؤدي إلى تسهيلات مفيدة بشكل أكثر عمليا، لكن المنطق العملي يزيد من التنوع المعجمي.أخيرا، نناقش ما إذا كان الاستفادة من المعلوماتية بطرق غير معقولة بمرحلة ما بين اللغوي.
باللغة العربية، يتم استخدام علامات التشكيل لتحديد المعاني وكذلك النطق.ومع ذلك، غالبا ما يتم حذف الدروع من النصوص المكتوبة، مما يزيد من عدد المعاني والنطوقتين المحتملة.هذا يؤدي إلى نص غامض ويجعل العملية الحسابية على النص غير المسموح به أكثر صعوبة.في ه ذه الورقة، نقترح نموذج إعماري لغوي للترشف عن النص العربي (لاماد).في لاماد، يتم تقديم تمثيل ميزة لغوية جديدة، والذي يستخدم كل من ملامح الكلمة والأحرف السياقية.بعد ذلك، يقترح آلية الاهتمام اللغوي التقاط الميزات اللغوية المهمة.بالإضافة إلى ذلك، نستكشف تأثير الميزات اللغوية المستخرجة من النص على درج النص العربي (ATD) عن طريق إدخالها لآلية الاهتمام اللغوي.توضح النتائج التجريبية الواسعة على ثلاث مجموعات بيانات بأحجام مختلفة أن لاماد تتفوق على النماذج الحالية للحالة.
تكمن الشبكة العصبية الباهظة الثمنية والذاكرة الكثيفة وراء النجاح الأخير لتعلم تمثيل اللغة. نقل المعرفة، وهي تقنية رئيسية لنشر مثل هذا النموذج اللغوي الواسع في البيئات النادرة من الموارد، ينقل المعرفة المتعلقة بتمثيلات الكلمات الفردية المستفادة دون قي ود. في هذه الورقة، مستوحاة من الملاحظات الأخيرة أن تمثيلات اللغة في وضع معرفة نسبيا ولديها معرفة أكثر دلالة ككل، نقدم هدف تقطير معارف جديد لتعلم تمثيل اللغة الذي ينقل المعرفة السياقية عبر نوعين من العلاقات عبر الإنترنت: علاقة كلمة وطبقة تحول العلاقة. على عكس تقنيات التقطير الأخيرة الأخرى لنماذج اللغة، فإن تقطيرنا السياقي ليس لديه أي قيود على التغييرات المعمارية بين المعلم والطالب. نحن نقوم بالتحقق من فعالية طريقتنا حول المعايير الصعبة لمهام فهم اللغة، ليس فقط في بنية الأحجام المختلفة ولكن أيضا بالاشتراك مع Dynabert، طريقة تشذيب الحجم التكيفي المقترح مؤخرا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا