ترغب بنشر مسار تعليمي؟ اضغط هنا

ضربة صافرة الكلب: مجموعة بيانات صينية لا أستطيع التفاهم مع الحس السليم والمعرفة العالمية

Blow the Dog Whistle: A Chinese Dataset for Cant Understanding with Common Sense and World Knowledge

271   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

غير قادر على أهمية فهم الإعلان والكوميديا وسياسة الكلب الصافرة.ومع ذلك، يتم إعاقة البحوث الحسابية على غير قادر على عدم وجود مجموعات البيانات المتاحة.في هذه الورقة، نقترح مجموعة بيانات صينية كبيرة ومتنوعة لإنشاء وفهم غير قادر على منظور اللغويات الحسابية.نحن صياغة مهمة لا يمكن فهمها وتوفير كل من التحليل الكمي والنوعي لكل من كلمة اختبار تضمين التشابه واللغة المحددة مسبقا.تشير التجارب إلى أن هذه المهمة تتطلب فهم اللغة العميقة والضمان السليم والمعرفة العالمية وبالتالي يمكن أن يكون اختبارا جيدا من أجل نماذج اللغة المحددة مسبقا ونماذج المساعدة تؤدي بشكل أفضل على المهام الأخرى.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

لفتت تلخيص الحوار اهتماما كبيرا مؤخرا. خاصة في مجال خدمة العملاء، يمكن للوكلاء استخدام ملخصات الحوار للمساعدة في زيادة أعمالهم من خلال معرفة قضايا العملاء بسرعة وتقدم الخدمة. تتطلب هذه التطبيقات ملخصات لاحتواء منظور مكبر صوت واحد ولديك هيكل تدفق موضو ع واضح، في حين لا يتوفر في مجموعات البيانات الحالية. لذلك، في هذه الورقة، نقدم مجموعة بيانات صينية جديدة لتلخيص حوار خدمة العملاء (CSDS). يعمل CSDS على تحسين الملخصات الإفراطية في جوانب: (1) بالإضافة إلى الملخص العام للحوار بأكمله، كما يتم تقديم ملخصات الأدوار أيضا للحصول على وجهات نظر مكبرات صوت مختلفة. (2) تلخص جميع الملخصات لكل موضوع بشكل منفصل، وبالتالي تحتوي على هيكل مستوى الموضوع للحوار. نحدد المهام في CSDS كمولية الملخص الشامل والملخصات المختلفة الموجهة نحو الأدوار لحوار معين. بعد ذلك، نقارن العديد من طرق التلخيص على CSDS، وإظهار نتائج التجربة أن الطرق الحالية عرضة لتوليد ملخصات زائدة وغير متماسكة. علاوة على ذلك، يصبح الأداء أسوأ بكثير عند تحليل الأداء في ملخصات الأدوار وهياكل الموضوعات. نأمل أن تتمكن هذه الدراسة من مراجعة تلخيص الحوار الصيني وفائدة المزيد من الدراسات.
اجتذبت تحليل المعنويات الاهتمام المتزايد في التجارة الإلكترونية. تعتبر أسابير المشاعر الأساسيين لمراجعات المستخدمين ذات قيمة كبيرة لذكاء الأعمال. تحليل المعنويات الفئة في الأساس (ACSA) ومراجعة التنبؤ بالتصنيف (RP) هما مهامان أساسيان للكشف عن أسطاطات المشاعر الدقيقة إلى الخشنة. ترتبط ACSA و RP بشكل كبير وعادة ما تستخدم بشكل مشترك في سيناريوهات التجارة الإلكترونية في العالم الحقيقي. في حين يتم بناء معظم مجموعات البيانات العامة ل ACSA و RP بشكل منفصل، مما قد يحد من استغلالهما الإضافي لكلتا المهام. لمعالجة المشكلة والبحثات المتقدمة ذات الصلة، نقدم مراجعة مطعم صيني واسع النطاق في اسرع وقت ممكن في اسرع وقت ممكن في اسرع وقت ممكن 46، 730 مراجعات أصلية من نظام التجارة الإلكترونية الرائدة عبر الإنترنت (O2O) في الصين. إلى جانب تصنيف مقياس من 5 نجوم، يتم تفجيح كل مراجعة يدويا وفقا لأقطاب المعنويات نحو 18 فئة من الارتفاع المحدد مسبقا. نأمل أن يتم إلقاء الإفراج عن DataSet على إلقاء بعض الضوء على مجال تحليل المعنويات. علاوة على ذلك، نقترح نموذج مشترك بديهي ولكن فعال ل ACSA و RP. توضح النتائج التجريبية أن النموذج المشترك تفوق خطوط الأساس الحديثة في كلا المهام.
سنلقاشر 17000 وظيفة SNS مع كل من الكثافة العاطفية الشخصية للكاتب وهدف القارئ واحد لبناء مجموعة بيانات تحليل العاطفة اليابانية.في هذه الدراسة، نستكشف الفرق بين الكثافة العاطفية للكاتب والقراء مع هذه البيانات.وجدنا أن القارئ لا يمكن أن يكتشف تماما عواط ف الكاتب، وخاصة الغضب والثقة.بالإضافة إلى ذلك، تظهر النتائج التجريبية في تقدير الشدة العاطفية أنه من الصعب تقدير الملصقات الشخصية للكاتب من القراء.الفجوة الكبيرة بين المشاعر الذاتية والموضوعية تعني تعقيد التعيين من منشور إلى شدة العاطفة الذاتية، والتي تؤدي أيضا إلى أداء أقل مع نماذج تعلم الآلة.
تقدم هذه الورقة مجموعة بيانات جديدة للفيديو واللغة مع إجراءات بشرية للاستدلال المنطقي متعدد الوسائط، والتي تركز على التعبيرات المتعمدة وجوقية تصف الإجراءات البشرية الديناميكية.تتكون DataSet من 200 فيديو، 5554 ملصقات عمل، و 1،942 ثلاثة توائم عمل من ال نموذج (الموضوع، المسند، كائن) يمكن ترجمته بسهولة إلى تمثيلات دلالية منطقية.من المتوقع أن تكون DataSet مفيدة لتقييم أنظمة الاستدلال متعددة الوسائط بين مقاطع الفيديو والجمل المعقدة الدلوية بما في ذلك النفي والكمية.
في هذه الورقة، نقدم نيريل، مجموعة بيانات روسية للتعرف على الكيان المسمى واستخراج العلاقة.نيريل أكبر بكثير من مجموعات البيانات الروسية القائمة: حتى الآن تحتوي على 56 كيلو كيانات المسماة المشروحة وعلاقات مشروحة 39 ألفا.الفرق المهم له من مجموعات البيانا ت السابقة هو شرح للكيانات المسماة المتداخلة، وكذلك العلاقات داخل الكيانات المتداخلة وفي مستوى الخطاب.يمكن أن تسهل نيريل تطوير نماذج جديدة يمكنها استخراج العلاقات بين الكيانات المسماة المتداخلة، وكذلك العلاقات في كل من المستويات والوثائق.يحتوي نيريل أيضا على شرح الأحداث التي تنطوي على الكيانات المسماة وأدوارها في الأحداث.تتوفر مجموعة Nerel عبر https://github.com/nerel-ds/nerel.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا