مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

Google-trickers، Yaminjeongeum، و Leetspeak: تصنيف تجريبي للنص المولّد من المستخدم الحاوي على ضجيج

Google-trickers, Yaminjeongeum, and Leetspeak: An Empirical Taxonomy for Intentionally Noisy User-Generated Text

503 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

تحذير: تحتوي هذه المقالة على محتويات قد تسيء إلى القراء. الاستراتيجيات التي تنشر ضجيجا متعمدا في نص عند نشرها شائعة في فضاء الإنترنت، وأحيانا تهدف إلى السماح لبعض أفراد المجتمع فقط بفهم الدلالات الحقيقية. في هذه الورقة، نستكشف الغرض من هذه الإجراءات عن طريق تصنيفها إلى حيل و ميمز وفلاتر والأكواد، وتنظيم الاستراتيجيات اللغوية المستخدمة في كل غرض. من خلال ذلك، نحدد أن يتم إجراء هذه الاستراتيجيات من قبل مؤلفين لأغراض متعددة، فيما يتعلق بوجود أصحاب المصلحة مثل الأقران والآخرين.ونحلل أخيرا كيفية ظهور هذه الاستراتيجيات بشكل مختلف في كل ظرف من الظروف، إلى جانب الأمثلة المصاحبة للتصنيف الموحد.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

499 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

من المعروف أن حساسية النماذج العميقة العصبية لضوضاء الإدخال مشكلة صعبة.في NLP، يتدهور أداء النموذج غالبا مع الضوضاء التي تحدث بشكل طبيعي، مثل الأخطاء الإملائية.لتخفيف هذه المشكلة، قد تستفيد النماذج البيانات الوكيل بشكل مصطنع.ومع ذلك، تم تحديد كمية ون وع الضوضاء التي تم إنشاؤها حتى الآن بشكل تعسفي.لذلك نقترح نموذج الأخطاء الإحصائية من كورسا - تصحيح الأخطاء النحوية.نقدم تقييم شامل للعديد من متواك أنظمة NLP الحديثة لغات متعددة، مع المهام بما في ذلك التحليل المورفو النحوي، التعرف على الكيان المسمى، الترجمة الآلية العصبية، مجموعة فرعية من مرجع الغراء والفهم القراءة.نحن نقارن أيضا مناهضين لمعالجة انخفاض الأداء: أ) تدريب نماذج NLP مع البيانات الوكيل التي تم إنشاؤها بواسطة إطار عملائنا؛و ب) تقليل ضوضاء الإدخال بالنظام الخارجي لتصحيح اللغة الطبيعية.يتم إصدار الرمز في https://github.com/ufal/kazitext.

user-generated noisy texts noisy texts user-generated noisy النصوص الناتجة عن المستخدم نصوص صاخبة صاخبة التي تم إنشاؤها صناعة حمض الفوسفور المزيد..

النص الذي تم إنشاؤه من قبل المستخدم لتقييم التحليل المورفولوجي الياباني والتطبيع المعجمي

401 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تحليل مورفولوجي (MA) والتطبيع المعجمي (LN) هي مهام مهمة للنص الياباني الذي تم إنشاؤه بواسطة المستخدمين (UGT).لتقييم ومقارنة أنظمة MA / LN المختلفة، قمنا ببناء كوربوس UGT اليابانية المتاحة للجمهور.يشتمل كوربوس لدينا على 929 جمل مشروحة مع معلومات مورفو لوجية وتطبيعا، إلى جانب معلومات الفئة المصنفة لظواهر خاصة بوحشية UGT.أظهرت التجارب على الجثة أداء أداء منخفضة من أساليب MA / LN الحالية للكلمات غير العامة والنماذج غير القياسية، مما يشير إلى أن الكائن ستكون معيارا صعبا لمزيد من البحث حول UGT.

evaluating japanese morphological japanese user-generated text japanese morphological analysis تقييم المورفولوجية اليابانية النص الياباني الناتج عن المستخدم التحليل المورفولوجي الياباني صناعة حمض الفوسفور المزيد..

المماثلون الضيقون الكورية ضيقة من الناحية المورفية للنصوص التي تم إنشاؤها من قبل صاخبة

418 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تشمل النصوص التي تم إنشاؤها من قبل المستخدم أنواعا مختلفة من الخصائص الأسلوبية، أو الضوضاء.لا تتم معالجة مثل هذه النصوص بشكل صحيح من خلال محلل مورفيم الحاليين أو نماذج اللغة القائمة على النصوص الرسمية مثل الموسوعات أو المقالات الإخبارية.في هذه الورقة ، نقترح أذكيلة بسيطة مناسبة مورفولوجية (K-MT) التي يمكن أن تعالج بشكل أفضل الأسماء المعدنية والتعاوض واللغة العامية الإنترنت من بين أنواع أخرى من الضوضاء في النصوص التي تم إنشاؤها من قبل المستخدمين الكورية.لقد اختبرنا خصومنا من خلال إجراء مهام التصنيف في مراجعات الأفلام الكورية التي أنشأها المستخدم ومجموعات بيانات الكلام الكراهية، ومجموعات بيانات التعرف على الكيان الكورية.من خلال اختباراتنا، وجدنا أن K-MT مناسبا بشكل أفضل لمعالجة علاوات الإنترنت والأسماء المناسبة والتعاملات المعدنية، مقارنة بمحلل مورفيم ومزمله لوائح التحميم على مستوى الطابع.

noisy user-generated texts noisy user-generated morphologically tight-fitting tokenizer النصوص التي أنشأها المستخدم صاخبة صاخبة المستخدم مظلمة ضيقة مورفولوجية صناعة حمض الفوسفور المزيد..

عرض التقطير مع بيانات غير مسفولة لاستخراج تأثيرات المخدرات الضارة من البيانات التي تم إنشاؤها من قبل المستخدم

338 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم خوارزمية استنادا إلى محولات متعددة الطبقات لتحديد ردود الفعل الدوائية الضارة (ADR) في بيانات وسائل التواصل الاجتماعي.يعتمد نموذجنا على خصائص المشكلة وخصائص ASTDDings Word السياقي لاستخراج وجهات نظرتين من المستندات.ثم يتم تدريب المصنف على كل طريق ة عرض لتسمية مجموعة من المستندات غير المستخدمة لاستخدامها كتهيئة لتصنيف جديد في الرأي الآخر.أخيرا، يتم تدريب المصنف التهيئي في كل طريقة عرض باستخدام أمثلة التدريب الأولي.قمنا بتقييم نموذجنا في أكبر مجموعة بيانات ADR المتاحة للجمهور.تشهد التجارب أن نموذجنا يتفوق بشكل كبير على النماذج القائمة على المحولات مسبقا على البيانات الخاصة بالمجال.

extracting adverse drug adverse drug effects adverse drug reactions استخراج المخدرات السلبية تأثيرات المخدرات الضارة التفاعلات الدوائية الضارة صناعة حمض الفوسفور المزيد..

اقتراح منهجية لإنتاج صور مصححة عمودياً من صور المتصفح المجاني GOOGLE EARTH

1821 - جامعة تشرين 2015 ورقة بحثية

يعبّر التصحيح العمودي (أو إنتاج الأورتوفوتو) للصور عن عملية تصحيح الصورة هندسياً من التشوهات التي تسببها الطبوغرافية , هندسية آلة التصوير و الأخطاء المرتبطة بالمستشعر. إن ناتج التصحيح العمودي هو صورة مستوية لها الميزات الهندسية للخارطة التقليدية. و ل كن يعتبر الحصول على صور جوية أو فضائية عمليةً مكلفة و تتطلب إجراءات إدارية معقدة. نقترح في هذه الدراسة فكرة و منهجية جديدتين للاستفادة من الصور المجانية المتوفرة في المتصفح Google Earth و ذلك من أجل إنتاج الأورتوفوتو و من ثم سنقوم بتقييم الدقة الأفقية للأورتوفوتو الناتج و ذلك لمعرفة حدود استخدامه تطبيقات هندسية مثل صناعة الخرائط و المخططات و تحديثها. المنهجية المقترحة تقوم على محاكاة عملية الطيران ضمن Google Earth لاقتطاع مزدوج تجسيمي من الصور المتداخلة. بعد ذلك سيتم توجيه المزدوج باستخدام نقاط ضبط. من المزدوج الموجه سيتم توليد نموذج رقمي للأرض و استخدامها في توليد الأورتوفوتو. سيتم لاحقاً دراسة دقة الأورتوفوتو عبر مقارنته بمخطط طبوغرافي مقياس 1/1000 لنفس المنطقة و بصورة فضائية مرجعة بطريقة تقليدية.

صور فضائية Satellite Images تصحيح عمودي نموذج رقمي للأرض المتصفح Google Earth Orthorectification Digital Terrain Model Google Earth المزيد..

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

1441 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة المأمون الخاصة

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

Google-trickers، Yaminjeongeum، و Leetspeak: تصنيف تجريبي للنص المولّد من المستخدم الحاوي على ضجيج

Google-trickers, Yaminjeongeum, and Leetspeak: An Empirical Taxonomy for Intentionally Noisy User-Generated Text

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة