ترغب بنشر مسار تعليمي؟ اضغط هنا

يعد انتشار الأخبار المزيفة من القضايا الحالية التي تؤثر على عدد من المجالات المهمة في المجتمع ، مثل السياسة والاقتصاد والصحة. في مجال معالجة اللغة الطبيعية ، حاولت المبادرات الأخيرة الكشف عن الأخبار المزيفة بطرق مختلفة، بدءًا من الأساليب القائمة عل ى اللغة إلى التحقق القائم على المحتوى. في مثل هذه الأساليب ، يعد اختيار ميزات تصنيف الأخبار الكاذبة والحقيقية أحد أهم أجزاء العملية. تقدم هذه الورقة دراسة حول تأثير ميزات سهولة القراءة للكشف عن الأخبار المزيفة للغة البرتغالية البرازيلية. تظهر النتائج أن هذه الميزات ذات صلة بالمهمة (تحقق بمفردها دقة تصنيف تصل إلى 92٪) وقد تحسن نتائج التصنيف السابقة. (بحث انكليزي)
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
يقدم هذا البحث دراسة مرجعية عن الخوارزميات و الأنظمة المتوفرة لكشف الانتحال ، و يقوم بتصميم و بناء تطبيق لكشف الانتحال في الأبحاث الطبية بتوظيف الأنطولوجيات الطبية العالمية المتوفرة على الشبكة العنكبوتية . إن مسألة كشف الانتحال في الأبحاث الطبية الم كتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بالمجال الدقيق للابحاث الطبية . يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية و التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات ، و خوارزميات مقارنة محتوى الملفات و التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات . حديثا تم البحث في مجال خوارزميات كشف الانتحال ذات البعد الدلالي فتم تطوير خوارزميات كشف الانتحال الدلالية المعتمدة على تحليل نماذج الاقتباس في الأبحاث العلمية . تمَ في هذا العمل تطوير نظام لكشف الانتحال باستخدام محرك البحث Bing ، حيث تم استخدام خوارزمية تعتمد على استخدام و توظيف نوعين من الانطولوجيات و هي الأنطولوجيات العامة مثل وورد نت ( WordNet ) و الأنطلوجيات الطبية العالمية أشهرها أنطولوجيا الأمراض Diseases ontology التي تحتوي على توصيف الأمراض و خصائصها و تعريفها و اشتقاق الأمراض من بعضها.
قدم هذا البحث دراسة مرجعية عن الخوارزميات و النظم المتوافرة لكشف الانتحال، إِذ صمم و بني تطبيق لكشف الانتحال باستخدام محركات البحث المتوافرة على الشبكة العنكبوتية. إن مسألة كشف الانتحال في الوثائق المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بخصا ئص اللغة الطبيعية المعنية نفسها. يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات، و خوارزميات مقارنة محتوى الملفات التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات. تعتمد نظم كشف الانتحال على نوع محدد أو مزيج من خوارزميات كشف الانتحال؛ و ذلك للحصول على نظم كشف انتحال فعالة (سريعة و دقيقة). طور في هذا العمل نظام لكشف الانتحال باستخدام محرك البحث Bing و قد استخدمت خوارزمية تعتمد على خصائص اللغة،باستخدام نظرية بنية الكلام البلاغية (Rhetorical Structure Theory ).
يؤدي المعجم دورا مهما في أنظمة معالجة اللغات الطبيعية وخصوصا انظمة الترجمة الألية، فهو يزود أجزاء المنظومة بالمعلومات الضرورية لعملية الترجمة, وعلى الرغم من وجود العديد من البحوث في إطار معالجة اللغات الطبيعية، لم يكن هناك اهتمام كاف في المعجم وخصوصا المعجم العربي.
التدقيق اللغوي هو عملية فحص نص لاكتشاف الأخطاء الأملائية والقواعدية والدلالية وتصحيحها. يعد تدقيق قواعد ومعاني اللغات الطبيعية من الأهداف الأساسية للمهتمين باللغوات الحاسوبية، لأنه أصبح ضرورياً لتدقيق النصوص المكتوبة على الحواسيب في مجالات متعددة مث ل تدقيق رسائل البريد الالكتروني والنصوص على صفحات المواقع الالكترونية وتدقيق المقالات والأبحاث العلمية، ويمكن استخدامه في تصحيح إجابات الطلاب المكتوبة بالطريقة التقليدية في امتحانات التعليم الالكتروني. يتناول هذا البحث دراسة لمراحل بناء مترجم اختبار المضمون الآلي، حيث يقدم دراسة لمراحل بناء نظام يهتم بالتدقيق القواعدي لجمل اللغة الانكليزية ليتأكد من أنها صحيحة قواعدياً، كما أنه يبين خطوات التحليل المفرداتي الذي يعد نقطة انطلاق لمرحلة التحليل القواعدي، إضافة إلى أنه يوضح مراحل انجاز التحليل القواعدي الذي تمثل ببناء نموذج قواعدي يوصف الجمل البسيطة في اللغة الانكليزية، وتم ذلك من خلال دراسة قواعد اللغة الانكليزية ثم اقتراح أجزاء من هذا النوذج تتناسب مع كل قاعدة، ويعرض تطبيقا برمجيا يتحقق من البناء القواعدي الصحيح لجمل اللغة الانكليزي ويرسم أشجار الاشتقاق الخاصة بها.
نعرض في هذا البحث المنهجية المعتمدة في بناء منصة ArOntoLearn, و هي بيئة عمل تساعد على بناء أنطولوجية عربية اعتماداً على النصوص في الوب، و أهم سمات هذه البيئة أنها تدعم اللغة العربية و تستخدم المعرفة السابقة في إجرائيات التعلم، فضلاً عن أنها تمثل الأن طولوجية الناتجة باستخدام نموذج الأنطولوجية الاحتمالي (Probabilistic Ontology Model (POM الذي يمكن ترجمته إلى أي صيغة تمثيل للمعرفة. يقوم النظام بتحليل الموارد النصية العربية، يقابلها مع نماذج مفرادتية-نحوية بهدف تعّلم مفاهيم و علاقات جديدة. إن دعم اللغة العربية ليس سهلاً نظراً لكون أدوات المعالجة اللغوية المتوافرة غير فعالة كفاية لمعالجة النصوص العربية غير المشكولة التي كذلك نادراً ما تتضمن علامات الترقيم الصحيحة المساعدة على التحليل الصحيح للجمل. لذلك حاولنا بناء بيئة عمل مرنة يمكن إعدادها بسهولة بحيث تُعدلُ أدوات التحليل المستخدمة فيها و تُستَبدلُ بأخرى أكثر تطوراً عند توافرها.
يعد التحليل الصرفي خطوة مهمة من خطوات المعالجة الآلية للغات الطبيعية و تطبيقاتها المتنوعة، و يحتاج كل نوع من هذه التطبيقات إلى درجةٍ مختلفة من التوازن بين الأداء و الوثوقية و شمولية النتائج ( إيجاد جميع الحلول المحتملة )؛ ففي حين تهتم بعض التطبيقات ب الوثوقية العالية للنتائج، تهتم تطبيقات أخرى بالمحافظة على أداءٍ فعالٍ للنظام، و تُعنى تطبيقات أخرى بأنظمة تحليلٍ صرفيٍ تنتج كل الحلول الممكنة و بوثوقية عالية. نقدم في هذا المقال وصفاً موجزاً لمنهجية جديدة لبناء نظام تحليل صرفي للغة العربية يتمتَّع بالمرونة، و يمكن إعداده بحيث يلائم التطبيق الهدف. و قد بينت الاختبارات أن النظام المنجز يحقق مرونة تجعل منه مناسباً للاستخدام في معظم أنواع التطبيقات على اختلاف متطلباتها. كذلك، يتضمن النظام مكوناً مستقلاً يمكن إضافته بسهولة إلى أنظمة التحليل الصرفي الأخرى لتحسين أدائها دون أية آثار سلبية على الدقة أو شمولية النتائج.
3452 - MIT press 1999 كتاب
أصبحت الأساليب الإحصائية لمعالجة اللغات الطبيعية مهيمنة في السنوات الأخيرة. يوفر هذا الكتاب تغطية واسعة وعميقة للأسس الرياضية واللغوية لهذه الطرائق، بالإضافة إلى ذلك, يزوّد الكتاب شرح مفصل للأساليب الإحصائية ، مما يسمح للطلاب والباحثين ببناء تطبيقاتهم الخاصة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا