بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

نظام استرجاع معلومات للغة العربية

Information Retrieval System For Arabic Language

4106 4 909 0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جامعة تشرين مشروع تخرج

تاريخ النشر 2014

والبحث باللغة العربية

تأليف شعبان الخطيب( طالب ) - زين العابدين شاهين( طالب ) - سليمان عريس( طالب ) - د. ناصر ناصر( مشرف ) - م. علاء جراد( مشرف مساعد )

تمت اﻹضافة من قبل Shaban Khatib

استرجاع معلومات Arabic nlp بحث search محرك بحث IR معالجة لغات طبيعية

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

تحتل الدراسات التي تتناول حوسبة اللغة العربية أهمية كبيرة نظراً للانتشار الواسع للغة العربية , و اخترنا في هذه الدراسة العمل على معالجة اللغة العربية من خلال نظام استرجاع معلومات للمستندات باللغة العربية , الفكرة الأساسية لهذا النظام هو تحليل المستندات والنصوص العربية و إنشاء فهارس للمصطلحات الواردة فيها , ومن ثم استخلاص أشعة أوزان تعبر عن هذه المستندات من أجل المعالجة اللاحقة للاستعلام و المقارنة مع هذه الأشعة للحصول على المستندات الموافقة لهذا الاستعلام . من خلال عملية تجريد للمصطلحات الواردة في المستندات تم الحصول على كفاءة استرجاع أفضل , و تعرضنا للعديد من خوارزميات التجريد التي وصلت إليها الدراسات السابقة . و تأتي عملية عنقدة المستندات كإضافة هامة , حيث يتمكن المستخدم من معرفة المستندات المشابهة لنتيجة البحث و التي لها صلة بـالاستعلام المدخل . في التطبيق العملي , تم العمل على نظام استرجاع معلومات مكتبي , يقوم بقراءة نصوص ذات أنواع مختلفة و عرض النتائج مع العناقيد الموافقة لها .

مراجعة الذكاء الصنعي:

قُم بترقية الحساب لمشاهدة المحتوى

ملخص البحث

تتناول هذه الدراسة نظام استرجاع المعلومات للغة العربية، حيث يتم تحليل المستندات والنصوص العربية وإنشاء فهارس للمصطلحات الواردة فيها. يتم استخلاص أشعة أوزان تعبر عن هذه المستندات من أجل المعالجة اللاحقة للاستعلام والمقارنة مع هذه الأشعة للحصول على المستندات الموافقة للاستعلام. تتضمن الدراسة عدة فصول تتناول محركات البحث، استرجاع المعلومات، تحليل النصوص، التجريد، وعنقدة المستندات. يتم شرح آلية عمل محركات البحث على الويب، المشاكل اللغوية في استرجاع المعلومات، اللغات المتحكم بها وغير المتحكم بها، النهج الإحصائي واللغوي، نماذج استرجاع المعلومات الرئيسية، وخوارزميات التجريد المختلفة. كما تتناول الدراسة عنقدة المستندات باستخدام خوارزميات مثل K-Means، وتطبيق عملي لنظام استرجاع معلومات مكتبي يقوم بقراءة نصوص ذات أنواع مختلفة وعرض النتائج مع العناقيد الموافقة لها. يتم استخدام خوارزميات التجريد لتحسين كفاءة استرجاع المعلومات، ويتم تطبيق خوارزميات مثل خوارزمية مارتن بورتر وخوارزمية ISRI لتجريد اللغة العربية. كما يتم مناقشة تحليل الكلمات المترافقة والطرق الإحصائية في التجريد. تتضمن الدراسة أيضًا تطبيقات نموذجية لتحليل النصوص مثل تحليل إجابات الاستبيانات، المعالجة الأوتوماتيكية للرسائل، وتحليل دعاوى الكفالة أو التأمين. يتم في النهاية تقديم نظام عملي لاسترجاع المعلومات يتضمن أدوات مثل المجرد Porter للغة الإنجليزية والمجرد Arabic Stemmer للغة العربية، والمكتبة Tika لاستخراج النصوص من مختلف صيغ المستندات.

قراءة نقدية

تعتبر هذه الدراسة شاملة ومفصلة في تناول موضوع استرجاع المعلومات للغة العربية، حيث تغطي العديد من الجوانب المهمة مثل محركات البحث، التجريد، وعنقدة المستندات. ومع ذلك، يمكن أن تكون الدراسة أكثر فعالية إذا تم التركيز بشكل أكبر على التطبيقات العملية والتجارب الحقيقية للنظام المقترح. كما أن الدراسة تعتمد بشكل كبير على النظريات والخوارزميات التقليدية، ويمكن أن تستفيد من دمج تقنيات حديثة مثل التعلم العميق والذكاء الاصطناعي لتحسين أداء النظام. بالإضافة إلى ذلك، يمكن تحسين الدراسة من خلال تقديم أمثلة عملية وتوضيحية أكثر لتطبيقات النظام في مجالات مختلفة.

أسئلة حول البحث

ما هي الفائدة من استخدام خوارزميات التجريد في استرجاع المعلومات؟

تساعد خوارزميات التجريد في تحسين كفاءة استرجاع المعلومات من خلال إزالة الإضافات من الكلمات واستبدالها بجذورها، مما يقلل من حجم المستندات ويسهل عملية البحث النصي وتحليل النصوص.
ما هي المشاكل اللغوية التي تواجه نظم استرجاع المعلومات؟

تشمل المشاكل اللغوية في نظم استرجاع المعلومات مشكلة المرادفات، مشكلة الألفاظ المتجانسة، ومشكلة تغيرات الكلمة، حيث يمكن أن تؤدي هذه المشاكل إلى صعوبة في الوصول إلى المعلومات ذات الصلة بدقة.
كيف يمكن تحسين أداء نظام استرجاع المعلومات باستخدام النهج الإحصائي؟

يمكن تحسين أداء نظام استرجاع المعلومات باستخدام النهج الإحصائي من خلال تحليل تكرار الكلمات في المستندات واستخدام هذه المعلومات لتحديد الكلمات الدلالية الهامة، مما يساعد في تحسين دقة وفعالية عملية الاسترجاع.
ما هي أهمية عنقدة المستندات في نظم استرجاع المعلومات؟

تساعد عنقدة المستندات في تنظيم المستندات المشابهة في مجموعات، مما يسهل على المستخدمين العثور على المستندات ذات الصلة بموضوع البحث ويعزز من دقة وفعالية عملية الاسترجاع.

كلمات مفتاحية

استرجاع المعلومات اللغة العربية محركات البحث التجريد عنقدة المستندات تحليل النصوص خوارزميات التجريد النماذج الإحصائية النماذج اللغوية

المراجع المستخدمة

Castillo , Carlos. Effective Web Crawling . Thesis. Dept. of Computer Science – University of Chile, 2004

Lin, E.A.-S.a.J., A new Arabic stemming algorithm. In Proceedings of the 2008 ISCA Workshop on Experimental Linguistics, 2008

Porter, M.F., An algorithm for suffix stripping, in Readings in information retrieval, J. Karen Sparck and W. Peter, Editors. 1997, Morgan Kaufmann Publishers Inc. p. 313-316

Unine, Stop Word List, 2012

Al-Shammari, E.T. Improving Arabic document categorization: Introducing local stem. in Intelligent Systems Design and Applications (ISDA), 2010 10th International Conference on. 2010

Larkey, L.S., L. Ballesteros, and M.E. Connell, Improving stemming for Arabic information retrieval: light stemming and co-occurrence analysis, in Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval2002, ACM: Tampere, Finland. p. 275-282

Khoja, S. Khoja Stemmer. 2012 [cited 2012 Mar 2012]; Available from: http//:zeus.cs.pacificu.edu/shereen/research.htm

Larkey, Leah S., Lisa Ballesteros, and Margaret E. Connell. "Light stemming for Arabic information retrieval." Arabic computational morphology. Springer Netherlands, 2007. 221-243

Luhn, H. P. (1957). A statistical approach to the mechanized encoding and starching of literary information. IBM Journal of Research and Development, 1 (4). pp 309-317

Warner, Amy J.; Ann Arbor and Aspen H. Wenzel (1991). A linguistic analysis and categorisation of nominal expressions. ASIS'9 I, pp. 186-191

Harter, Stephen P. ( 1986) . Online information retrieval: Concepts, principles, and techniques. Orlando: Academic Press INC

Salton, G. and M. McGill (1983). Introduction to Modern Information Retrieval. McGraw-Hill

Salton, G. and C. Yang (1973). On the specication of term values in automatic indexing. Jounral of Documentation 29 (4), 351-372

Maron, M. and J. Kuhns (1960). On relevance, probabilistic indexing and information retrieval. Journal of the Association for Computing Machin- ery 7, 216-244

Ponte, J., & Croft, W. B. (1998). A language modeling approach to information retrieval. In Proceedings of the 21st ACM SIGIR Annual International Conference on Research and Development in Information Retrieval (pp. 275-281). Melbourne, Australia

قيم البحث

2989 - جامعة البعث 2016 ورقة بحثية

يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.

معالجة اللغات الطبيعية Semantic analysis استرجاع المعلومات التلخيص التجريدي الأنتولوجيا العربية ووردنت العلاقة الدلالية المفاهيمية التشابهية الدلالية التحليل الدلالي حل غموض معاني الكلمات (Natural Language Processing (NLP (Information Retrieval (IR Abstractive Summarization (Arabic WordNet (AWN Conceptual Semantic Relation Semantic Similarity (Word Sense Disambiguation (WSD المزيد..

Serag: استرجاع الكيانات الدلالية من الرسوم البيانية المعرفة العربية

847 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تستخدم الرسوم البيانية المعرفة (KGS) على نطاق واسع لتخزين المعلومات والوصول إليها حول الكيانات وعلاقاتها.بالنظر إلى استفسار، تهدف مهمة استرجاع الكيانات من KG إلى تقديم قائمة في المرتبة ذات الصلة بالاستعلام.في الآونة الأخيرة، أظهر عدد متزايد من النماذ ج لاسترجاع الكيان تحسنا كبيرا على الأساليب التقليدية.هذه النماذج، ومع ذلك، تم تطويرها للكلية الإنجليزية.في هذا العمل، نبني على نظام واحد من هذا القبيل، يدعى Kewer، لاقتراح Serag (استرجاع الكيانات الدلالي من الرسوم البيانية المعرفة العربية).مثل Kewer، يستخدم Serag مناحي عشوائي لتوليد embeddings للكياء.تعتبر DBPedia-Entity V2 مجموعة الاختبار القياسية لاسترجاع الكيان.نناقش تحديات استخدامها للغات غير الإنجليزية بشكل عام والعربية على وجه الخصوص.نحن نقدم نسخة عربية من هذه المجموعة القياسية، واستخدامها لتقييم Serag.يظهر Serag أنه يتفوق بشكل كبير على نموذج BM25 الشهير بفضل التفكير المتعدد القفز.

arabic knowledge graphs knowledge graphs semantic entity retrieval الرسوم البيانية المعرفة العربية الرسوم البيانية المعرفة استرجاع الكيانات الدلالية صناعة حمض الفوسفور المزيد..

نظام تصنيف المستندات العربية حسب محتواها

3938 - جامعة تشرين 2012 مشروع تخرج

اخترنا في هذا المشروع العمل على تطوير نظام يقوم بتصنيف المستندات العربية حسب محتواها, يقوم هذه النظام بالتحليل اللفظي لكلمات المستند ثم إجراء عملية Stemming"رد الأفعال إلى أصلها" ثم تطبيق عملية إحصائية على المستند في مرحلة تدريب النظام ثم بالاعتماد على خوارزميات في الذكاء الصنعي يتم تصنيف المستند حسب محتواه ضمن عناقيد

Machine learning Nlp Support vector machine fuzzy system Arabic nlp

نظام خبير لإعراب الجمل العربية

2374 - جامعة دمشق 2018 ورقة بحثية

تم تطوير نظام خبير لإعراب مفردات الجمل العربية دون تشكيل. يقوم النظام أولاً بإيجاد تصريف الكلمات و نوعها باستخدام أداة (Microsoft (ATK، ويستمد خبرته من قواعد اللغة العربية في إيجاد إعراب مفردات الجمل الإسمية. استجاب النظام بشكل صحيح بنسبة جيدة جداً و تمت مقارنة النتائج الصادرة عنه مع نتائج خبير باللغة العربية.

Nlp Expert System Arabic morphology Arabic grammar

تقديم استرجاع المعلومات لطلاب المعلوماتية الطبية الحيوية

788 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إن إدخال طلاب المعلوماتيين الطبية الحيوية (BMI) للمعالجة اللغوية الطبيعية (NLP) يتطلب موازنة العمق الفني مع المعرفة العملية لمعالجة الاحتياجات التي تركز على التطبيق.قمنا بتطوير مجموعة من ثلاثة أنشطة إدخال طلاب BMI تمهيدي لاسترجاع المعلومات مع NLP، وا لغطاء استراتيجيات تمثيل المستندات ونماذج اللغة من TF-IDF إلى Bert.تزود هذه الأنشطة الطلاب بتجربة عملية مستهدفة نحو حالات الاستخدام المشترك، وإدخال مكونات أساسية من سير العمل NLP لمجموعة واسعة من التطبيقات.

biomedical informatics students biomedical informatics introducing biomedical informatics طلاب المعلوماتية الطبية الحيوية المعلوماتية الطبية الحيوية تقديم المعلوماتية الطبية الحيوية صناعة حمض الفوسفور المزيد..

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة سوهاج

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

نظام استرجاع معلومات للغة العربية

Information Retrieval System For Arabic Language

اسأل ChatGPT حول البحث

No English abstract

اقرأ أيضاً