ترغب بنشر مسار تعليمي؟ اضغط هنا

استخدام المصادر المفتوحة لتحسين أداء نظم استعادة المعلومات

Using Open Source in Enhancing Information Retrieval Systems Performance

2156   1   215   0 ( 0 )
 تاريخ النشر 2013
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

من أجل مواكبة التقدم الهائل لثورة المعلومات و توفرها على الوب تم وضع طرق و اقتراحات من أجل تحسين فعالية عمليات البحث, معظم هذه الحلول ركزت على خوارزميات ترتيب الصفحات (Page Ranking) و معدل تردد الكلمة (Term Freq. ) و لكن التركيز على استخدام علم دلالات الألفاظ و علاقة دلالات الألفاظ مع المحتوى رغم أهميته الكبرى ما زال قليلاً لأسباب مختلفة. يهدف هذا البحث لإيجاد تصميم محرك بحث يعتمد على علم دلالات الألفاظ Semantics) ( يمكن استخدامه للوصول إلى المعلومات ذات الطبيعة غير البنيوية مثل صفحات الوب, و يساعد في تحسين دقة و فعالية عملية البحث. تم إجراء مجموعة من الاختبارات لاستنتاج تصميم محرك البحث و تقييم نتائج استخدام علم دلالات الألفاظ في التعامل مع عمليات البحث على صفحات الوب.


ملخص البحث
تتناول هذه الدراسة استخدام المصادر المفتوحة لتحسين أداء نظم استعادة المعلومات، مع التركيز على استخدام علم دلالات الألفاظ لتحسين دقة وفعالية عمليات البحث على الويب. يهدف البحث إلى تصميم محرك بحث يعتمد على علم دلالات الألفاظ للوصول إلى المعلومات غير البنيوية مثل صفحات الويب. تم إجراء مجموعة من الاختبارات لتقييم نتائج استخدام علم دلالات الألفاظ في عمليات البحث. استخدم الباحثون محرك البحث Lucene كمثال على محركات البحث مفتوحة المصدر، وأجروا مقارنة بين أداء Lucene ومحركات بحث أخرى. أظهرت النتائج أن استخدام علم دلالات الألفاظ يمكن أن يحسن دقة البحث، وأن عدد الكلمات المفتاحية المحدود والدقيق هو العامل الأهم في عملية البحث. كما تم التأكيد على أهمية الانطولوجيا في تحديد الكلمات المفتاحية ومساعدة المستخدمين في الحصول على النتائج المطلوبة.
قراءة نقدية
دراسة نقدية: على الرغم من أن البحث يقدم إسهامًا مهمًا في مجال استعادة المعلومات باستخدام علم دلالات الألفاظ، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، كان من الأفضل تقديم تحليل أعمق للنتائج الإحصائية لتوضيح مدى فعالية النموذج المقترح مقارنة بالنماذج التقليدية. ثانيًا، لم يتم التطرق بشكل كافٍ إلى التحديات التي قد تواجه تطبيق هذا النموذج في بيئات مختلفة. أخيرًا، كان من الممكن تقديم توصيات أكثر تفصيلًا حول كيفية تحسين النموذج المقترح بناءً على النتائج المستخلصة من الاختبارات.
أسئلة حول البحث
  1. ما هو الهدف الرئيسي من البحث؟

    الهدف الرئيسي من البحث هو تحسين دقة وفعالية عمليات البحث على الويب باستخدام علم دلالات الألفاظ.

  2. ما هي الأدوات المستخدمة في البحث؟

    تم استخدام محرك البحث Lucene كمثال على محركات البحث مفتوحة المصدر، وتم إجراء مجموعة من الاختبارات لتقييم فعالية النموذج المقترح.

  3. ما هي النتائج الرئيسية التي توصل إليها البحث؟

    أظهرت النتائج أن استخدام علم دلالات الألفاظ يمكن أن يحسن دقة البحث، وأن عدد الكلمات المفتاحية المحدود والدقيق هو العامل الأهم في عملية البحث.

  4. ما هي التوصيات التي قدمها الباحثون بناءً على نتائج البحث؟

    أوصى الباحثون باستخدام الانطولوجيا لتحديد الكلمات المفتاحية في جمل الاستعلام ومساعدة المستخدمين في الحصول على النتائج المطلوبة.


المراجع المستخدمة
Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schtze. Introduction to Information Retrieval. Cambridge University Press, Cambridge, UK, 2008, 482 Pages
Christian Middleton, Ricardo Baeza-Yates. “A Comparison of Open Source Search Engines” 2008,46 Pages
(Semantic Web (2008) Available at: http://en.wikipedia.org/wiki/Semantic_web (Accessed: Nov 2012
قيم البحث

اقرأ أيضاً

أصبحت القدرة على البحث ضمن مواقع الانترنت ضرورة للكثير من الناس و تعاني كثير من مواقع الانترنت من صعوبة وصول المستخدم للمعلومة المطلوبة بسبب عدم الأخذ بالحسبان معاني الكلمات و مدلولاتها Semantics عند البحث تدعم التقنيات الحالية معظم اللغات الطبيعية مع بقاء ذلك ضعيفاً بالنسبة للغة العربية. تشكل الأنطولوجيا العنصر المحوري في التطبيقات التي تدعم علم دلالات الألفاظ, و على الرغم من وجود الكثير من أدوات بناء الانطولوجيات باللغات الأجنبية، فإن الأداة Arabic WordNet (AWN)، التي تعدّ من المصادر المفتوحة قد تكون الوحيدة التي تسمح لنا بتطوير انطولوجيا باللغة العربية. في هذا البحث سنقوم بتحديد الخطوات اللازمة لتطوير انطولوجيا عربية و بناء انطولوجيا اعتماداً على هذه الخطوات تستخدم في مواقع الجامعات مستخدمين الأداة Arabic WordNet التأكد من نظافة الانطولوجيا المصممة، و تقييم أداء عملية البحث في الموقع بعد استخدام الانطولوجيا المصممة.
تنبع أهمية هذا البحث من خلال الدور الحيوي الذي تلعبه نظم إدارة الرصف الطرقي Pavement Management Systems(PMS) بالتكامل مع نظم المعلومات الجغرافيةGeographic Information Systems(GIS) في تخطيط و إدارة الصيانة الطرقية في اللاذقية, للحصول على نظام محلي مرن يتبع منهجية جديدة في معالجة المعلومات و إظهارها عبر تقنيات الـGIS بالشكل الذي يساعد على اتخاذ القرار المتعلق بالصيانة. و لهذا الغرض نفذ بحث تجريبي لإدارة صيانة الرصف على مجموعة من الطرق التابعة للمؤسسة العامة للمواصلات الطرقية, حيث قسمت الطرق المدروسة إلى وصلات و قطاعات طرقية, ثم تم تقييم حالة سطح الرصف لها, بالاعتماد على طريقة معهد الإسفلت (Asphalt Institute Method), حيث تم التوصل بموجبها إلى مؤشر رقمي عن حالة الرصف, الذي دل بدوره على طريقة الصيانة اللازمة لذلك الرصف, و اعتمادا على نظم المعلومات الجغرافية تم تصميم و بناء قاعدة بيانات فاعلة خاصة بالطرق, تعكس واقع الطرق المدروسة و تمكننا من تخزين و تحليل و توثيق بيانات حالة سطح الرصف و ربطها بالخرائط الرقمية التي تم انجازها, و هذا ضمن الوصول السريع و المباشر إلى مختلف البيانات والحلول, عبر توزيع الطرق وفق قطاعات تظهر كل قطاع بلون يعكس حالته الفنية حسب الغاية من الخريطة و بالشكل الذي يساعد على اتخاذ القرار المتعلق بالصيانة .
ظهرت أنظمة كشف الاختراقات Intrusion Detection Systems IDS، من أجل زيادة و تطوير الأمن في الشبكات، و أصبحت فعالة لحماية الشبكات الداخلية internal networks من الهجمات الخارجية، و اتخاذ الإجراءات المناسبة ضد المخترقين intruders. كما تستخدم أنظمة كشف الا ختراق تقنيات من أجل جمع معلومات عن الهجوم، و من الممكن استخدام هذه المعلومات كدليل ضد المهاجم. تستخدم أنظمة كشف الاختراقات طرائق مختلفة في عملية الكشف، فبعضها يستخدم التواقيع في الكشف signature based، و بعضها يكشف الشذوذ anomaly based، و غيرها من الطرائق. يقارن هذا البحث التقنيات المستخدمة في أنظمة كشف الاختراق، و يركز على الأنظمة التي تستخدم التواقيع في عملية الكشف، و بالأخص النظامين snort و Bro، و هما من الأنظمة المفتوحة المصدر open source، و مقارنة الإنذارات التي يطلقها النظامان عند تطبيق أداة توليد الهجمات IDSWakeup.
تهدف هذه الدراسة إلى إلقاء الضوء على أثر نظم المعلومات الإدارية المحوسبة على أداء العاملين في المؤسسة العامة للاتصالات في محافظة طرطوس و ذلك باختبار العلاقة بين مدى توفر مستلزمات نظم المعلومات الإدارية (المادية, البرمجية, البشرية و التنظيمية) في المؤ سسة المذكورة و بين أداء الموظفين . و لتحقيق أهداف الدراسة تم التصميم و التطوير لاستبانة تتكون من (28) فقرة لغرض جمع البيانات و قياس متغيرات الدراسة, و قد اعتمدت على المنهج الوصفي التحليلي لأبرز ما ورد في الدوريات و المجلات العلمية و الكتب . و خلصت الدراسة إلى وجود ارتباط وثيق بين توفر مستلزمات نظم المعلومات الإدارية و بين الأداء الوظيفي, و من جانبٍ آخر لم يسجل الاختبار الإحصائي أية فروق جوهرية بين إجابات أفراد العينة حسب المتغيرات الديمغرافية (المستوى العلمي و الجنس, و عدد سنوات الخدمة إضافة" إلى عدد سنوات بقائه في الموقع الوظيفي ) فيما يخصُّ آراءهم حول أثر نظم المعلومات الإدارية على الأداء في المؤسسة محل الدراسة.
تهدف الدراسة إلى التعرف على مفهوم إدارة المعرفة باعتبارها من النظريات الإدارية الحديثة التي تسعى العديد من المنظمات لتطبيقها و الاستفادة من مزاياها، و التعرف على عمليات المعلومات و إدارة المعرفة، و مبررات تحول المكتبات و نظم المعلومات إلى إدارة المعر فة، بالإضافة إلى معرفة متطلبات تطبيق إدارة المعرفة في المكتبات. و قد اتبعت الباحثة المنهج النظري و ذلك لمناسبته لطبيعة البحث، و أسفرت الدراسة عن مجموعة من النتائج كان أهمها وجود تشابه كبير بين وظائف المكتبات و نظم المعلومات و عمليات إدارة المعرفة، و أن من أهم متطلبات تطبيق إدارة المعرفة في المكتبات وجود ثلاثة عناصر هي الثقافة التنظيمية، و المعرفة التنظيمية، و تكنولوجيا المعرفة. و أوصت الدراسة بضرورة تعزيز دور الفرد في المنظمة، و النظر إليه على أنه رأس مال فكري و مورد بشري يمكن الاستفادة منه، و تنمية قدراته الفكرية، و رعايته، و تشجيعه على الإبداع كي يتسنى له التقاط المعرفة التي تمكن المنظمة من تحقيق أهداف إدارة المعرفة.
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا