ترغب بنشر مسار تعليمي؟ اضغط هنا

اكتشاف قواعد القرار المعممة الأعظمية من قواعد المعطيات

Discovering Maximal Generalized Decision Rules in Databases

1285   0   16   0 ( 0 )
 تاريخ النشر 2016
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يزداد حجم المعطيات المولدة هذه الأيام بمعدل هائل. و ان استخراج المعرفة المفيدة من مثل هذه المجموعات من المعطيات هو موضوع هام و تحد. التقنية الواعدة هي منهج المجموعات التقريبية، الطريقة الرياضية الجديدة لتحليل المعطيات اعتماداً على تصنيف الأغراض في صفوف متشابهة، التي تكون غير قابلة للتمييز بالنسبة لبعض السمات. تركز هذه المقالة على اكتشاف قواعد القرار المعممة الأعظمية من قواعد المعطيات اعتماداً على التراجع البسيط أو المتعدد و خوارزمية التعميم و مصفوفة القرار.


ملخص البحث
تتناول هذه الورقة البحثية التي أعدها الدكتور عبد الله حسن العمر من جامعة دمشق، موضوع اكتشاف قواعد القرار المعممة الأعظمية من قواعد المعطيات باستخدام طريقة المجموعات التقريبية. تبدأ الورقة بمقدمة حول أهمية اكتشاف المعرفة من قواعد المعطيات الكبيرة، وتوضح أن الغموض وعدم الكمال في البيانات يتطلبان تقنيات جديدة للتعامل معها. تقدم الورقة خوارزمية جديدة تعتمد على تحليل التراجع وخوارزمية التعميم ومصفوفة القرار لاكتشاف قواعد القرار المعممة الأعظمية. يتم شرح منهجية البحث التي تتضمن خطوات متعددة تبدأ بجمع وتعميم البيانات، ثم حساب قواعد القرار المعممة الأعظمية واختبار الطريقة المقترحة على قاعدة بيانات حقيقية. كما تقدم الورقة أمثلة توضيحية وتشرح كيفية بناء مصفوفة القرار واستخدامها لاستخراج قواعد القرار المعممة الأعظمية. تختتم الورقة بتقديم نتائج الاختبار وتوضيح أن الطريقة المقترحة أسرع وأسهل من الطرق التقليدية لأنها لا تتطلب بناء أشجار القرار وتقليمها.
قراءة نقدية
تقدم الورقة البحثية إسهاماً مهماً في مجال اكتشاف المعرفة من قواعد المعطيات، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، يمكن أن تكون الورقة أكثر وضوحاً في شرح بعض المفاهيم الرياضية المعقدة، حيث قد يجد القارئ غير المتخصص صعوبة في فهمها. ثانياً، يمكن تحسين الورقة بإضافة المزيد من الأمثلة العملية لتوضيح كيفية تطبيق الخوارزمية المقترحة في سيناريوهات مختلفة. ثالثاً، يمكن أن تكون الورقة أكثر شمولية إذا تناولت مقارنة تفصيلية بين الخوارزمية المقترحة والخوارزميات الأخرى الموجودة في الأدبيات، مع تقديم تحليل لأداء كل منها. وأخيراً، يمكن أن تستفيد الورقة من تقديم دراسة حالة تطبيقية توضح الفوائد العملية للخوارزمية المقترحة في مجال محدد مثل الطب أو التجارة.
أسئلة حول البحث
  1. ما هي الأداة الجديدة التي قدمها Z. Pawlak للتعامل مع الغموض في البيانات؟

    قدم Z. Pawlak طريقة المجموعات التقريبية في عام 1982 كأداة جديدة للتعامل مع الغموض في البيانات.

  2. ما هي الخطوات الأساسية لمنهجية البحث المقترحة في الورقة؟

    تتألف منهجية البحث من عدة خطوات: جمع وتعميم البيانات، حساب قواعد القرار المعممة الأعظمية، واختبار الطريقة المقترحة على قاعدة بيانات حقيقية.

  3. ما هي الفائدة الرئيسية للخوارزمية المقترحة مقارنة بالطرق التقليدية؟

    الفائدة الرئيسية هي أن الخوارزمية المقترحة أسرع وأسهل لأنها لا تتطلب بناء أشجار القرار وتقليمها، مما يوفر الوقت والجهد.

  4. كيف يتم حساب قواعد القرار المعممة الأعظمية باستخدام مصفوفة القرار؟

    يتم حساب قواعد القرار المعممة الأعظمية من مصفوفة القرار عن طريق بناء تابع بولياني لكل حالة موجبة وتبسيطه باستخدام قوانين الجبر البولياني.


المراجع المستخدمة
W. Ziarko, 1993- Variable Precision Rough Sets Model, Journal of Computer and Systems Sciences, vol. 46. no. 1, pp. 39-59
Pawlak, Z. and Skowron, 2007- Rudiments of Rough Sets, Information Sciences, 177,3-27
S. Bhattacharya and K. Debnath, 2016- A Study on Lower Interval Probability Function Based Decision Theoretic Rough Set Models , Annals of Fuzzy Mathematics and Informatics, Volume x, No. x, pp. 1-xx
قيم البحث

اقرأ أيضاً

الهدف من هذا البحث هو تقديم خدمة المرضى من خلال الاستفادة من تطبيقات قواعد المعطيات و أيضاً تطبيقات أنظمة الاتصالات المتاحة و المتوفرة , في الخدمات الطبية و بخاصة العلاجية منها, بحيث يمكننا قدر الإمكان تفادي ما يمكن تفاديه من الكوارث الصحية التي يمكن أن يتعرض لها الإنسان المريض بشكل فجائي. درسنا في هذا البحث كيفية الاستفادة من التقنيات الحديثة في ضبط و معالجة بعض العلامات الحيوية للإنسان و بخاصة الذين يعانون من بعض المشاكل الصحية المتعلقة ببعض الأمراض , و إبقاءها تحت السيطرة بهدف جعل الأوضاع الصحية لهؤلاء المرضى مستقرة. العلامات الحيوية التي قمنا بتطبيق الدراسة عليها هي : ضغط الدم – نبض القلب – سكر الدم. إذ ان حدوث أي خلل في إحدى قيم تلك العلامات ( زيادة أو نقصانا ) قد يؤدي إلى اصابة المريض بعارض صحي مفاجئ.
نتعامل مع مشكلة شبكات التدريب الذاتي ل NLU في بيئة الموارد المنخفضة --- عدد قليل من البيانات المسمى والكثير من البيانات غير المسماة. إن فعالية التدريب الذاتي هي نتيجة لزيادة مقدار البيانات التدريبية أثناء التدريب. ومع ذلك، يصبح أقل فعالية في إعدادات الموارد المنخفضة بسبب الملصقات غير الموثوقة المتوقعة بواسطة نموذج المعلم على البيانات غير المسبقة. تم استخدام قواعد القواعد، التي تصف الهيكل النحوي للبيانات، في NLU للحصول على شرح أفضل. نقترح استخدام قواعد القواعد في التدريب الذاتي كآلية وضع العلامات الزائفة أكثر موثوقية، خاصة عندما يكون هناك عدد قليل من البيانات المسمى. نقوم بتصميم خوارزمية فعالة تقوم ببناء وتوسيع قواعد قواعد اللغة دون تورط بشري. ثم ندمج القواعد المبنية كآلية وضع العلامات الزائفة في التدريب الذاتي. هناك سيناريوهات محتملة فيما يتعلق بتوزيع البيانات: غير معروف أو معروف في التدريب قبل التدريب. إننا نوضح تجريبيا أن نهجنا يتفوق بشكل كبير على الأساليب الحديثة في ثلاث مجموعات بيانات معيار لكل من السيناريوهات.
أصبح مصطلح قاعدة المعطيات العلائقية التقليدية مرادفاً لمصطلح قاعدة المعطيات، و لكن احتكار الشركات الكبرى المصنعة لأنظمة إدارة قواعد المعطيات أصبح يشكل هاجساً للعاملين في هذا الحقل نظراً للكلف العالية لهذه الأنظمة، مما وجه الأنظار نحو الاهتمام بالتقني ة الصاعدة و هي أنظمة قواعد المعطيات الأصيلة باستخدام لغة التأشير الموسعة، حيث أنها تتمتع بخاصية المحمولية و أغلبها مجاني أو مفتوح المصدر، و بسبب زيادة الاعتماد على ملفات xml و لا سيما في التراسل بين التطبيقات المختلفة و وجود مجمعات لها مما استوجب التوجه نحو أنظمة قادرة على إدارتها و تنظيمها، و هذا فرض الحاجة إلى أنظمة قواعد المعطيات xml الأصيلة، و تهدف الدراسة إلى إجراء مقارنة بين إمكانيات أنظمة قواعد المعطيات العلائقية التقليدية و أنظمة قواعد المعطيات xml الأصيلة وفقاً لمعايير عديدة ، و استثمار التقنيتين في تطبيق عملي و إجراء الاختبارات المناسبة التي تعكس أثر استخدام كل من التقنيتين على أداء التطبيق المقترح و عرض النتائج و تقديم الاقتراحات المستقبلية.
استخدمت نظم استخلاص العلاقة استخداماً واسعاً للميزات المولدة من وحدات التحليل اللغوي. إذ تؤدي الأخطاء في هذه المميزات إلى أخطاء في كشف العلاقة و تصنيفها. في هذا البحث، نخرج من هذه الطرق التقليدية مع بنية مميز معقدة من خلال تقديم الشبكات العصبونية الالتفافية لاستخلاص العلاقة التي تتعلم تلقائيا ميزات من الجمل و تقلل من الاعتماد على مجموعة الأدوات و المصادر الخارجية. نموذجنا يأخذ مزايا أحجام لنوافذ متعددة للمرشحات و تضمينات الكلمة المدربة سابقا كدخل لبنية غير ثابتة لتحسين الأداء.
قدمنا في هذا البحث دراسة مفصلة لطرق التنقيب في البيانات النصية و الإمكانيات المتوفرة في لغة الاستعلام الإجرائية PL/SQL التي تتعامل مع قواعد بيانات أوراكل الغرضية للقيام بذلك. و من ثم قمنا ببناء نموذج تنقيب يعمل على تصنيف وثائق النصوص العربية باست خدام خوارزمية SVM لفهرستها و من ثم تحويلها إلى جداول بيانات مدخلة في جداول الحالة لتصنيفها باستخدام خوارزمية Naïve Bayes و قدمنا الاستنتاجات و التوصيات بعد تقييم النتائج التي حصلنا عليها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا