يزداد حجم المعطيات المولدة هذه الأيام بمعدل هائل. و ان استخراج المعرفة المفيدة من
مثل هذه المجموعات من المعطيات هو موضوع هام و تحد. التقنية الواعدة هي منهج
المجموعات التقريبية، الطريقة الرياضية الجديدة لتحليل المعطيات اعتماداً على تصنيف
الأغراض في صفوف متشابهة، التي تكون غير قابلة للتمييز بالنسبة لبعض السمات.
تركز هذه المقالة على اكتشاف قواعد القرار المعممة الأعظمية من قواعد المعطيات
اعتماداً على التراجع البسيط أو المتعدد و خوارزمية التعميم و مصفوفة القرار.
The volume of data being generated nowadays is increasing at
phenomenal rate. Extracting useful knowledge from such data
collections is an important and challenging issue. A promising
technique is the rough set approach, a new mathematical method
to data analysis based on classification of objects into similarity
classes, which are indiscernible with respect to some features. This
paper focuses on discovering maximal generalized decision rules
in databases based on a simple or multiple regression, generalized
theory, and decision matrix.
Artificial intelligence review:
Research summary
تتناول هذه الورقة البحثية التي أعدها الدكتور عبد الله حسن العمر من جامعة دمشق، موضوع اكتشاف قواعد القرار المعممة الأعظمية من قواعد المعطيات باستخدام طريقة المجموعات التقريبية. تبدأ الورقة بمقدمة حول أهمية اكتشاف المعرفة من قواعد المعطيات الكبيرة، وتوضح أن الغموض وعدم الكمال في البيانات يتطلبان تقنيات جديدة للتعامل معها. تقدم الورقة خوارزمية جديدة تعتمد على تحليل التراجع وخوارزمية التعميم ومصفوفة القرار لاكتشاف قواعد القرار المعممة الأعظمية. يتم شرح منهجية البحث التي تتضمن خطوات متعددة تبدأ بجمع وتعميم البيانات، ثم حساب قواعد القرار المعممة الأعظمية واختبار الطريقة المقترحة على قاعدة بيانات حقيقية. كما تقدم الورقة أمثلة توضيحية وتشرح كيفية بناء مصفوفة القرار واستخدامها لاستخراج قواعد القرار المعممة الأعظمية. تختتم الورقة بتقديم نتائج الاختبار وتوضيح أن الطريقة المقترحة أسرع وأسهل من الطرق التقليدية لأنها لا تتطلب بناء أشجار القرار وتقليمها.
Critical review
تقدم الورقة البحثية إسهاماً مهماً في مجال اكتشاف المعرفة من قواعد المعطيات، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، يمكن أن تكون الورقة أكثر وضوحاً في شرح بعض المفاهيم الرياضية المعقدة، حيث قد يجد القارئ غير المتخصص صعوبة في فهمها. ثانياً، يمكن تحسين الورقة بإضافة المزيد من الأمثلة العملية لتوضيح كيفية تطبيق الخوارزمية المقترحة في سيناريوهات مختلفة. ثالثاً، يمكن أن تكون الورقة أكثر شمولية إذا تناولت مقارنة تفصيلية بين الخوارزمية المقترحة والخوارزميات الأخرى الموجودة في الأدبيات، مع تقديم تحليل لأداء كل منها. وأخيراً، يمكن أن تستفيد الورقة من تقديم دراسة حالة تطبيقية توضح الفوائد العملية للخوارزمية المقترحة في مجال محدد مثل الطب أو التجارة.
Questions related to the research
-
ما هي الأداة الجديدة التي قدمها Z. Pawlak للتعامل مع الغموض في البيانات؟
قدم Z. Pawlak طريقة المجموعات التقريبية في عام 1982 كأداة جديدة للتعامل مع الغموض في البيانات.
-
ما هي الخطوات الأساسية لمنهجية البحث المقترحة في الورقة؟
تتألف منهجية البحث من عدة خطوات: جمع وتعميم البيانات، حساب قواعد القرار المعممة الأعظمية، واختبار الطريقة المقترحة على قاعدة بيانات حقيقية.
-
ما هي الفائدة الرئيسية للخوارزمية المقترحة مقارنة بالطرق التقليدية؟
الفائدة الرئيسية هي أن الخوارزمية المقترحة أسرع وأسهل لأنها لا تتطلب بناء أشجار القرار وتقليمها، مما يوفر الوقت والجهد.
-
كيف يتم حساب قواعد القرار المعممة الأعظمية باستخدام مصفوفة القرار؟
يتم حساب قواعد القرار المعممة الأعظمية من مصفوفة القرار عن طريق بناء تابع بولياني لكل حالة موجبة وتبسيطه باستخدام قوانين الجبر البولياني.
References used
W. Ziarko, 1993- Variable Precision Rough Sets Model, Journal of Computer and Systems Sciences, vol. 46. no. 1, pp. 39-59
Pawlak, Z. and Skowron, 2007- Rudiments of Rough Sets, Information Sciences, 177,3-27
S. Bhattacharya and K. Debnath, 2016- A Study on Lower Interval Probability Function Based Decision Theoretic Rough Set Models , Annals of Fuzzy Mathematics and Informatics, Volume x, No. x, pp. 1-xx
The purpose of this study is to offer help to patients through the employment of
databases applications of existing and available telecommunication systems in medical
services ,particularly treatment. So that it can be possible to avoided what can
We tackle the problem of self-training networks for NLU in low-resource environment---few labeled data and lots of unlabeled data. The effectiveness of self-training is a result of increasing the amount of training data while training. Yet it becomes
The mentioning relational database system term has become a synonymous to
database system, but the monopoly of big companies that work in database systems field
has become an obsession for persons who work in this field, because of the high costs o
relation extraction systems have made extensive use of features generated
by linguistic analysis modules. Errors in these features lead to errors of
relation detection and classification. In this work, we depart from these
traditional approaches w
In our research we offer detailed study of one of the data
mining functions within the text data using the object properties in
databases. It studies the possibility of applying this function on the
Arabic texts. We use procedural query language P