بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

تصنيف المستندات باستخدام شبكات بيز

Document Classification using Bayesian networks

3045 0 114 0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جامعة تشرين مشروع تخرج

تاريخ النشر 2016

والبحث باللغة العربية

تأليف بشار محمد( مشرف ) - بانة عمر( طالب ) - آلاء حسين( طالب ) - حسام ديب( طالب ) - علي محمد( طالب )

تمت اﻹضافة من قبل Bana Omar

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

أصبحت قضية استرجاع المعلومات في يومنا هذا من أهم القضايا والتحدّيات التي تشغل العالم كنتيجة منطقية للتطوّر التكنولوجي المتسارع والتقدم الهائل في الفكر الإنساني والبحوث والدراسات العلمية في شتى فروع المعرفة وما رافقه من ازدياد في كميات المعلومات إلى حدّ يصعب التحكم بها والتعامل معها. لذا نهدف في مشروعنا إلى تقديم نظام استرجاع معلومات يقوم بتصنيف المستندات حسب محتواها إلا أن عمليّة استرجاع المعلومات تحوي درجة من عدم التأكد في كل مرحلة من مراحلها لذا اعتمدنا على شبكات بيز للقيام بعملية التصنيف وهي شبكات احتماليّة تحوّل المعلومات إلى علاقات cause-and-effect و تعتبر واحدة من أهم الطرق الواعدة لمعالجة حالة عدم التأكد . في البدء نقوم بالتعريف بأساسيّات شبكات بيز ونشرح مجموعة من خوارزميّات بنائها وخوارزميّات الاستدلال المستخدمة ( ولها نوعان دقيق وتقريبي). يقوم هذه النظام بإجراء مجموعة من عمليّات المعالجة الأوليّة لنصوص المستندات ثم تطبيق عمليات إحصائية واحتمالية في مرحلة تدريب النظام والحصول على بنية شبكة بيز الموافقة لبيانات التدريب و يتم تصنيف مستند مدخل باستخدام مجموعة من خوارزميات الاستدلال الدقيق في شبكة بيز الناتجة لدينا. بما أنّ أداء أي نظام استرجاع معلومات عادة ما يزداد دقّة عند استخدام العلاقات بين المفردات (terms) المتضمّنة في مجموعة مستندات فسنأخذ بعين الاعتبار نوعين من العلاقات في بناء الشبكة: 1- العلاقات بين المفردات(terms). 2- العلاقات بين المفردات والأصناف(classes).

مراجعة الذكاء الصنعي:

قُم بترقية الحساب لمشاهدة المحتوى

ملخص البحث

تتناول هذه الورقة البحثية موضوع تصنيف المستندات باستخدام شبكات بيز الاحتمالية. تبدأ الورقة بمقدمة حول أهمية استرجاع المعلومات والتحديات التي تواجهها في ظل الكم الهائل من البيانات الرقمية المتاحة يومياً. تهدف الدراسة إلى تقديم نظام لتصنيف المستندات يعتمد على شبكات بيز، وهي شبكات احتمالية تمثل العلاقات السببية بين المتغيرات. يتم شرح أساسيات شبكات بيز وخوارزميات بنائها والاستدلال الاحتمالي المستخدم فيها. كما تتناول الورقة مقارنة بين المدرسة الكلاسيكية والمدرسة البيزيانية في علم الإحصاء، وتعرض مجموعة من عمليات المعالجة الأولية للنصوص مثل التقطيع وإزالة الكلمات الشائعة والتجريد. تتضمن الورقة أيضاً شرحاً مفصلاً لخوارزميات بناء شبكات بيز مثل خوارزمية Hill Climbing وخوارزمية Chow and Liu، بالإضافة إلى خوارزميات الاستدلال الدقيق مثل Variable Elimination وخوارزميات الاستدلال التقريبي مثل Sampling Methods. في القسم العملي، يتم تقديم نموذج جديد لشبكة بيز يتألف من طبقتين من المفردات وطبقة للأصناف، ويتم اختبار هذا النموذج على مجموعة من مقالات رويترز المصنفة يدوياً. تظهر النتائج أن إدخال العلاقات بين الكلمات يزيد من دقة التصنيف، إلا أن العدد الكبير من العقد والعلاقات قد يبطئ عملية التدريب والتصنيف. تختتم الورقة بتقديم توصيات لتحسين أداء النموذج في المستقبل.

قراءة نقدية

تعتبر هذه الورقة البحثية شاملة ومفصلة في تناولها لموضوع تصنيف المستندات باستخدام شبكات بيز الاحتمالية. ومع ذلك، يمكن توجيه بعض النقد البناء لتحسين الدراسة. أولاً، قد يكون من المفيد تقديم المزيد من الأمثلة العملية لتوضيح كيفية تطبيق الخوارزميات المختلفة في سياقات متنوعة. ثانياً، يمكن تحسين القسم العملي بإضافة المزيد من التفاصيل حول كيفية اختيار العتبات والمعايير المستخدمة في تقييم الأداء. ثالثاً، على الرغم من أن الدراسة تناولت العديد من خوارزميات الاستدلال، إلا أنه يمكن تحسينها بمقارنة أداء هذه الخوارزميات مع تقنيات أخرى حديثة في مجال تعلم الآلة. رابعاً، يمكن تحسين الدراسة بإضافة تحليل أعمق لتأثير حجم بيانات التدريب على دقة التصنيف وسرعة التنفيذ. أخيراً، يمكن تقديم توصيات أكثر تفصيلاً حول كيفية تحسين خوارزميات التجريد والمعالجة الأولية للنصوص لزيادة دقة التصنيف.

أسئلة حول البحث

ما هي الفائدة الرئيسية لاستخدام شبكات بيز في تصنيف المستندات؟

الفائدة الرئيسية لاستخدام شبكات بيز في تصنيف المستندات هي قدرتها على تمثيل العلاقات السببية بين المتغيرات بشكل احتمالي، مما يتيح استدلالات دقيقة حتى في ظل وجود بيانات غير كاملة أو غير مؤكدة.
ما هي الخوارزميات المستخدمة في بناء شبكات بيز؟

تتضمن الخوارزميات المستخدمة في بناء شبكات بيز خوارزمية Hill Climbing، وخوارزمية Chow and Liu، وخوارزمية K2، وخوارزمية TPDA.
كيف يمكن تحسين دقة تصنيف المستندات باستخدام شبكات بيز؟

يمكن تحسين دقة تصنيف المستندات باستخدام شبكات بيز من خلال إدخال العلاقات بين الكلمات في بنية الشبكة، واستخدام خوارزميات استدلال دقيقة، وتحسين خوارزميات التجريد والمعالجة الأولية للنصوص.
ما هي التحديات التي تواجه استخدام شبكات بيز في تصنيف المستندات؟

من التحديات التي تواجه استخدام شبكات بيز في تصنيف المستندات هي العدد الكبير من العقد والعلاقات التي قد تبطئ عملية التدريب والتصنيف، والحاجة إلى بيانات تدريب عالية الجودة، وتعقيد الحسابات في الشبكات الكبيرة.

كلمات مفتاحية

شبكات بيز تصنيف المستندات استرجاع المعلومات خوارزميات الاستدلال المعالجة الأولية للنصوص التعلم الآلي

المراجع المستخدمة

Stuart J. Russell , Peter Norvig ," Artificial Intelligence A Modern Approach" , Third Edition, New Jersey ,2010

Alfonso Eduardo Romero Lopez,Document Classification Models based on Bayesian Network

Luis M. de Campos, Juan M. Fernández-Luna, Juan F. Huete ," Clustering terms in the Bayesian network retrieval model: a new approach with two term-layers

Dimitri P. Bertsekas , John N. Tsitsiklis," Introduction to Probability", Second Edition

قيم البحث

887 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

من المعروف أن طريقة المزيج (تشانغ وآخرون، 2017)، واحدة من أساليب تكبير البيانات، من المعروف أنها سهلة التنفيذ والفعالة للغاية. على الرغم من أن طريقة المزيج مخصصة لتحديد الصور، إلا أنه يمكن تطبيقه أيضا على معالجة اللغة الطبيعية. في هذه الورقة، نحاول ت طبيق طريقة المزيج إلى مهمة تصنيف المستندات باستخدام تمثيلات تشفير ثنائية الاتجاه من المحولات (بيرت) (ديفلين وآخرون، 2018). نظرا لأن Bert يسمح بإدخال الإصدارين من الجملة، فإننا نسقط تسلسل الكلمات من مستندتين مع ملصقتين مختلفتين واستخدمت الإخراج متعدد الفصول كبيانات خاضعة للإشراف مع ناقل ساخن واحد. في تجربة باستخدام Corpus أخبار Livedoor، وهي اليابانية، قارننا دقة تصنيف المستندات باستخدام طريقتين لاختيار المستندات المراد متسلسلا بتصنيف المستندات العادي. نتيجة لذلك، وجدنا أن الطريقة المقترحة أفضل من التصنيف العادي عند خلط المستندات التي تحتوي على نقص التسميات بشكل تفضيلي. يشير هذا إلى أن كيفية اختيار مستندات المزيج لها تأثير كبير على النتائج.

mix-up method document classification task document classification طريقة خلط مهمة تصنيف المستندات صناعة حمض الفوسفور

تصنيف النص المختلط من التعليمات البرمجية باستخدام شبكات الكبسولة

911 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

يمثل تحديا كبيرا في تحليل بيانات Me-Dia الاجتماعية التي تنتمي إلى لغات تستخدم البرنامج النصي غير الإنجليزي هو طبيعتها المختلطة من التعليمات البرمجية.قدمت أثر الحدث الذي أحدث طرازات تضمين حديثة تضمين تضمين الحديث (كل من أحادي الأحادي S.A.bert و Multil ingal S.A.XLM-R) كهدوث نهج FOROMISP.في هذه الورقة، نوضح أداء هذا التضمين وزارة الدفاع إلى العوامل المتعددة، مثل الخلاط الشامل من الشفرة في DataSet، وكلفة بيانات التدريب.نحن منظمات تجريبية أن كبسولة مقدمة تقدمت حديثا يمكن أن تتفوق على مصنف مصنوع على Bertned English-Bert بالإضافة إلى مجموعة بيانات تدريب XLM-R فقط من حوالي 6500 عينة لبيانات Sinhala-English المزاجية للبيانات المختلطة.

capsule networks code-mixed text text using capsule شبكات كبسولة النص المختلط النص باستخدام كبسولة صناعة حمض الفوسفور المزيد..

نظام تصنيف المستندات العربية حسب محتواها

3938 - جامعة تشرين 2012 مشروع تخرج

اخترنا في هذا المشروع العمل على تطوير نظام يقوم بتصنيف المستندات العربية حسب محتواها, يقوم هذه النظام بالتحليل اللفظي لكلمات المستند ثم إجراء عملية Stemming"رد الأفعال إلى أصلها" ثم تطبيق عملية إحصائية على المستند في مرحلة تدريب النظام ثم بالاعتماد على خوارزميات في الذكاء الصنعي يتم تصنيف المستند حسب محتواه ضمن عناقيد

Machine learning Nlp Support vector machine fuzzy system Arabic nlp

التصنيف متعدد العلامات من النصوص الفكاهة الصينية باستخدام شبكات اهتمام Hypergraph

706 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نستخدم شبكات انتباه Hypergraph (Hypergat) للتعرف على ملصقات متعددة من النصوص الصينية الفكاهة.نحن أولا تمثل مزحة كملفوق.يتم استخدام هياكل Hyperedge المتسلسلة واللالسة الدلالية لبناء Hyperedges.ثم، يتم اعتماد آليات الاهتمام لمعلومات السياق التجميعية ال مضمنة في العقد والمواد التوظيف.أخيرا، نستخدم Hypergat المدربين لإكمال مهمة تصنيف العلامات المتعددة.أظهرت النتائج التجريبية على مجموعة بيانات الفكاهة الصينية متعددة التسمية أن نموذج Hypergat يتفوق على النماذج السابقة على التسلسل السابق (CNN، Bilstm، FastText) ورسم الرسم البياني (Graph-CNN، TextGcn، GNN Level Student).

hypergraph attention networks chinese humor texts attention networks شبكات انتباه Hypergraph الفكاهة الصينية النصوص انتباه الشبكات صناعة حمض الفوسفور المزيد..

أداء نظام تصنيف الأشكال في الصورة باستخدام الشبكات العصبونية الالتفافي

1767 - جامعة تشرين 2019 ورقة بحثية

في السنوات الأخيرة نمت مشكلة تصنيف الكائنات في الصّور نتيجة لمتطلبات القطاع الصناعي.على الرّغم من تعدد التقنيات المستخدمة للمساعدة في عملية التصنيف SIFT Scale Invariant Feature Transforms، ORB Oriented Fast And Rotated Brief , SURF Speed Up Robust Features، إضافة لشبكات التعلم العميق Deep Learning Neural Network DNN والشبكات العصبونية الالتفافية Convolutional Neural Network CNN، فإن الأنظمة المقترحة لمعالجة هذه المشكلة تفتقر للحل الشّامل للصعوبات المتمثلة بوقت التّدريب الطّويل والذاكرة العائمة أثناء عملية التدريب، وانخفاض معدّل التصنيف. تعتبر الشبكات العصبونية الالتفافيةConvolutional Neural Networks (CNNs) من أكثر الخوارزميات استخداما لهذه المهمة، فقد كانت نموذجا حسابيا لتحليل البيانات الموجودة في الصور. تم اقتراح نموذج شبكة التفافية عميقة جديد لحل المشاكل المذكورة أعلاه. يهدف البحث إلى إظهار أداء نظام التّعرف باستخدام شبكاتCNNs على الذّاكرة المتاحة وزمن التدريب وذلك من خلال منهجة متغيرات مناسبة للشبكة العصبونية الالتفافية. قاعدة البيانات المستخدمة في هذا البحث هي CIFAR10 المكونة من60000 صورة ملونة تنتسب لعشرة أصناف، حيث أن كل 6000 صورة تكون لصنف من هذه الأصناف. يوجد 50000 صورة للتدريب و 10000 صورة للاختبار. حقق النموذج لدى اختباره على عينة من الصور المنتقاة من قاعدة البيانات CIFAR10 معدل تصنيف 98.87%.

الشبكات العصبونية الذكاء الاصطناعي تصنيف الصور الشبكات العصبونية الالتفافية

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة الجزيرة الخاصة

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

تصنيف المستندات باستخدام شبكات بيز

Document Classification using Bayesian networks

اسأل ChatGPT حول البحث

No English abstract

اقرأ أيضاً