بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

دراسة منهجيات التشكيل الآلي للنصوص العربية بهدف وضع خطة عمل لبناء مشكل آلي مفتوح المصدر

Exploring Arabic text diacritization approaches in view of establishing an action plan for developing an open source diacritizer

3155 2 45 0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جامعة دمشق ورقة بحثية

تاريخ النشر 2012

والبحث باللغة العربية

تأليف ندى غنيم( باحث ) - غيداء ربداوي( باحث )

تمت اﻹضافة من قبل Shamra Editor

المعالجة الآلية للغة الطبيعية التشكيل الآلي للنصوص مدونات التقويم تقويم المشكلات الآلية automatic Arabic language processing automatic diacritization of Arabic texts evaluation corpus diacritizaters evaluation

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

يعد غياب التشكيل في النصوص العربية الحديثة من أكبر التحديات التي تواجه المعالجة الآلية للغة العربية. يمكن للقارئ العربي أن يتوقع التشكيل الصحيح للكلمات عند قراءته نصاً غير مشكول، في حين يحتاج الحاسوب إلى خوارزميات لاستعادة التشكيل بالاعتماد على معارف مختلفة. و نقصد بالتشكيل الحركات جميعها (ضمة، فتحة، كسرة، سكون)، فضلاً عن الشدة و التنوين. تعتمد بعض منهجيات التشكيل الآلي على المعالجة اللغوية للنصوص، في حين تعتمد منهجيات أخرى على طرائق إحصائية تستند إلى المدونات، و تدمج بعض النظم المنهجيتين السابقتين في مقاربات هجينة. نعرض في هذا البحث دراسة مرجعية شاملة للطرائق المختلفة التي اعتُمدت في هذه المنهجيات، كما نستعرض المدونات المختلفة التي استُخدمت للاختبارات و التقويم، ثم نطرح مواصفات المدونات التي يجب إعدادها لإجرائيات التقويم، و المعايير التي يجب أن تحققها إجرائية تقويم المشكلات الآلية. يخلص البحث إلى وضع خطة عمل لبناء مشكل آلي مفتوح المصدر برعاية منظمة ألكسو، و بمشاركة جهات بحثية من بلدان مختلفة.

مراجعة الذكاء الصنعي:

قُم بترقية الحساب لمشاهدة المحتوى

ملخص البحث

تتناول هذه الدراسة التحديات التي تواجه التشكيل الآلي للنصوص العربية، وتستعرض مختلف المنهجيات المستخدمة في هذا المجال. تتطرق الدراسة إلى الطرق اللغوية والإحصائية والهجينة، وتستعرض المدونات المستخدمة في الاختبارات والتقويم. كما تطرح الدراسة خطة عمل لبناء مشكل آلي مفتوح المصدر بالتعاون مع منظمة ألكسو وجهات بحثية من بلدان مختلفة. تتضمن الخطة إنشاء مدونة مشكولة، ونظام لتقويم المشكلات الآلية، وإجراء تعديلات على المشكلات المختلفة لتحسين النتائج، وأخيراً إعداد توثيق موسع للنظام المفتوح المصدر.

قراءة نقدية

دراسة نقدية: على الرغم من الجهد الكبير المبذول في هذه الدراسة، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، لم يتم توضيح كيفية التعامل مع النصوص التي تحتوي على أخطاء إملائية أو نحوية، وهو أمر شائع في النصوص العربية. ثانياً، الدراسة تركز بشكل كبير على الجانب التقني دون التطرق بشكل كافٍ إلى التطبيقات العملية للمشكل الآلي في مجالات مثل التعليم أو الإعلام. ثالثاً، كان من الممكن تقديم أمثلة عملية أكثر توضيحاً لنتائج النماذج المختلفة لتحسين فهم القارئ.

أسئلة حول البحث

ما هي التحديات الرئيسية التي تواجه التشكيل الآلي للنصوص العربية؟

من التحديات الرئيسية غياب التشكيل في النصوص العربية الحديثة، مما يتطلب استخدام خوارزميات معقدة لمحاكاة القدرة البشرية على استعادة التشكيل الصحيح.
ما هي المنهجيات المختلفة المستخدمة في التشكيل الآلي للنصوص العربية؟

تتضمن المنهجيات المعالجة اللغوية للنصوص، الطرق الإحصائية المستندة إلى المدونات، والمقاربات الهجينة التي تدمج بين الطريقتين.
ما هي خطة العمل المقترحة لبناء مشكل آلي مفتوح المصدر؟

تشمل الخطة إنشاء مدونة مشكولة، تطوير نظام آلي لتقويم المشكلات، إجراء تعديلات على المشكلات المختلفة لتحسين النتائج، وإعداد توثيق موسع للنظام المفتوح المصدر.
ما هي المعايير التي يجب أن تحققها المدونات المستخدمة في تقويم نظم التشكيل الآلي؟

يجب أن تشمل المدونات مجموعة كبيرة من النصوص في مجالات متعددة، أن تكون مشكولة بالكامل، وأن تحتوي على معلومات لغوية مثل نمط الكلمة وبنيتها الصرفية.

كلمات مفتاحية

التشكيل الآلي اللغة العربية المعالجة اللغوية المدونات الخوارزميات النماذج الإحصائية النماذج الهجينة

المراجع المستخدمة

N. Habash, O. Rambow, 2007, "Arabic Diacritization through Full Morphological Tagging", Proceedings of 8th Meeting of the North American Chapter of the Association for Computational Linguistics; Human Language Technologies Conference

M. Rashwan, M. Al-Badrashiny, M. Attia and S. M. Abdou, 2009, "A Hybrid System for Automatic Arabic Diacritization", Proceedings of the 2nd International Conference on Arabic Language Resources and Tools, Cairo, Egypt, April 2009

M. Maamouri, A. Bies, and T. Buckwalter. 2004. The Penn Arabic Treebank: Building a large-scale annotated arabic corpus. In NEMLAR Conference on Arabic Language Resources and Tools, Cairo, Egypt

قيم البحث

1345 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم مجموعة أدوات مفتوحة المصدر لمعالجة اللغة الطبيعية الدنماركية، مما يتيح سهولة الوصول إلى أحدث التطورات الدنماركية ل NLP.يتميز مجموعة الأدوات بوظائف المجمع لتحميل النماذج ومجموعات البيانات بطريقة موحدة باستخدام أطر NLP لجهة خارجية.تم تطوير مجموعة الأدوات لتعزيز بناء المجتمع وفهم الحاجة من تقاسم الصناعة والمعرفة.كمثال على ذلك، نقدم تغريدات غاضبة: لعبة توضيحي لإنشاء وعي NLP الدنماركي وخلق مجموعة بيانات جديدة مشروحة معنويات.

الإنجليزية ينوجندر المعايير danish natural language اللغة الطبيعية الدنماركية صناعة حمض الفوسفور

استخدام المصادر المفتوحة في بناء انطولوجيا باللغة العربية

4294 - جامعة تشرين 2013 ورقة بحثية

أصبحت القدرة على البحث ضمن مواقع الانترنت ضرورة للكثير من الناس و تعاني كثير من مواقع الانترنت من صعوبة وصول المستخدم للمعلومة المطلوبة بسبب عدم الأخذ بالحسبان معاني الكلمات و مدلولاتها Semantics عند البحث تدعم التقنيات الحالية معظم اللغات الطبيعية مع بقاء ذلك ضعيفاً بالنسبة للغة العربية. تشكل الأنطولوجيا العنصر المحوري في التطبيقات التي تدعم علم دلالات الألفاظ, و على الرغم من وجود الكثير من أدوات بناء الانطولوجيات باللغات الأجنبية، فإن الأداة Arabic WordNet (AWN)، التي تعدّ من المصادر المفتوحة قد تكون الوحيدة التي تسمح لنا بتطوير انطولوجيا باللغة العربية. في هذا البحث سنقوم بتحديد الخطوات اللازمة لتطوير انطولوجيا عربية و بناء انطولوجيا اعتماداً على هذه الخطوات تستخدم في مواقع الجامعات مستخدمين الأداة Arabic WordNet التأكد من نظافة الانطولوجيا المصممة، و تقييم أداء عملية البحث في الموقع بعد استخدام الانطولوجيا المصممة.

Ontology Open Source semantic Arabic WordNet الأنطولجيا المصادر المفتوحة علم دلالات الألفاظ وورد نت عربي المزيد..

استكشاف أهمية النص المصدر في التحرير التلقائي للترجمة الآلية للترجمة الآلية

1147 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تتطلب الترجمة الدقيقة معلومات على مستوى المستندات، والتي يتم تجاهلها بواسطة الترجمة الآلية على مستوى الجملة.لقد أظهر العمل الحديث أن الاتساق على مستوى المستند يمكن تحسينه باستخدام معلومات ما بعد التحرير التلقائي باستخدام معلومات اللغة المستهدفة فقط ( TL).ندرس نموذج قرد موسع يدمج سياق المصدر.يكشف التقييم البشري للطلاقة والكفاة باللغة الإنجليزية - الترجمة الروسية الإنجليزية أن النموذج الذي يتمتع بالوصول إلى سياق المصدر يتفوق بشكل كبير على قرد أحادي الأحادي من حيث الكفاية، وهو تأثير تجاهله إلى حد كبير بواسطة مقاييس التقييم التلقائي إلى حد كبير.تظهر نتائجنا أن نمذجة TL فقط يزيد الطلاقة دون تحسين كفاية، مما يدل على الحاجة إلى تكييف النص المصدر لتحرير ما بعد التحرير التلقائي.كما أنها تسليط الضوء على النقاط العمياء في الأساليب التلقائية للتقييم المستهدف وإظهار الحاجة إلى تقييم بشري لتقييم جودة الترجمة على مستوى المستند بشكل موثوق.

exploring the importance context-aware machine translation context-aware machine استكشاف الأهمية الترجمة الآلية السياق آلة السياق صناعة حمض الفوسفور المزيد..

البرمجيات مفتوحة المصدر لإدارة المكتبات الرقمية

2604 - المعهد العالي للعلوم التطبيقية والتكنولوجيا 2015 حلقة بحث

دراسة لعدة برمجيات مفتوحة المصدر لإدارة المكتبات الرقمية المستخدمة لاستيعاب المعلومات ونشرها الى الأشخاص الذين يحتاجونها.

مكتبة رقمية إدارة المكتبات الرقمية greenstone

أكثر من الأفضل: تعزيز جيل الحوار مفتوح المجال عبر المعرفة متعددة المصدر غير المتجانسة

691 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

على الرغم من تحقيق أداء ملحوظ، عادة ما تستخدم أعمال المعرفة المعززة بالمعرفة عادة قاعدة معرفة متجانسة واحدة متجانسة من تغطية المعرفة المحدودة. وبالتالي، فإنهم غالبا ما ينضون في الأساليب التقليدية لأنه لا يمكن ربط جميع الحوارات بإدخالات المعرفة. تقترح هذه الورقة نموذج جيل حوار جديد، مربع حوار MSKE، لحل هذه المشكلة بثلاث مزايا فريدة من نوعها: (1) بدلا من واحد فقط، يمكن حجز MSKE في وقت واحد على الاستفادة من مصادر المعرفة غير المتجانسة المتعددة (بما في ذلك ولكن لا يقتصر على معرفة المنطقية حقائق ومعرفة النص ومعرفة Infobox) لتحسين تغطية المعرفة؛ (2) لتجنب تعارض الموضوع بين السياق ومصادر المعرفة المختلفة، نقترح اختيار مرجعي متعدد التحديد لتحديد السياق / المعرفة بشكل أفضل؛ (3) نقترح جيل متعدد المراجع لتوليد ردود إعلامية من خلال الإشارة إلى مراجع توليد متعددة في نفس الوقت. تظهر التقييمات الواسعة على مجموعة بيانات صينية الأداء الفائق لهذا العمل ضد النهج المختلفة من أحدث الأحداث. لأفضل المعرفة لدينا، هذا العمل هو أول من يستخدم المعرفة غير المتجانسة متعددة المصدر في توليد الحوار المحسن في مجال المعرفة.

enhancing open-domain dialogue enhancing open-domain تعزيز الحوار مفتوح تعزيز المجال المفتوح صناعة حمض الفوسفور

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

جامعة بابل

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

دراسة منهجيات التشكيل الآلي للنصوص العربية بهدف وضع خطة عمل لبناء مشكل آلي مفتوح المصدر

Exploring Arabic text diacritization approaches in view of establishing an action plan for developing an open source diacritizer

اسأل ChatGPT حول البحث

اقرأ أيضاً