ترغب بنشر مسار تعليمي؟ اضغط هنا

qurantree.jl: حزمة جوليا للقرآري العربية

QuranTree.jl: A Julia Package for Quranic Arabic Corpus

222   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

Qurantree.jl عبارة عن حزمة مفتوحة المصدر للعمل مع القرآن الكراني العربية (Dukes and Habash، 2010).يهدف إلى تزويد جوليا برمجة برمجة برمجة برمجة آية آية بودية كبديل ل Apis Java JQurantree.تقدم Qurantree.jl حاليا وظائف للحصول على فهرسة بديهية للفصول والأعياء والكلمات وأجزاء من كلمات القرآن؛لإنشاء حرفي مخصص؛للشخصية DEDIACRECOTION والتطبيع؛وبالتعامل مع الميزات المورفولوجية.أخيرا، يمكن أن تعمل بشكل جيد مع أجهزة Julia TextanalySysis.jl وأدوات جمل بيثون.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أدت التقدم المحرز الأخير في معالجة اللغات الطبيعية إلى أن تصبح هياكل المحولات النموذجية السائدة المستخدمة لمهام اللغة الطبيعية.ومع ذلك، في العديد من مجموعات البيانات في العالم، يتم تضمين طرائق إضافية التي لا يستوفي المحول مباشرة.نقدم مجموعة أدوات متع ددة الوسائط، حزمة بيثون مفتوحة المصدر لتضمين بيانات النص والمجدول (القاطع والرقمي) مع المحولات لتطبيقات المصب.تدمج مجموعة أدواتنا جيدا مع تعانق واجهة برمجة التطبيقات الموجودة في وجه المعانقة مثل التوت والمركز النموذجي الذي يتيح تنزيل سهلة من مختلف النماذج المدربة مسبقا.
اللغة العربية هي اللغة الرسمية البالغ 22 دولة، تحدث بأكثر من 400 مليون متحدث.تستخدم كل واحد من هذا البلد على الأقل لهجة محادثة الحياة اليومية.ثم، العربية لديها 22 لهجة على الأقل.يمكن كتابة كل لهجة في البرامج النصية العربية أو العربية.تركز أحدث الأبحا ث على بناء نموذج لغة وجزعة تدريب لكل لهجة، في كل برنامج نصي.بعد هذه التقنية تعني إنشاء 46 موارد مختلفة (بما في ذلك اللغة العربية القياسية الحديثة، MSA) للتعامل مع لغة واحدة فقط.في هذه الورقة، استخرفنا مجموعة واحدة، ونقترح خوارزمية واحدة لإنشاء كائن تدريب واحد تلقائيا باستخدام بنية نموذج تصنيف واحد لتحليل المعنويات MSA ولهجات مختلفة.بعد مراجعة كوربوس التدريب يدويا، تتفوق النتائج التي تم الحصول عليها جميع نتائج الأدب البحثية ل Test Test Corpora.
تعد Word Embeddings مكونا أساسيا لأنظمة معالجة اللغة الطبيعية الحديثة، مما يجعل القدرة على تقييمها بدقة مهمة حيوية. نحن تصف ديسكوتس، معيار للتقييم الجوهري للكلمة العربية الجدلية. يغطي ديسكليكس خمسة لهجات عربية مهمة: جزائري، مصري، لبناني، سوري، وتونسي . في جميع هذه الدلج، يوفر ديسكيكلكس ضفافا لستة علاقات نصنية ودلالية، وهي الذكور إلى الإناث، المفرد إلى المزدوج، المفرد إلى الجمع، متنافرا، مقارنة، واثير إلى الماضي. وهكذا تتكون ديسكليك من مجموعة من أزواج الكلمات التي تمثل كل من العلاقات الست في كل من اللهجات الخمسة. لإظهار فائدة Dilex، نستخدمها لتقييم مجموعة من شركات الكلمة العربية الحالية والجديدة التي طورناها. بما يتجاوز تقييم Embeddings Word، يدعم ديسكلكلكس الجهود المبذولة لدمج اللهجات في منهج اللغة العربية. يمكن ترجمته بسهولة إلى العربية الحديثة العربية والإنجليزية، والتي يمكن أن تكون مفيدة لتقييم ترجمة Word. سيكون لدينا المعيار وكود التقييم ونماذج تضمين الكلمة الجديدة متاحة للجمهور.
توفر منصات الوسائط الاجتماعية (SM) مثل Twitter كميات كبيرة من البيانات في الوقت الفعلي والتي يمكن الاستفادة منها أثناء حالات الطوارئ الجماعية. تتطلب تطوير أدوات لدعم المجتمعات المتأثرة بالأزمات مجموعات البيانات المتاحة، والتي غالبا ما تكون موجودة لغا ت الموارد المنخفضة. تقدم هذه الورقة Kawarith A Corpus عربي لهي تيتر من أجل أحداث الأزمات، تضم أكثر من مليون تغريدات عربية تم جمعها خلال 22 أزمات حدثت بين عامي 2018 و 2020 وشمل عدة أنواع من الخطر. كشف استكشاف هذا المحتوى عن أهم المواضيع وأنواع المعلومات، وتقدم الورقة مجموعة بيانات معدنية من سبعة أحداث طارئة تعمل كمعيار ذهبي للعديد من المهام في أبحاث المعلوماتية للأزمات. استخدام البيانات المشروحة من نفس الحدث، يكون نموذج BERT يتم ضبطه جيدا لتصنيف تغريدات إلى فئات مختلفة في الإعداد متعدد الملصقات. تظهر النتائج أن النماذج القائمة على بيرت تسفر عن أداء جيد في هذه المهمة حتى مع كميات صغيرة من بيانات التدريب الخاصة بمهام المهام.
تحتل الدراسات التي تتناول حوسبة اللغة العربية أهمية كبيرة نظراً للانتشار الواسع للغة العربية , و اخترنا في هذه الدراسة العمل على معالجة اللغة العربية من خلال نظام استرجاع معلومات للمستندات باللغة العربية , الفكرة الأساسية لهذا النظام هو تحليل المستن دات والنصوص العربية و إنشاء فهارس للمصطلحات الواردة فيها , ومن ثم استخلاص أشعة أوزان تعبر عن هذه المستندات من أجل المعالجة اللاحقة للاستعلام و المقارنة مع هذه الأشعة للحصول على المستندات الموافقة لهذا الاستعلام . من خلال عملية تجريد للمصطلحات الواردة في المستندات تم الحصول على كفاءة استرجاع أفضل , و تعرضنا للعديد من خوارزميات التجريد التي وصلت إليها الدراسات السابقة . و تأتي عملية عنقدة المستندات كإضافة هامة , حيث يتمكن المستخدم من معرفة المستندات المشابهة لنتيجة البحث و التي لها صلة بـالاستعلام المدخل . في التطبيق العملي , تم العمل على نظام استرجاع معلومات مكتبي , يقوم بقراءة نصوص ذات أنواع مختلفة و عرض النتائج مع العناقيد الموافقة لها .

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا