ترغب بنشر مسار تعليمي؟ اضغط هنا

نقوم بتقديم Gerdalir، مجموعة بيانات ألمانية لاسترجاع المعلومات القانونية بناء على وثائق الحالة من منصة المعلومات القانونية المفتوحة المفتوحة.تتكون DataSet من استفسارات 123 ألفا، يتم تصنيف كل منها وثيقة واحدة ذات صلة على الأقل في مجموعة من وثائق الحال ة 131K.نقوم بإجراء العديد من التجارب الأساسية بما في ذلك BM25 وإعادة الرحالة العصبية لحديمع DataSet لدينا، نهدف إلى توفير معيار موحد لرجال الألمانية وترويج البحث المفتوح في هذا المجال.أبعد من ذلك، تضم مجموعة بياناتنا بيانات تدريبية كافية لاستخدامها كملقمة من النماذج في اللغة الألمانية أو اللغوية متعددة اللغات.
مرت الشبكة العنكبوتية بأجيال متعددة منذ أن تم تطويرها عام ١٩٩٠م على يد تيم بيرنـرز لي Lee- Berners Tim ، فقد دعمت النشر الإلكتروني من خلال صفحات تسـتخدم لغـة ترميز النصوص الفائقة HTML ، ثم تطورت فيما بعد لتعتمد على النشر باستخدام نظم إدارة المحتوى. و قد كانت الشبكة العنكبوتية تحقق استرجاع المعلومات وتبادل المعرفة والمشـاركة فيها بين المستفيدين من أي مكان دون اعتبار للحواجز الجغرافية. ومع ظهور الجيل الثاني من الويب تم استخدام تقنيات وبروتوكولات حديثة للنشر الإلكتروني، وبدأت عملية استخدام الشبكة العنكبوتية تتجه نحو التفاعل بين المستفيد والنظام مـن خـلال التقنيات المختلفة مثل الويكي wiki ، و خدمة مـوجز الويـب (RSS (Syndication Really Simple ، والشبكات الاجتماعية، وغيرها... ومع الاتجاه نحو الجيل الثالث من الويب ظهر ما يعرف بتقنيات الويب الدلالي web Semantic ، الذي يعد ثورة في عالم المعلومات، حيـث أحدث نقلة في معالجة المعلومات عن طريق تحقيق فهم الويب لمعاني ودلالات الكلمات التـي يعالجها ويسترجعها؛ فلم يقتصر الأمر على ما كان عليه في السابق من التعامل مع الآلة مـن خلال التعرف على اللغة الثنائية (صفر وواحد)، دون فهم لدلالات المكتوب عبر الويب. وقد تبع هذا التطور، تطوراً في نظم استرجاع المعلومات المستخدمة مع هذا الجيل الجديد من الويب؛ حيث ظهر ما يعرف بالبحث الدلالي search Semantic ، ومحركات البحث التـي تقدم هذا النوع من البحث. وفي هذه الدراسة تعرف الباحثة بالبحث الدلالي وخصائصه، وما يميزه عن البحث التقليـدي، مع دراسة تطبيقية تحليلية لاستخدام أحد محركات البحث الدلالي مقارنة بأحد محركات البحث التقليدي، حيث تغطي الدراسة كل من محرك بحث حكيا، ومحرك بحث جوجل، للتعرف على بعض خصائصهما البحثية والاسترجاعية خلال فترة إجراء الدراسة التطبيقية في شهر نوفمبر من عام ٢٠١٠م.
يعرض هذا البحث آليات تطبيق تقنيات التنقيب في المعطيات و حلول ذكاء الأعمال على المعطيات الموجودة ضمن مكتبة الجامعة العربية الدولية بعد ربطها بمعطيات الطلاب الموجودة ضمن النظام الأكاديمي الخاص بالجامعة، و الإجابة عن مجموعة من الأسئلة و الاستفسارات ا لتي من الممكن أن تؤثر في سير العمل ضمن المؤسسة التعليمية بوجه عام و ضمن مكتبة الجامعة بوجه خاص، و تقديم بعض الحلول لمساعدة المكتبة في تطوير خدماتها، و تطوير آليات العمل ضمنها، إضافة إلى تحديد بعض المؤشرات المتعلقة بدور موارد المعلومات في تطوير العملية التعليمية.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
إن معظم محركات البحث المعروفة مثل جوجل هي محركات بحث نصية تطابق المفردات المدخلة فقط من قبل المستخدم وتسترجع قائمة من النتائج، يحقق نموذج محرك البحث المقترح في هذه الاطروحة حلا أفضل بشكل لا يطابق المفردات المدخلة من قبل المستخدم فقط، بل ويطابق المفر دات الأخرى التي لها علاقة مع المفردات المعطات في الأنطولوجيات الداعمة له.
نعرض في هذا البحث مقاربة لتكامل محركات البحث مع تقنيات الترشيح، و ذلك من خلال علاقة دينامكية للتهجين بين الترشيح التعاوني، و الترشيح المرتكز على المحتوى؛ بهدف التخفيف من المحدوديات السابقة، و تحسين مقاييس الدقة و الاستذكار للوثائق المسترجعة. تَستخدم المقاربة المقترحة نموذج أنطلوجي المجال (Domain ontology) في تمثيل لاحة المستخدم بهدف الحد من الأخطاء و التشويش الناتجة عن عد لاحة المستخدم ككيان واحد كما تَستفيد من تفاعل المستخدم و نشاطه، للقيام بعمليات التعليم و التكيف المستمر للاحة المستخدم؛ لتعكس بشكل دائم شخصيته و ميوله دون الاعتماد على أمثلة تدريبية فقط؛ بهدف تحسين الترشيح، و تلبية حاجة المستخدم بالحصول على المعلومات الموائمة بدقة أكبر.
يهدف البحث إلى دراسة خصائص اللغة العربية المؤثرة في عملية استرجاع المعلومات والتعرف على المشاكل الناجمة عن استخدام اللغة العربية في نظم استرجاع المعلومات بمختلف انواعها وايجاد حلول ومقترحات لها. والمقارنة بين ادوات واستراتيجيات البحث المستخدمة في نظم استرجاع المعلومات من حيث تاثيرها على معدلات التحقق للوثائق المسترجعة ودراسة أثر استخدام او عدم استخدام تقنيات معالجة اللغة العربية في الحواسيب (المدقق النحوي، المحلل الصرفي وغيرها) على معالجة خصائص اللغة العربية (الترادف، المشترك اللفظي ...).
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا