ترغب بنشر مسار تعليمي؟ اضغط هنا

قدم هذا البحث دراسة مرجعية عن الخوارزميات و النظم المتوافرة لكشف الانتحال، إِذ صمم و بني تطبيق لكشف الانتحال باستخدام محركات البحث المتوافرة على الشبكة العنكبوتية. إن مسألة كشف الانتحال في الوثائق المكتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بخصا ئص اللغة الطبيعية المعنية نفسها. يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات، و خوارزميات مقارنة محتوى الملفات التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات. تعتمد نظم كشف الانتحال على نوع محدد أو مزيج من خوارزميات كشف الانتحال؛ و ذلك للحصول على نظم كشف انتحال فعالة (سريعة و دقيقة). طور في هذا العمل نظام لكشف الانتحال باستخدام محرك البحث Bing و قد استخدمت خوارزمية تعتمد على خصائص اللغة،باستخدام نظرية بنية الكلام البلاغية (Rhetorical Structure Theory ).
يقدم هذا البحث دراسة مرجعية عن الخوارزميات و الأنظمة المتوفرة لكشف الانتحال ، و يقوم بتصميم و بناء تطبيق لكشف الانتحال في الأبحاث الطبية بتوظيف الأنطولوجيات الطبية العالمية المتوفرة على الشبكة العنكبوتية . إن مسألة كشف الانتحال في الأبحاث الطبية الم كتوبة باللغات الطبيعية هي مسألة معقدة و تتعلق بالمجال الدقيق للابحاث الطبية . يوجد العديد من الخوارزميات المستخدمة لكشف الانتحال في اللغات الطبيعية و التي تقسم بشكل عام إلى صنفين رئيسين هما خوارزميات المقارنة بين الملفات عن طريق بصمات الملفات ، و خوارزميات مقارنة محتوى الملفات و التي تتضمن خوارزميات مقارنة السلاسل النصية و خوارزميات مقارنة البنى الشجرية للملفات . حديثا تم البحث في مجال خوارزميات كشف الانتحال ذات البعد الدلالي فتم تطوير خوارزميات كشف الانتحال الدلالية المعتمدة على تحليل نماذج الاقتباس في الأبحاث العلمية . تمَ في هذا العمل تطوير نظام لكشف الانتحال باستخدام محرك البحث Bing ، حيث تم استخدام خوارزمية تعتمد على استخدام و توظيف نوعين من الانطولوجيات و هي الأنطولوجيات العامة مثل وورد نت ( WordNet ) و الأنطلوجيات الطبية العالمية أشهرها أنطولوجيا الأمراض Diseases ontology التي تحتوي على توصيف الأمراض و خصائصها و تعريفها و اشتقاق الأمراض من بعضها.
يهدف هذا البحث إلى اقتراح طريقة لتحسين نتائج استرجاع المعلومات العربية دلالياً و ذلك بتلخيص النصوص تجريدياً (Abstractive Summary) باستخدام خوارزميات معالجة اللغات الطبيعية (NLP), حل غموض معاني الكلمات (WSD) و قياس التشابهية الدلالية (Semantic Si milarity) فيما بينها باستخدام الأنتولوجيا العربية Arabic WordNet.
يعتبر تركيب الكلام بشكل آلي من أهم المسائل المطروحة في الذكاء الصنعي منذ بداياته، حيث تتزايد الحاجة لأنظمة تركيب كلام مستقرة بحيث تنتج خطاباً ذكياً مع كيفية الكلام الطبيعي. تركيب الكلام speech synthesis يعتبر الأهم في تصنيع آلات متحدثة قادرة على التو اصل مع الإنسان بطريقة فعالة وبسيطة، سواء في أنظمة الحوار الآلي Auto dialogue systems، توليد آلي للكتب الصوتية Auto generating of Audio books، متحدث مساعد لذوي الاحتياجات الخاصة different able humans، وغير ذلك من الأنظمة التي تحتاجها البشرية اعتماداً على معالجة اللغات الطبيعيةNatural language processing وفهم الكلام Language Understanding في سبيل خدمة التواصل بين الآلة والإنسان Human-computer Interaction.
يؤدي المعجم دورا مهما في أنظمة معالجة اللغات الطبيعية وخصوصا انظمة الترجمة الألية، فهو يزود أجزاء المنظومة بالمعلومات الضرورية لعملية الترجمة, وعلى الرغم من وجود العديد من البحوث في إطار معالجة اللغات الطبيعية، لم يكن هناك اهتمام كاف في المعجم وخصوصا المعجم العربي.
يندرج هذا البحث في إطار الكشف الآلي لعمليات الإنتحال في النصوص المدوّنة باللغة العربية وتقدّم هذه الورقة طريقة مبتكرة تعتمد على استخراج الكلمات الهامة في النص المراد كشفه ومن ثمّ تكوين سلاسل لغوية حسب تواترها في النص. وباستعمال محركات البحث يمكن التث بت من وجود هذه السلاسل اللغوية في نصوص أخرى. في مرحلة ثانية قمنا باستعمال الترجمة الآلية للسلاسل اللغوية قصد استخراج السلاسل المرادفة باللغة الإنجليزية ومن ثمّ استعمال محركات البحث لاستخراج النصوص المدوّنة باللغة الإنجليزية والتي تتطابق مع السلاسل بعد ترجمتها. وتقدّم هذه الورقة العلمية برنامج الكاشف وهو برنامج لكشف حالات الإنتحال وقد قمنا بتقييم البرنامج على مدونة من النصوص العربية وأبرزت النتائج كفاءة الطريقة المتبعة
البحوث العلمية حول تحليل المشاعر في اللغة العربية محدودة جدا في الوقت الحالي. بينما يوجد العديد من تطبيقات تحليل المشاعر في اللغة الانكليزية, اللغة العربية مازالت تخطو خطى بطيئة في هذا المجال. في هذا البحث، نقوم بعرض تطبيق حول تحليل المشاعر في اللغ ة العربية عبر تطبيق مصنف مشاعر لتغريدات عربية. التغريدات تم تحليلها لكي نحصل على قطبية مشاعر (ايجابية او سلبية)، بما أن البيانات تم جمعها من شبكة التواصل الاجتماعي تويتر, فهذا يعكس أهميتها الكبيرة في الشرق الأوسط، حيث اللغة العربية هي اللغة المحكية.
قمنا في هذا البحث باتباع نهج تحليل المشاعر المعتمد على المعجم لتحديد التوجه العام للطلاب، ايجابي او سلبي او محايد، اذ قمنا بداية ببناء معجم مشاعر انطلاقا من بعض المعاجم المعدة مسبقا ليتم اعتماده في عملية تحليل المشاعر، ثم قمنا بوضع نموذج يوجد رأي الط لاب العام بالاعتماد على المعجم السابق، يعالج النموذج الكتابي الكلمات التي تزيد من حدة المشاعر والرموز التعبيرية وبعض حالات النفي، وقمنا باضافة تفاعلات المستخدمين الأخرين مع المنشورات عند ايجاد التوجه العام بهدف اخذ أراء الطلاب الذين لم يعبروا عن أرائهم بنصوص مكتوبة.
مع زيادة الشبكات الاجتماعية ، بدأ الناس في مشاركة المعلومات عبر أنواع مختلفة من وسائل التواصل. في هذا العمل قمنا بالاستفادة من قصص الأطفال وتوظيفها لتعليم الاطفال وذلك عن طريق قراءة قصة لهم وتحويلها إلى نص ومعالجة النص باستخدام اللغات الطبيعية و استخراج المشاعر بشكل اتوماتيكي من هذه القصة و لتحقيق ذلك قمنا باستخدام عدة تقنيات و دمجها و قارنا بين نتائجها على عدد من القصص القصيرة المخصصة للأطفال حيث تم استخدام كل من التقنيات المختلفة غير الخاضعة للإشراف مثال Dictionary Basedأو خاضعة للإشراف كالشبكات العصبونية التي تعتمد على البيانات لتحليل المشاعر حيث استخدمنا مصنفات متعددة وهي Support Vector Machineوstochastic Gradient Descent و Decision Tree و Random ForestوNaïve BayesوK-Nearest NeighborوNearest Centroidكذلك استخدمنا الشبكات العصبونية العميقة كمثال الشبكات العصبونية التكرارية RNNو في النهاية تم التوصل إلى استنتاج المشاعر الصحيحة للقصة من خلال Dictionary Basedالتي اعطت افضل دقة ثم إظهار صورة التعبير الصحيح الذي يبين للطفل التعبير المراد إبداؤه عند سماع أحداث هذه القصةليتفاعل معه ويتعلم التعبير الصحيح
مرت الشبكة العنكبوتية بأجيال متعددة منذ أن تم تطويرها عام ١٩٩٠م على يد تيم بيرنـرز لي Lee- Berners Tim ، فقد دعمت النشر الإلكتروني من خلال صفحات تسـتخدم لغـة ترميز النصوص الفائقة HTML ، ثم تطورت فيما بعد لتعتمد على النشر باستخدام نظم إدارة المحتوى. و قد كانت الشبكة العنكبوتية تحقق استرجاع المعلومات وتبادل المعرفة والمشـاركة فيها بين المستفيدين من أي مكان دون اعتبار للحواجز الجغرافية. ومع ظهور الجيل الثاني من الويب تم استخدام تقنيات وبروتوكولات حديثة للنشر الإلكتروني، وبدأت عملية استخدام الشبكة العنكبوتية تتجه نحو التفاعل بين المستفيد والنظام مـن خـلال التقنيات المختلفة مثل الويكي wiki ، و خدمة مـوجز الويـب (RSS (Syndication Really Simple ، والشبكات الاجتماعية، وغيرها... ومع الاتجاه نحو الجيل الثالث من الويب ظهر ما يعرف بتقنيات الويب الدلالي web Semantic ، الذي يعد ثورة في عالم المعلومات، حيـث أحدث نقلة في معالجة المعلومات عن طريق تحقيق فهم الويب لمعاني ودلالات الكلمات التـي يعالجها ويسترجعها؛ فلم يقتصر الأمر على ما كان عليه في السابق من التعامل مع الآلة مـن خلال التعرف على اللغة الثنائية (صفر وواحد)، دون فهم لدلالات المكتوب عبر الويب. وقد تبع هذا التطور، تطوراً في نظم استرجاع المعلومات المستخدمة مع هذا الجيل الجديد من الويب؛ حيث ظهر ما يعرف بالبحث الدلالي search Semantic ، ومحركات البحث التـي تقدم هذا النوع من البحث. وفي هذه الدراسة تعرف الباحثة بالبحث الدلالي وخصائصه، وما يميزه عن البحث التقليـدي، مع دراسة تطبيقية تحليلية لاستخدام أحد محركات البحث الدلالي مقارنة بأحد محركات البحث التقليدي، حيث تغطي الدراسة كل من محرك بحث حكيا، ومحرك بحث جوجل، للتعرف على بعض خصائصهما البحثية والاسترجاعية خلال فترة إجراء الدراسة التطبيقية في شهر نوفمبر من عام ٢٠١٠م.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا