ترغب بنشر مسار تعليمي؟ اضغط هنا

مربع الحوار هو كتلة لبناء أساسية لتفاعلات اللغة البشرية البشرية.يحتوي على كلمات متعددة الأحزاب المستخدمة لنقل المعلومات من طرف إلى آخر بطريقة ديناميكية ومتطورة.إن القدرة على مقارنة الحوار هي مفيدة في العديد من حالات استخدام العالم الحقيقي، مثل تحليلا ت المحادثة لمكالمات مركز الاتصال وتصميم الوكيل الظاهري.نقترح تكيف جديد من أداة تحرير المسافة إلى سيناريو تشابه الحوار.يأخذ نهجنا في الاعتبار مختلف جوانب المحادثة مثل دلالات الكلام وتدفق المحادثة والمشاركين.نقيم هذا النهج الجديد ومقارنة مع تدابير التشابه الوثيقة الحالية على مجموعة من مجموعات البيانات الخاصة بالجملي.توضح النتائج أن أسلوبنا تتفوق على النهج الأخرى في اتخاذ تدفق حوار الاستسلام، ومن الأفضل أن يتماشى مع التصور البشري لمشاكل المحادثة.
تقدير أنظمة التشابه الدلالي النصي (STS) درجة تشابه معنى بين جملتين.تقدر أنظمة STS عبر اللغات درجة تشابه معنى بين جملتين، كل منها بلغة مختلفة.عادة ما تستخدم الخوارزميات الحديثة عادة نهجا بالغضب بشدة، يصعب استخدامه لغات ضعف الموارد.ومع ذلك، يحتاج أي نه ج للحصول على بيانات التقييم لتأكيد النتائج.من أجل تبسيط عملية التقييم لغات ضعف الموارد (من حيث مجموعات بيانات تقييم STS)، نقدم مجموعات بيانات جديدة ل STS عبر اللغات والأحمر غير المباشر لغات دون بيانات التقييم هذه.نقدم أيضا نتائج العديد من الطرق الحديثة على هذه البيانات التي يمكن استخدامها كأساس للحصول على مزيد من البحث.نعتقد أن هذه المقالة لن تمد فقط أبحاث STS الحالية فقط إلى لغات أخرى، ولكنها ستشجع أيضا المنافسة على هذه بيانات التقييم الجديدة.
Rouge هو متري تقييم واسع الاستخدام في تلخيص النص.ومع ذلك، فإنه غير مناسب لتقييم أنظمة تلخيص الجماع حيث تعتمد على التداخل المعجمي بين معيار الذهب والملخصات التي تم إنشاؤها.يصبح هذا القيد أكثر وضوحا للغات الشاقة مع المفردات الكبيرة جدا ونسب عالية النوع / الرمز المميز.في هذه الورقة، نقدم نماذج التشابه الدلالي لأتراك وتطبيقها كقائد تقييم لمهمة تلخيص مبادرة.لتحقيق ذلك، قامنا بترجمة مجموعة بيانات STSB الإنجليزية إلى تركية وعرضت بيانات التشابه الدلالي الأول للتركية أيضا.أظهرنا أن أفضل نماذج التشابه لدينا لها محاذاة أفضل مع الأحكام البشرية المتوسطة مقارنة بالحصان في كل من علاقات بيرسون ورأس.
تقدم هذه الورقة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021: الغموض المتعدد اللغات والتبلغة في السياق (MCL-WIC). بيانات هذه المهمة المشتركة هي أساسا بعض الزوجات الزوجية عبر اللغة أو متعددة الل غات. اللغات المشمولة في Corpus تشمل اللغة الإنجليزية والصينية والفرنسية والروسية والعربية. الهدف المهمة هو الحكم على ما إذا كانت الكلمات نفسها في أزواج هذه الجملة لها نفس المعنى في الجملة. يمكن اعتبار ذلك مهمة التصنيف الثنائي لأزواج الجملة. ما نحتاج إليه هو استخدام طريقتنا لتحديد بدقة قدر الإمكان معنى الكلمات في زوج الجملة هي نفسها أو مختلفة. يتكون النموذج المستخدم من قبل فريقنا بشكل أساسي من خوارزميات روبرتا و TF-IDF. مؤشر تقييم النتائج لتقديم المهمة هو درجة F1. شاركنا فقط في مهمة اللغة الإنجليزية. وكانت النتيجة النهائية لنتائج التنبؤ بمجموعة الاختبار المقدمة من فريقنا 84.60.
تدفق هذه الورقة تشابه داخل حدود وبين 84 أصناف لغة عبر تسعة لغات.يتم استخلاص هذه الشركة من المصادر الرقمية (الويب والتويت)، مما يتيح لنا تقييم ما إذا كانت هذه الشركات المشار إليها على جغرافية موثوقة في النمذجة الاختلاف اللغوي.الفكرة الأساسية هي أنه، إ ذا تمثل كل مصدر بشكل كاف مجموعة متنوعة من اللغات الأساسية واحدة، فيجب أن تكون التشابه بين هذه المصادر مستقرة عبر جميع اللغات والبلدان.توضح الورقة أن هناك اتفاق ثابت بين هذه المصادر باستخدام تدابير التشابه القائم على التردد.يوفر هذا دليلا إضافيا على أن شركة Corsea المرجعية الرقمية التي تمت الإشارة إليها باستمرار تمثل الأصناف اللغوية المحلية.
مجردة، تم اقتراح العديد من المقاييس لتقييم تشابه (مجردة) بمعنى تمثيلات (AMRS)، لكن القليل يعرف عن الطريقة التي تتعلق بتصنيفات التشابه البشري. علاوة على ذلك، فإن المقاييس الحالية لديها نقاط القوة والضعف التكميلية: يتأكيد البعض على السرعة، في حين أن ال بعض الآخر يجعل محاذاة هياكل الرسوم البيانية الصريحة، بسعر خطوة محاذاة مكلفة. في هذا العمل، نقترح مقاييس تشابه Weisfeiler-Leman Amr الجديدة التي توحد نقاط القوة المقاييس السابقة، مع تخفيف نقاط ضعفها. على وجه التحديد، فإن مقاييسنا الجديدة قادرة على مطابقة التحسسات الفاصلة والحرية والحث على N: M بين العقد. علاوة على ذلك، نقدم معيارا لمقاييس AMR بناء على الأهداف العلنية (الخيزران)، أول معيار لدعم التقييم التجريبي لمقاييس التشابه الرسمي في الرسم البياني. يزيد الخيزران إمكانية تفسير النتائج عن طريق تحديد أهداف علنية متعددة تتراوح بين أهداف تشابه الجملة لإجراء اختبارات الإجهاد التي تحقق متانة متري ضد تحويلات الرسم البياني المعني بالمعنى والمعنى. نعرض فوائد الخيزران عن طريق تنميط المقاييس السابقة ومقاييس خاصة بنا. تشير النتائج إلى أن مقاييس جديدة قد تكون بمثابة خط أساس قوي للعمل في المستقبل.
ازدادت أهمية خدمات الويب Web Services بعد ظهور الحوسبة السحابية Cloud Computing و انتشار الحوسبة خدمية التوجه Service Oriented Computing ( SOC ) التي غيرت طريقة تطوير البرمجيات. بسبب التطور الكبير الحاصل في هذا المجال أصبح من الصعب على المستخدمين ال قيام بتجميع خدمات الويب يدوياً. يعرض البحث نظاماً مقترحاً للتجميع الآلي لخدمات الويب بالاستفادة من الدلالات المرتبطة به، تطلب التجميع الآلي التعامل مع اكتشاف خدمات الويب، و تجميع الخدمات التي تم اكتشافها. بدايةً تم اقتراح طريقة آلية لاكتشاف خدمات الويب بالاعتماد على الانطولوجيا، حيث عُرفت هرمية للمفاهيم المرتبطة بالمجال ضمن ملف انطولوجيا المجال، ثم استخدمت في توصيف دلالات واجهات الخدمات (الدخل و الخرج) و حساب درجة التشابه فيها بينها، كما عُرفت انطولوجيا تُمثل هرمية التصنيف تحوي مفاهيم مجالات مختلفة، من أجل حل مسألة عدم التجانس و تقليل عدد الخدمات المكتشفة عن طريق حصرها ضمن مجال الطلب نفسه. كما اقتُرحت خوارزمية لتجميع خدمات الويب آلياً، و استُخدمت كلفة تنفيذ الخدمة كمعيار غير وظيفي يعبر عن جودة الخدمات التي سيتم تجميعها، من أجل الحصول على حل أمثلي يرضي المستخدم. كذلك تم العمل على تقليل زمن التجميع عن طريق تحميل ملفات الانطولوجيا عند أول طلب فقط. تم اختبار النظام من أجل التحقق من دقة النتائج و فعالية الأداء و ذلك باستخدام معايير الحساسية Recall و الدقة Precision و F-measure إضافة إلى زمن التجميع.
نفذ البحث في مخابر هيئة الطاقة الذرية قسم البيولوجيا الجزيئية و التقانة الحيوية بدمشق, و تمت الدراسة على خمسة أصناف من العنب المحلية و المدخلة أخذت من مركز بحوث التفاحيات والكرمة في السويداء بهدف توصيفها جزيئياً و تحديد درجة القرابة الوراثية بينها , باستخدا تقنية ال SSR و استخدم لذلك 20 زوجاً من البادئات المتخصصة.
تم بناء نظام استرجاع لصور الطرح الرقمي للأوعية الدموية الدماغية ثنائية الأبعاد اعتماداً على المحتوى. يقوم النظام بإيجاد صور في قاعدة بيانات لصور الطرح الرقمي للأوعية الدموية الدماغية (حالة أمهات الدم الكيسية) ذات محتوى مشابه لصورة استعلام معينة و است رجاعها. تمت عملية الاستعلام عن طريق استخلاص خصائص الشكل البصرية لأمهات الدم في صورة الاستعلام و صياغتها في متجه خصائص و مقارنة مكوناته مع متجهات خصائص الشكل لأمهات الدم في صور الطرح الرقمي للأوعية الدموية الموجودة في قاعدة البيانات. تم قياس التشابه باستخدام المسافة الاقليدية، و من ثم استرجاع الصور التي لها محتوى مشابها لصورة الاستعلام. تم حساب الدقة بإيجاد نسبة مساحة أم الدم في الصور المسترجعة الأولى إلى مساحة أم الدم في صورة الاستعلام لثمان حالات استعلام تم تنفيذها، بلغت قيمة متوسط الدقة 98%، تبين النتائج أنَّه يمكن استخدام النظام المنفذ لاسترجاع الصور اعتماداً على المحتوى لإيجاد المساحة غير المعلومة لأم الدم من قاعدة بيانات لصور أمهات الدم تكون فيها مساحة أم الدم فيها معلومة.
تنتمي الأنظمة الناصحة إلى صف من الأنظمة المصممة لمساعدة الافراد على معالجة المعلومات الإضافية الزائدة أو الناقصة. يمكن لهذه الأنظمة أن تساعد الأفراد من خلال تأمين النصائح و ذلك بالاعتماد على مجموعة من التقنيات .إن تقنية الفلترة التعاونية Collaborativ e filtering مستخدمة بشكل واسع لتحقيق التنبؤ ضمن الأنظمة الناصحة.أعرض ضمن هذا البحث طريقة تستخدم علاقات التفضيل بدلا من التنبؤ المطلق و ذلك لحساب التشابه بهدف إيجاد تقدير تنبؤي بسلع جديدة. تظهر النتائج التجريبية أن الطريقة الموضحة ضمن هذا البحث تؤمن نتيجة أفضل من طرق أخرى كطريقة Somers Coefficient على سبيل المثال.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا