ترغب بنشر مسار تعليمي؟ اضغط هنا

تم تحقيق معالم رائعة في نص مطابقة من خلال اعتماد آلية انتباه متقاطعة لالتقاط الروابط الدلالية ذات الصلة بين تمثيلين عقديين.ومع ذلك، يركز الاهتمام العادي عبر مستوى الروابط على مستوى الكلمات بين تسلسل المدخلات، وإهمال أهمية المعلومات السياقية.نقترح شبك ة التفاعل المعرفة في السياق (عملة معدنية) لمحاذاة متسلسلتين بشكل صحيح وتستنتج علاقتها الدلالية.على وجه التحديد، يتضمن كل كتلة تفاعل (1) آلية اعتبارية إعلامية في السياق لإدماج المعلومات السياقية بفعالية عند محاذاة متتسلالات، و (2) طبقة انصهار بوابة لتمثيلات محاذاة محاذاة مرنة.نحن نطبق كتل تفاعلية مكدسة متعددة لإنتاج محاذاة على مستويات مختلفة وتحسين نتائج الانتباه تدريجيا.تجارب على اثنين من مجموعات بيانات مطابقة الأسئلة والتحليلات التفصيلية توضح فعالية نموذجنا.
في السنوات الأخيرة، أدى الاستخدام الواسع للوسائط الاجتماعية إلى زيادة في جيل من المحتوى السام والهجومي على المنصات عبر الإنترنت. استجابة، عملت منصات وسائل التواصل الاجتماعي على تطوير أساليب الكشف التلقائي وتوظيف المشرفين البشري للتعامل مع هذا الطوفان من المحتوى الهجومي. في حين تم تطبيق العديد من النماذج الإحصائية للحدث من بين الفنون للكشف عن الوظائف السامة، لا توجد سوى عدد قليل من الدراسات التي تركز على الكشف عن الكلمات أو التعبيرات التي تشكل هجوما بعد. هذا يحفز تنظيم مهمة Semeval-2021 5: مسابقة الكشف عن المسافات السامة، التي قدمت المشاركين مع مجموعة بيانات تحتوي على شرح سام يمتد في المشاركات الإنكليزية. في هذه الورقة، نقدم دخول WLV-RIT لمهمة Semeval-2021 5. يحقق نموذجنا الأفضل أداء محول العصبي 0.68 F1 درجة. علاوة على ذلك، نقوم بتطوير إطار مفتوح المصدر للكشف المتعدد اللغات عن الممثل الهجومي، أي القنص، بناء على المحولات العصبية التي تكتشف تمديد السام في النصوص.
تهدف مهمة Sereval 4 إلى إيجاد خيار مناسب من المرشحين المتعددين لحل مهمة فهم القراءة في الجهاز.تقترح معظم الأساليب الموجودة على Concat السؤال والخيار معا لتشكيل نموذج على دراية بالسياق.ومع ذلك، نقول أن التسلسلات المباشرة يمكن أن توفر فقط سياقا محظوظا فقط لمهمة MRC، مما يتجاهل المواقف المحددة للخيار بالنسبة للسؤال.في هذه الورقة، نقترح نموذج رواية MRC عن طريق تعبئة الخيارات في السؤال لإنتاج سياق جيد المحبوس (يعرف بأنه ملخص) يمكن أن تكشف بشكل أفضل عن العلاقة بين الخيار والسؤال.نقوم بإجراء سلسلة من التجارب على مجموعة البيانات المعينة، وتظهرت النتائج أن نهجنا يفوق النظرات الأخرى النظراء إلى حد كبير.
يهدف تصحيح الخطأ النحوي (GEC) إلى تصحيح أخطاء الكتابة ومساعدة المتعلمين في اللغة على تحسين مهاراتهم في الكتابة. ومع ذلك، تميل نماذج GEC الحالية إلى إنتاج تصحيحات زائفة أو تفشل في اكتشاف الكثير من الأخطاء. يعد نموذج تقدير الجودة ضروريا لضمان أن يحصل ا لمتعلمون على نتائج GEC دقيقة وتجنب مضللة من الجمل المصححة بشكل سيء. يمكن أن تولد نماذج GEC المدربة جيدا العديد من الفرضيات عالية الجودة من خلال فك التشفير، مثل البحث الشعاع، والتي توفر أدلة GEC القيمة ويمكن استخدامها لتقييم جودة GEC. ومع ذلك، تهمش النماذج الحالية أدلة GEC المحتملة من فرضيات مختلفة. تقدم هذه الورقة شبكة التحقق العصبية (Vernet) لتقدير جودة GEC مع فرضيات متعددة. تحدد Vernet تفاعلات بين الفرضيات مع رسم بياني للمنطق وإجراء نوعين من آليات الاهتمام لنشر أدلة GEC للتحقق من جودة الفرضيات التي تم إنشاؤها. تظهر تجاربنا على أربع مجموعات بيانات GEC أن Vernet يحصل على أداء اكتشاف الأخطاء النحوية الحديثة، وتحقق أفضل نتائج تقدير الجودة، وتحسين أداء GEC بشكل كبير من خلال فرضيات إعادة النشر. تتوفر جميع رموز البيانات والمصادر في https://github.com/thunlp/vernet.
في هذه الورقة، نركز على مشكلة الكلمات الرئيسية ومطابقة المستندات من خلال النظر في مستويات ذات صلة مختلفة. في نظام توصيتنا، يتبع أشخاص مختلفون الكلمات الرئيسية الساخنة المختلفة باهتمام. نحتاج إلى إرفاق المستندات إلى كل كلمة رئيسية ثم توزيع المستندات ع لى الأشخاص الذين يتبعون هذه الكلمات الرئيسية. يجب أن تحتوي المستندات المثالية على نفس الموضوع مع الكلمة الأساسية، والتي نسميها ذات أهمية تدرك الموضوع. بمعنى آخر، وثائق الأهمية ذات الصلة بالموضوع أفضل من تلك الأهمية جزئيا في هذا التطبيق. ومع ذلك، فإن المهام السابقة لا تحدد أبدا أهمية علم الموضوع بوضوح. لمعالجة هذه المشكلة، نحدد صلة ثلاثية المستوى بمهمة مطابقة الوثيقة للكلمة الرئيسية: الأهمية ذات الصلة بالموضوع، والأهمية جزئيا والأهمية. لالتقاط الأهمية بين الكلمة الرئيسية القصيرة والوثيقة في المستويات الثلاثة المذكورة أعلاه، لا ينبغي لنا الجمع بين الموضوع الكامن فقط من الوثيقة بتمثيلها العصبي العميق، ولكن أيضا التفاعلات المعقدة النموذجية بين الكلمة الرئيسية والوثيقة. تحقيقا لهذه الغاية، نقترح نموذجا متطابقا على تفاعل ثنائي مرحلتين ومطابقة النص (TITA). من حيث الموضوع - أدرك "، نقدم نموذج موضوع عصبي لتحليل موضوع المستند ثم استخدامه لمزيد من تشفير المستند. من حيث التفاعل من مرحلتين "، نقترح مراحل متتالية لنموذج التفاعلات المعقدة بين الكلمة الرئيسية والوثيقة. تكشف التجارب الواسعة أن تيتا تفوقت على خطوط الأساس الأخرى المصممة بشكل جيد وتظهر أداء ممتاز في نظام توصيتنا.
نقدم سبارتا، وهي طريقة استرجاع عصبي رواية تعرض وعد كبير في الأداء والتعميم والتفسيرية للحصول على سؤال السؤال المفتوح. على عكس العديد من أساليب التصنيف العصبي التي تستخدم ناقلات كثيفة أقرب بحث جار، يتعلم سبارتا تمثيل متقطع يمكن تنفيذها بكفاءة كمؤشر مق لوب. تمكن التمثيل الناتج استرجاع العصبي القابل للتطوير الذي لا يتطلب البحث التقريبي باهظ التقريب ويؤدي إلى أداء أفضل من نظيره الكثيف. لقد صادقنا مناهجنا على مهام الإجابة على سؤال (OpenQA) 4 و 11 مهام الإجابة على السؤال (REQA) 11. يحقق Sparta أحدث نتائج جديدة في مجموعة متنوعة من الأسئلة المفتوحة في المجال الرد على المهام في كل من مجموعات البيانات الإنجليزية والصينية، بما في ذلك الفريق المفتوح، CMRC، إلخ. تؤكد التحليل أيضا أن الطريقة المقترحة تخلق تمثيل قابل للتفسير الإنسان ويسمح السيطرة على المفاضلة بين الأداء والكفاءة.
استخراج الكلمات الرئيسية هي مهمة تحديد الكلمات (أو تعبيرات متعددة الكلمة) التي تصف أفضل وثيقة معينة وخدمة في بوابات الأخبار لربط مقالات من مواضيع مماثلة. في هذا العمل، نطور وتقييم أساليبنا على أربع مجموعات بيانات جديدة تغطي لغات أقل ممثلة تمثيلا، لغا ت غنية بالمظورة في صناعة وسائل الإعلام الإخبارية الأوروبية (الكرواتية، الإستونية، اللاتفية والروسية). أولا، نؤدي تقييم اثنين من أساليب المحولات العصبية الخاضعة للإشراف، والتكلمة العصبية القائمة على المحولات لتحديد الكلمات الرئيسية (TNT-KID) وتمثيل التشفير ثنائي الاتجاه من المحولات (بيرت) مع وجود ذاكرة عشوائية قصيرة الأجل طويلة الأجل الطويلة الأجل (BILSTM) رأس التصنيف CRF)، ومقارنتها بموجب تردد خط الأساس - تعتمد على تردد المستندات (TF-IDF) مقرها. بعد ذلك، نظهر أنه من خلال الجمع بين الكلمات الرئيسية التي تم استرجها من قبل كل من الأساليب القائم على المحولات العصبية وتوسيع المجموعة النهائية من الكلمات الرئيسية ذات التقنية القائمة على TF-IDF غير المدعومة، يمكننا تحسين استدعاء النظام بشكل كبير، مما يجعلها مناسبة للاستخدام ك نظام التوصية في بيئة مجلس الإعلام.
تستخدم حساسات انترنت الأشياء(internet of things) (IOT) نموذج النشر\ الاشتراك كوسيلة للاتصال مستفيدة من خصائصه المستقلة المتعلقة بالمكان و الزمان و المزامنة. و نتيجة لعدم تجانس الأطراف المتصلة تضاف خاصية الاستقلال الدلالي كبعد رابع, و لكن هذه الاضافة عقدت عملية المطابقة و خفضت كفاءتها, لذلك تم جمع الاشتراكات و الاحداث بشكل عناقيد تبعا للمواضيع لإنجاز عملية المطابقة ضمن تلك العناقيد . حيث تبين أن عملية الجمع ضمن عناقيد أدت لزيادة الانتاجية نتيجة تخفيض زمن و دقة المطابقة عندما تصل الاشتراكات الى حدودها القصوى . و بالتالي إظهار فوائد العناقيد بالإضافة إلى تحسين دقة و كفاءة المطابقة عبر استخدام هذا النهج .
يهدف البحث الحالي إلى تدريج مقياس السيكاثينيا من اختبار منيسوتا المتعدد الأوجه للشخصية النسخة الثانية، و الوصول إلى شكل جديد مختصر للاختبار متحرر من خصائص العينة والبنود، باستخدام النموذجين أحادي و ثنائي المعلم، و اختبار أثر متغيرين في نتائج تدريج مقياس السيكاثينيا و هما ( النموذج المستخدم، حجم العينة ) باستخدام محكات الدقة المتمثلة في الخطأ المعياري و الثبات و دالة المعلومات .
تم في هذا البحث إجراء تقييم لكواشف و واصفات النقاط المميزة في الصور عند استخدامهم من أجل بناء صورة بانورامية و ذلك لاستخدامها لاحقاً في بحث نقوم فيه ببناء مشهد ثلاثي البعد ضمن بيئة داخلية. نُوقش عمل كل من الواصفات (SIFT, SURF, BRIEF, ORB, BRISK, FREA K)، عند استخدامها مع الكواشف الملائمة لها على قاعدة بيانات ملتقطة بواسطة كاميرا RGB-D لبيئة داخلية. اُستخدمت خوارزمية اختبار التقاطع و خوارزمية RANSAC (إجماع العينات العشوائية) لإيجاد مصفوفة الانتقال بين الصور. نوقشت نتائج كل من: سرعة الكواشف و سرعة الواصفات و سرعة عملية المطابقة و متوسط عدد النقاط المميزة المستخلصة و الحساسية و الدقة لكل الواصفات. كما استُخدمت قاعدة بيانات جامعة أوكسفورد لتبيان أفضل الواصفات لتتعامل مع تغيرات الدوران و الإضاءة التي يمكن أن تنتج عن تغير زاوية الإضاءة في الصور. خلُصت الدراسة إلى أن الكاشف SIFT يعطي أفضل نتائج ضمن التطبيقات التي لا تهتم بمدة تنفيذ العملية، و يعتبر الزوج SURF/BRISK أفضل زوج واصف/كاشف يمكن استخدامه في تطبيقات الزمن الحقيقي و يعطي نتائج منافسة جداً لنتائج الكاشفSIFT.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا