ترغب بنشر مسار تعليمي؟ اضغط هنا

أصبحت نماذج المحولات التي يتم ضبطها بشكل جيد مع هدف وضع العلامات على التسلسل الاختيار المهيمن لمهام التعرف على الكيان المسمى. ومع ذلك، يمكن أن تفشل آلية اهتمام الذات مع طول غير مقيد في التقاط التبعيات المحلية بالكامل، خاصة عندما تكون البيانات التدريب ية محدودة. في هذه الورقة، نقترح هدف تدريب مشترك جديد يلتقط أفضل دلالات الكلمات المقابلة لنفس الكيان. من خلال زيادة هدف التدريب مع عنصر فقدان المجموعة-الاتساق، فإننا نعزز قدرتنا على التقاط التبعيات المحلية مع الاستمتاع بمزايا آلية اهتمام الذات غير المقيد. على DataSet Conll2003، تحقق طريقة لدينا اختبار F1 من 93.98 مع نموذج محول واحد. الأهم من ذلك أن نموذج Conlll2003 الخاص بنا يعرض مكاسب كبيرة في تعميم البيانات خارج نطاق البيانات: على مجموعة بيانات OnTonotes، نحقق F1 من 72.67 وهو 0.49 نقطة مطلقا أفضل من خط الأساس، وعلى WNUT16 تعيين F1 من 68.22 وهو مكاسب من 0.48 نقطة. علاوة على ذلك، في DataSet WNUT17، نحقق F1 من 55.85، مما يؤدي إلى تحسن مطلق 2.92 نقطة.
واحدة من الآليات التي ينتشر فيها التضليل عبر الإنترنت، لا سيما من خلال وسائل التواصل الاجتماعي، من خلال توظيف تقنيات الدعاية. وتشمل هذه الاستراتيجيات الخطابية والنفسية المحددة، تتراوح من الاستفادة من العواطف لاستغلال المداخل المنطقية. في هذه الورقة، هدفنا هو دفع البحث إلى الأمام على اكتشاف الدعاية بناء على تحليل النص، بالنظر إلى الدور الحاسم قد تلعب هذه الأساليب لمعالجة هذه القضية المجتمعية الرئيسية. وبشكل أكثر دقة، نقترح نهجا مختلفا لتصنيف مقتطفات نصية كرسائل دعائية ووفقا لتقنية الدعاية التطبيقية الدقيقة، بالإضافة إلى تحليل لغوي مفصل للميزات التي تميز معلومات الدعاية في النص (مثل ميزات الدلالية والمعنويات والحجة) وبعد تجارب واسعة النطاق التي أجريت على موارد دعائية متوفرة (IE، NLP4IF'19 و Semeval'y-Task Task 11) تشير إلى أن النهج المقترح، والاستفادة من طرازات لغة مختلفة والسمات اللغوية التي تم التحقيق فيها، تحقق نتائج واعدة للغاية حول تصنيف الدعاية، سواء - وفي مستوى الشظية.
توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده ا باستخدام مقياس ليكرت خمس نقاط.يستخدم نظامنا الانحدار اللوجستي والمجموعة واسعة من الميزات اللغوية (على سبيل المثالنقوم بتحليل تأثير الميزات اللغوية المختلفة على أداء التصنيف ونقوم بتقييم النتائج من حيث الخطأ المطلق، ويعني الخطأ التربيعي، وارتباط بيرسون، وارتباط سبيرمان.
إن التنبؤ بصعوبة المفردات الخاصة بالمجال هي مهمة مهمة نحو فهم أفضل للنطاق، وتعزيز التواصل بين الأشخاص الخبراء والخبراء.نقوم بالتحقيق في مركبات الأسماء المغلقة الألمانية والتركيز على تفاعل الميزات المعجمية القائمة على المركب (مثل التردد والإنتاجية) وا لميزات المستندة إلى المصطلحات (المتناقضة لغة خاصة بالمجال واللغة العامة) عبر تمثيلات الكلمات والصفوفات المصنفة.تكمل تجارب التنبؤ لدينا رؤى من التصنيف باستخدام (أ) ميزات مصممة يدويا لتوصيف الوالدين وتشكيل المركب و (ب) مجمعات Word Adgentdings.نجد أنه بالنسبة للتمييز الثنائي الواسع في التردد المركزي باللغة العامة "VS. الصعب الصعب" كافية، ولكن بالنسبة للتمييز الأكثر غرامة من أربعة فئات من الدرجة الأولى، فمن الأهمية بمكان تضمين ميزات الحد من الناحية المتعاوية والمركب والميزات المكونة.
نحن ندرس فائدة ميزات المعدات الباردة لتحديد نوع وهدف خطاب الكراهية في تعليقات Facebook الهولندية.لهذا الغرض، تم تفاح جميع الاستعارات البغيضة في كوربوس الهولندية Lilah Corpus وتفسيرها بما يتماشى مع نظرية الاستعارة المفاهيمية وتحليل الاستعارة الحرج.نحن نقدم نتائج SVM وبرت / روبرتا، والتحقيق في تأثير طرق ترميز معلومات الاستعارة المختلفة على نوع خطاب الكراهية ودقة الكشف المستهدف.تظهر نتائج التجارب التي أجريت أن ميزات الاستعارة البغيضة تحسين الأداء النموذجي لهذه المهام.لمعرفتنا، هذه هي المرة الأولى التي يتم فيها التحقق من فعالية الاستعارات البغيضة كمصدر معلومات لتصنيف Hatespeech.
بناء أنظمة NLP التي تخدم الجميع يتطلب محاسبة اختلافات اللهجة. ولكن اللهجات ليست كيانات متجانسة: بالأحرى، يتم التقاط الفروق بين اللهجات وداخلها من خلال وجود وغياب العشرات من ميزات اللهجة في الكلام والنص، مثل حذف كوبولا في إنه ∅ قيد التشغيل ". في هذه ا لورقة، نقدم مهمة الكشف عن ميزة اللهجة، وتقديم نهج تعليمي متعدد الأيتاكي، بناء على المحولات المحددة مسبقا. بالنسبة لمعظم اللهجات، لا تتوفر كوربورا المشروح على نطاق واسع لهذه الميزات، مما يجعل من الصعب تدريب التعرف عليها. نحن ندرب نماذجنا على عدد صغير من أزواج صغيرة، والبناء على كيفية تحديد اللغويين عادة ميزات اللهجة. التقييم في مجموعة اختبار من 22 ميزات لهجيات للهنديون يدل على أن هذه النماذج تتعلم كيفية التعرف على العديد من الميزات بدقة عالية، وأن عدد قليل من أزواج الحد الأدنى يمكن أن تكون فعالة للتدريب مع الآلاف من الأمثلة المسمى. ونحن نوضح أيضا إمكانية تطبيق ميزة الهياكل على حد سواء كإجراء من كثافة اللهجة وكمعشر لهجة اللهجة.
اقترحت الدراسات النفسية تتبع العين أن التماسك الدلالي في السياق والتنبؤية تؤثر على معالجة اللغة خلال نشاط القراءة.في هذه الدراسة، يمكننا التحقيق في الارتباط بين أوجه التشابه الجيبيني المحسوب مع نماذج تضمين كلمة (كلا من البيانات الثابتة والسياقية) وبي انات تتبع العين من اثنين من القراءة الطبيعية.درسنا أيضا ارتباطات الدرجات المفاجئة المحسوبة بثلاث نماذج لغة حديثة.تظهر نتائجنا ارتباطا قويا للدرجات المحسوبة مع بيرت والقفازات، مما يشير إلى أن التشابه يمكن أن تلعب دورا مهما في أوقات القراءة النمذجة.
تم في هذا البحث بناء خوارزمية, لاستخلاص معالم ثلاثية البعد, ذات أشكال إسطوانية بالإضافة إلى الجيوب و المجاري من نماذج CAD المخزنة بصيغة ملفات STL و ذلك بالاعتماد على منهج التمثيل البياني (graph-based method) و منهج القواعد (rule-based method). كما تم تصميم تطبيق باستخدام Visual Stduio C# كواجهة تخاطب مع المستخدم, يسمح له باستيراد نماذج CAD المخزنة بصيغة STL و استخلاص المعالم و عرض المعلومات الخاصة لكل منها (كقطر و ارتفاع و إحداثيات مركز الثقل للأسطوانات, و قيم العرض و الطول و الإرتفاع للجيوب و المجاري, بالإضافة إلى عرض السطوح المشكلة لها و احداثيات مركز ثقلها). تم بناء الخوارزمية المقترحة من عدة مراحل هي: تقسيم النموذج المدروس إلى مجموعة من السطوح بالاعتماد على خوارزمية RegionGrowing, يليها استخلاص المعالم الأسطوانية بالاعتماد على منهج القواعد, و استخلاص الجيوب و المجاري بالاعتماد على منهج التمثيل البياني, ثم حساب المعلومات الهندسية الخاصة بكل معلم. تم اختبار الخوارزمية المقترحة على نماذج CAD تحتوي معالم أسطوانية و جيوب و مجاري بأشكال مختلفة. و قد أظهرت النتائج قدرة الخوارزمية المقترحة على استخلاص المعالم الإسطوانية و الجيوب و المجاري من نماذج CAD مختلفة مخزنة بصيغة ملفات STL بالإضافة إلى ايجاد المميزات الهندسية للمعالم المستخلصة مثل (احداثيات مركز الثقل بالنسبة لمركز النموذج, العرض, العمق, الارتفاع و قطر الأسطوانة .... الخ).
استخدمت نظم استخلاص العلاقة استخداماً واسعاً للميزات المولدة من وحدات التحليل اللغوي. إذ تؤدي الأخطاء في هذه المميزات إلى أخطاء في كشف العلاقة و تصنيفها. في هذا البحث، نخرج من هذه الطرق التقليدية مع بنية مميز معقدة من خلال تقديم الشبكات العصبونية الالتفافية لاستخلاص العلاقة التي تتعلم تلقائيا ميزات من الجمل و تقلل من الاعتماد على مجموعة الأدوات و المصادر الخارجية. نموذجنا يأخذ مزايا أحجام لنوافذ متعددة للمرشحات و تضمينات الكلمة المدربة سابقا كدخل لبنية غير ثابتة لتحسين الأداء.
يشير البحث إلى السّمات الفنيّة و الأسلوبيّة للحكاية على لسان الحيوان في شعر لافونتين ، و الّتي تتمثّل في تعدّد مصادر الحكايات و تنوّعها ، و روح الفكاهة ، و الإيقاع الموسيقيّ المتنوّع ، و الحدث في الحكاية و علاقته بالنّقد الاجتماعي .
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا