ترغب بنشر مسار تعليمي؟ اضغط هنا

في هذه الورقة، اقترحنا محلل دلالي أبعاد بر فندقية، وهو مصمم من خلال دمج معلومات على مستوى Word.حقق نموذجنا ثلاثة من أفضل النتائج في أربعة مقاييس على rocling 2021 المهمة المشتركة: تحليل المعنويات الأبعاد للنصوص التعليمية ".أجرينا سلسلة من التجارب لمقا رنة فعالية مختلف الأساليب المدربة مسبقا.علاوة على ذلك، فإن النتائج تعاني أيضا على أن طريقتنا يمكن أن تحسن بشكل كبير من الأداء من الأساليب الكلاسيكية.استنادا إلى التجارب، ناقشنا أيضا تأثير هياكنات النموذج ومجموعات البيانات.
نحن نستخدم محولات Macbert وضبطها بشكل جيد على المهام المشتركة Rocling-2021 باستخدام بيانات CVAT و CVAS.قارنا أداء ماكبيرت مع اثنين من المحولاتين الآخرين وروبرتا في الأبعاد الإثارة، على التوالي.تم استخدام معامل ماي والارتباط (ص) كمقاييس التقييم.على مج موعة اختبار Rocling-2021، يحقق نموذج Macbert المستخدم الخاص بنا 0.611 من MAE و 0.904 من R في أبعاد التكافؤ؛و 0.938 من ماي و 0.549 من ص في البعد الإثرا.
تقدم هذه الورقة المهمة المشتركة 2021 على تحليل المشاعر الأبعاد للنصوص التعليمية التي تسعى إلى تحديد درجة المعنويات ذات القيمة الحقيقية لتعليقات التقييم الذاتي كتبها الطلاب الصينيين في كل من التكافؤ والأبعاد الإثراية.يمثل Valence درجة المشاعر اللطيفة وغير السارة (أو الإيجابية والسلبية)، وتمثل الإثريات درجة الإثارة والهدوء.من بين 7 فرق مسجلة لهذه المهمة المشتركة لتحليل المعنويات ثنائي الأبعاد، 6 نتائج مقدمة.نتوقع أن تنتج حملة التقييم هذه تقنيات تحليل المعنويات الأبعاد أكثر تقدما للمجال التعليمي.يتم إجراء جميع مجموعات البيانات مع معايير الذهب وتسجيل البرنامج النصي متاحا للباحثين.
يهدف هذا التقرير الفني إلى المهمة المشتركة في Rocling 2021: تحليل المعنويات الأبعاد للنصوص التعليمية.من أجل التنبؤ بالحالات العاطفية للنصوص التعليمية الصينية، نقدم إطارا عمليا من خلال توظيف نماذج اللغة المدربة مسبقا، مثل بيرت و Macbert.يمكن استخلاص ا لعديد من الملاحظات والتحليلات القيمة من سلسلة من التجارب.من النتائج، نجد أن الأساليب المستندة إلى Macbert يمكن أن توفر نتائج أفضل من الأساليب القائمة على BERT على مجموعة التحقق.لذلك، نحن متوسط نتائج التنبؤ بالعديد من النماذج التي تم الحصول عليها باستخدام إعدادات مختلفة كإخراج نهائي.
الميمات هي مجموعات من النص والصور التي غالبا ما تكون روح الدعابة في الطبيعة.ولكن، قد لا يكون هذا هو الحال دائما، وقد تصور مجموعات معينة من النصوص والصور الكراهية، يشار إليها باسم الميمات البغيضة.يقدم هذا العمل خط أنابيب متعدد الوسائط يأخذ كل من الميز ات المرئية والنصية من الميمات إلى (1) تحديد الفئة المحمية (على سبيل المثال، الجنس، الجنس وما إلى ذلك) التي هاجمت؛و (2) اكتشاف نوع الهجوم (E.G. ازدراء، Slurs وما إلى ذلك).يستخدم خط أنابيبنا تمثيلا مرئيا ومرئيا تدريبا مسبقا مسبقا، متبوعا بتصنيف الانحدار اللوجستي البسيط.نحن نوظف خط أنابيبنا على مجموعة بيانات تحدي الميمات البغيضة مع ملصقات إضافية تم إنشاؤها حديثا عن الفئة المحمية ونوع الهجوم.يحقق أفضل نموذج لدينا AUROC من 0.96 لتحديد الفئة المحمية، و 0.97 للكشف عن نوع الهجوم.نطلق سرد علاماتنا في https://github.com/harisbinzia/hatefulmemes
أصبحت نماذج اللغة متعددة اللغات المدربة مسبقا كتلة مبنى مهمة في معالجة اللغة الطبيعية متعددة اللغات.في الورقة الحالية، نحقق في مجموعة من هذه النماذج لمعرفة مدى نقل المعرفة على مستوى الخطاب عبر اللغات.يتم ذلك بتقييم منهجي على مجموعة أوسع من مهام مستوى الخطاب مما تم تجميعه مسبقا.نجد أن عائلة XLM-Roberta من نماذج تظهر باستمرار أفضل أداء، من خلال نماذج أحادية جيدة جيدة في وقت واحد ومهينة القليل نسبيا في إعداد طلقة صفرية.تشير نتائجنا أيضا إلى أن التقطير النموذجي قد تؤذي قدرة النقل عبر اللغات من تمثيل الجملة، في حين أن الاختلاف اللغوي على الأكثر تأثير متواضع.نأمل أن يكون جناح اختبارنا، الذي يغطي 5 مهام مع ما مجموعه 22 لغة في 10 أسر متميزة، بمثابة منصة تقييم مفيدة للأداء متعدد اللغات في مستوى الجملة وما بعدها.
قد يتم تحديد الجنس النحاسي من قبل دلالات أو إجمالية أو علم الصوتيات أو يمكن أن يكون تعسفيا.تحديد الأنماط في العوامل التي تحكم نون الجنسين يمكن أن تكون مفيدة لمتعلمي اللغة، وفهم المصادر اللغوية الفطرية للتحيز بين الجنسين.قد يتم استبدال النهج اليدوية ا لقائمة على القواعد اليدوية من خلال النهج الحسابية الأكثر دقة وقابلة للتطوير ولكن أصعب من أجل تفسيرها للتنبؤ بنوع الجنس من المعلومات النموذجية.في هذا العمل، نقترح نماذج تصنيف الجنسية القابلة للتفسير للفرنسية، والتي تحصل على أفضل ما في العالمين.نقدم نهج عصبي عالية الدقة التي تعززها نهج قائم على بديل عالمي جديد لتوضيح التنبؤات.نقدم سمات مساعدة "لتوفير تعقيد تفسير الضبط.
تصنيف النص هو أداة مركزية في NLP. ومع ذلك، عندما ترتبط الفصول المستهدفة بشدة مع السمات النصية الأخرى، يمكن أن تلتقط نماذج تصنيف النصوص "ميزات" خاطئة، مما يؤدي إلى التعميم والتحيزات السيئة. في تحليل وسائل التواصل الاجتماعي، هذه المشكلة أسطح فئات المست خدمين الديموغرافية مثل اللغة أو الموضوع أو الجنس، والتي تؤثر على إنشاء نص إلى حد كبير. وقد ادعى تدريب الخصم لتخفيف هذه المشكلة، لكن التقييم الشامل مفقود. في هذه الورقة، نقوم بتجربة تصنيف النص للسمات المرتبطة بموضوع وثائق ومؤلف الجنس، باستخدام جثة متوازية متعددة اللغات متعددة اللغات من نصوص TED TALK. النتائج التي توصلنا إليها هي: (أ) يكون المصنفين الفرديين للموضوع والجنس المؤلف متحيز بالفعل؛ (ب) ديوان مع أعمال التدريب المشددي للموضوع، ولكنها تنهار المؤلف الجنس؛ (ج) تختلف نتائج ديوان الجنسين عبر اللغات. نفسر النتيجة من حيث تداخل مساحة الميزة، وتسليط الضوء على دور تحقيق السطح اللغوي للفصول المستهدفة.
تشكل بروز أجهزة اللغة التصويرية، مثل السخرية والمفارقة، تحديات خطيرة لتحليل المعنويات العربية (SA).في حين أن أعمال البحث السابقة تعامل معها واكتشاف السخرية بشكل منفصل، تقدم هذه الورقة نموذجا للتعلم العميق المتعدد للمكملات المتعددة الإنهائية (MTL)، مم ا يتيح تفاعل المعرفة بين المهامتين.تتكون بنية MTL Model الخاصة بنا من تمثيل ترميز ثنائي الاتجاه من طراز المحولات (Bert)، وحدة تفاعل انتباه متعددة المهام، واثنين من مصنفين المهامين.تظهر النتائج الإجمالية التي تم الحصول عليها أن نموذجنا المقترح تتفوق على نظرائه المهمة الواحدة و MTL على كل من المهاجمة والشعور الفرعي للكشف عن المعنويات.
الاكتشاف الساخرة ذات أهمية كبيرة في فهم المشاعر والآراء الحقيقية للناس.العديد من التقيمات عبر الإنترنت، مراجعات، تعليقات وسائل التواصل الاجتماعي، إلخ.لقد تم بالفعل إجراء العديد من الأبحاث بالفعل في هذا المجال، لكن معظم الباحثين درس تحليل الساركاز الإ نجليزي مقارنة بالبحثية تتم في تحليل السخرية العربية بسبب تحديات اللغة العربية.في هذه الورقة، نقترح نهجا جديدا لتحسين اكتشاف السخرية العربية.يتم استخدام نهجنا تكبير البيانات، وكلمة السياق، ونموذج الغابات العشوائية للحصول على أفضل النتائج.كانت دقةنا في المهمة المشتركة بشأن السخرية والكشف عن المعنويات باللغة العربية 0.5189 ل F1-Saarcastic مثل المقياس الرسمي باستخدام DataSet Arsarcasmv2 المشترك (أبو فرحة، وآخرون، 2021).
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا