يمكن أن تولد الأساليب الحديثة القائمة على المحولات إلى NLG مثل GPT-2 إنشاء نصوص أصلية متماسكة بشكل ملائم.ومع ذلك، فإن هذه النصوص التي تم إنشاؤها لها عيوب خطيرة: خطاب عالمي يتعارض مع الجمل من حيث قيم الكيان.نحن نتناول كل من هذه العيوب: أنها مستقلة ولكن يمكن دمجها لتوليد النصوص الأصلية التي ستكون متسقة وصادقة.تقدم هذه الورقة نهجا لتقدير جودة هيكل الخطاب.تؤكد النتائج التجريبية أن هيكل الخطاب للنصوص التي تم إنشاؤها حاليا غير دقيق.نقترح اتجاهات البحث لتصحيحه باستخدام ميزات الخطاب أثناء إجراء ضبط الدقيقة.النهج المقترح عالمي ويمكن تطبيقه على لغات مختلفة.بصرف النظر عن ذلك، نقترح طريقة لتصحيح قيم الكيان الخاطئة استنادا إلى تعدين الويب ومحاذاة النص.
Recent transformer-based approaches to NLG like GPT-2 can generate syntactically coherent original texts. However, these generated texts have serious flaws: global discourse incoherence and meaninglessness of sentences in terms of entity values. We address both of these flaws: they are independent but can be combined to generate original texts that will be both consistent and truthful. This paper presents an approach to estimate the quality of discourse structure. Empirical results confirm that the discourse structure of currently generated texts is inaccurate. We propose the research directions to correct it using discourse features during the fine-tuning procedure. The suggested approach is universal and can be applied to different languages. Apart from that, we suggest a method to correct wrong entity values based on Web Mining and text alignment.
المراجع المستخدمة
https://aclanthology.org/
وصف نهجنا لمهمة Semeval-2021 6 على اكتشاف تقنيات الإقناع في محتوى متعدد الوسائط (الميمات).يجمع نظامنا بين النماذج المتعددة مسبقا (مقطع) والصفوف المصنفة.أيضا، نقترح إثراء البيانات من خلال تقنية تكبير البيانات.يحقق التقديم لدينا رتبة 8/16 من حيث F1-Micro و 9/16 مع F1-Macro في مجموعة الاختبار.
هدفت هذه الدراسة إلى استقصاء الخصائص البلاغية الرئيسة في خطاب
الصحافة العربية. و لذلك اِختُبِرِت مقتطفات من صحيفتين أردنيتين من الصحف
المشهورة في الأردن و حلَِّلت هذه النصوص و عولِجتْ. تبين نتائج هذه الدراسة أن
إحدى الخصائص لهذا النوع من الخطاب هو
من المعروف أن حساسية النماذج العميقة العصبية لضوضاء الإدخال مشكلة صعبة.في NLP، يتدهور أداء النموذج غالبا مع الضوضاء التي تحدث بشكل طبيعي، مثل الأخطاء الإملائية.لتخفيف هذه المشكلة، قد تستفيد النماذج البيانات الوكيل بشكل مصطنع.ومع ذلك، تم تحديد كمية ون
تصف هذه الورقة نهجنا (IITH) لمهمة Semeval-2021 5: hahackathon: الكشف عن الفكاهة والجريمة.تركز نتائجنا على هدفين رئيسيين: (1) تأثير الاحتجاج في تكيف المهمة على أداء النماذج القائمة على المحولات (II) كيف يتميز ميزات المعجمية والمؤثرية في تحديد الفكاهة
ازدادت أهمية خدمات الويب Web Services بعد ظهور الحوسبة السحابية Cloud Computing و انتشار الحوسبة خدمية التوجه Service Oriented Computing ( SOC ) التي غيرت طريقة تطوير البرمجيات. بسبب التطور الكبير الحاصل في هذا المجال أصبح من الصعب على المستخدمين ال