نظم توليد النص في كل مكان في تطبيقات معالجة اللغة الطبيعية.ومع ذلك، فإن تقييم هذه النظم يظل تحديا، خاصة في إعدادات متعددة اللغات.في هذه الورقة، نقترح L'Ambre - مقياس قياسي لتقييم صورة نصية مورفوسنكتاسية من النص باستخدام تحليل التبعية والقواعد المورفوسنكتانية للغة.نقدم طريقة لاستخراج القواعد المختلفة التي تحكم morphosyntax مباشرة من Temessency Treebanks.لمعالجة النواتج الصاخبة من أنظمة جيل النص، نقترح منهجية بسيطة لتدريب المحللين القويين.نظهر فعالية قيادةنا في مهمة الترجمة الآلية من خلال دراسة DIACHRONIC للنظم ترجمة إلى لغات غنية بالمظورة.
Text generation systems are ubiquitous in natural language processing applications. However, evaluation of these systems remains a challenge, especially in multilingual settings. In this paper, we propose L'AMBRE -- a metric to evaluate the morphosyntactic well-formedness of text using its dependency parse and morphosyntactic rules of the language. We present a way to automatically extract various rules governing morphosyntax directly from dependency treebanks. To tackle the noisy outputs from text generation systems, we propose a simple methodology to train robust parsers. We show the effectiveness of our metric on the task of machine translation through a diachronic study of systems translating into morphologically-rich languages.
المراجع المستخدمة
https://aclanthology.org/
من المعروف أن حساسية النماذج العميقة العصبية لضوضاء الإدخال مشكلة صعبة.في NLP، يتدهور أداء النموذج غالبا مع الضوضاء التي تحدث بشكل طبيعي، مثل الأخطاء الإملائية.لتخفيف هذه المشكلة، قد تستفيد النماذج البيانات الوكيل بشكل مصطنع.ومع ذلك، تم تحديد كمية ون
تشمل النصوص التي تم إنشاؤها من قبل المستخدم أنواعا مختلفة من الخصائص الأسلوبية، أو الضوضاء.لا تتم معالجة مثل هذه النصوص بشكل صحيح من خلال محلل مورفيم الحاليين أو نماذج اللغة القائمة على النصوص الرسمية مثل الموسوعات أو المقالات الإخبارية.في هذه الورقة
نقترح طريقة لتقييم جودة النص الذي تم إنشاؤه عن طريق طلب المقيمين لحساب الحقائق، والحساب الدقيقة، واستدعاء، F-Score، ودقة من التهم الخام.نعتقد أن هذا النهج يؤدي إلى هدف أكثر وأسهل لإعادة إنتاج التقييم.نحن نطبق هذا على مهمة تلخيص التقرير الطبي، حيث قياس الجودة الموضوعية والدقة له أهمية قصوى.
نحن نعتبر مشكلة التعلم بتبسيط النصوص الطبية. هذا مهم لأن معظم المعلومات الأكثر موثوقية وحديثة في الطب الحيوي كثيفة مع Jargon وبالتالي لا يمكن الوصول إليها عمليا للجمهور العادي. علاوة على ذلك، لا يتجاوز التبسيط اليدوي للجسم بسرعة متزايدة من الأدب الطب
من الضروري عند تصميم الأجيزة الجزئية المتحركة أن تكون ثابتة و مستقرة و ذات دعم
جيّد، لتحسين راحة المريض، و تخفيف الأذى على الدعامات السنيّة و النسج الرخوة، حيث
تمتلك الحافّة السنخيّة تأثيرًا قوياً في التخطيط للمعالجة و التفسيرات البيوالميكانيكية
ا