وقد ركز العمل الحديث على الجيل العام متعدد اللغات من AMR إلى النص بشكل حصري على استراتيجيات تكبير البيانات التي تستخدم AMR الفضي.ومع ذلك، فإن هذا يفترض جودة عالية من الأمراض العامية التي تم إنشاؤها، مما يحتمل على الحد من قابلية النقل إلى المهمة المستهدفة.في هذه الورقة، نحقق في تقنيات مختلفة لتوليد التعليقات التوضيحية AMR تلقائيا، حيث نهدف إلى دراسة مصدر المعلومات الذي ينتج عنه نتائج متعددة اللغات بشكل أفضل.نماذجنا المدربة على الذهب القديمة مع الجمل الفضية (مترجمة) الجمل تفوقت النهج التي تولدها Silver AMR.نجد أن الجمع بين كل من المصادر التكميلية للمعلومات تعمل على تحسين جيل عام عمرو متعدد اللغات.تتجاوز نماذجنا الحالة السابقة للفن الألمانية والإيطالية والإسبانية والصينية من هامش كبير.
Recent work on multilingual AMR-to-text generation has exclusively focused on data augmentation strategies that utilize silver AMR. However, this assumes a high quality of generated AMRs, potentially limiting the transferability to the target task. In this paper, we investigate different techniques for automatically generating AMR annotations, where we aim to study which source of information yields better multilingual results. Our models trained on gold AMR with silver (machine translated) sentences outperform approaches which leverage generated silver AMR. We find that combining both complementary sources of information further improves multilingual AMR-to-text generation. Our models surpass the previous state of the art for German, Italian, Spanish, and Chinese by a large margin.
المراجع المستخدمة
https://aclanthology.org/
نحن نحفز واقتراح مجموعة من التحسينات البسيطة ولكنها فعالة لتوليد مفهوم إلى نص يسمى الياقوت: تعيين تعزز وبصورة ما بعد هوك تستلزم وإعادة التركيب.نوضح فعاليتها في مجال المنطق المنطقي الإنتاجية، A.K.a. مهمة Commongen، من خلال تجارب باستخدام نماذج BART و
مقاييس التقييم التلقائية المستندة إلى المرجعية محدودة بشكل ملحوظ ل NLG بسبب عدم قدرتها على التقاط مجموعة كاملة من النواتج المحتملة.نحن ندرس بديلا للإشارة: تقييم كفاية الرسوم البيانية من جمل اللغة الإنجليزية التي تم إنشاؤها من الرسوم البيانية التمثيل
الهند هي واحدة من أغنى مراكز اللغات على الأرض وهي متنوعة للغاية وتعدد اللغات. ولكن بصرف النظر عن عدد قليل من اللغات الهندية، ما زال معظمهم يعتبرون فقراء الموارد. نظرا لأن معظم تقنيات NLP تتطلب معرفة لغوية لا يمكن تطويرها إلا من قبل الخبراء والمتحدثين
إن محول نقل النص إلى النص الأخير "'(T5) عند الاستفادة من تنسيق نصي إلى نص موحد ومقياس لتحقيق النتائج الحديثة على مجموعة واسعة من مهام NLP باللغة الإنجليزية.في هذه الورقة، نقدم MT5، وهو متغير متعدد اللغات من T5 الذي تم تدريبه مسبقا على مجموعة بيانات ج
تفتقر إلى البيانات المشروحة غير المشروح بين الإنسان هي تحدي رئيسي واحد لتحليل تمثيل المعنى التجريدي (AMR). لتخفيف هذه المشكلة، عادة ما تستخدم الأعمال السابقة البيانات الفضية أو نماذج اللغة المدربة مسبقا. على وجه الخصوص. ومع ذلك، فإنه يجعل فك تشفير أب