ترغب بنشر مسار تعليمي؟ اضغط هنا

تحويل اللمعان متعدد الطبقات إلى أشكال دلالية وبراجمية مع جنل

Converting Multilayer Glosses into Semantic and Pragmatic forms with GENLIS

349   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقدم هذه الورقة العمل نفذت لتحويل اللمعان في لغة الإشارة الإيطالية (LIS) إلى نص ثم يقرأه بعد ذلك بواسطة Windows TTS Synthesizer من إصدار تعديل SSML من نفس النص. في حين أن العديد من الأنظمة موجودة تولد لغة الإشارة من نص، قررنا القيام بعملية عكسية وإنشاء نص من LIS. لهذا الغرض، استخدمنا نسخة من القبلات السلحفاة والأرنب، الموقعة والمتاحة على YouTube by Alba Cooperativa Sociale، التي تم تفاحها يدويا من قبل المؤلف الثاني لأطروحة سيدها. من أجل تحقيق هدفنا، قامنا بتحويل المصطلحات متعددة الطبقات إلى شروط ProLolog الخطية التي ستغذيها للمولد. في الورقة نركز على المشكلات الرئيسية التي واجهتها في تحويل اللمعان إلى تمثيل متسق من الناحية الدلوية والبرادة. الناجمة عن المشاكل الرئيسية بسبب تعقيد نص مثل الخرافة التي تتطلب تنفيذ آليات Aquerence و Action الكلام في التمثيل والتي غالبا ما تكون غير مسبوقة وتشكل معلومات ضمنية.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في هذه الورقة، وصفنا عملية تطوير مخطط التوضيح الدلالي متعدد الطبقات مصممة لاستخراج المعلومات من كائنات إلكترونية أوروبية من المقالات الإخبارية، على ثلاثة مستويات، الوصم المرجعي المرجعي والدلي.الجدة من هذا المخطط هو تنسيق الأجزاء 1 و 4 و 9 من إدارة ال موارد اللغوية ISO 24617 - إطار التوضيح الدلالي.يتضمن هذا الإطار التوضيحي مجموعة من هياكل الكيان (المشاركين والأحداث والأوقات) ومجموعة من الروابط (الأدوار الزمنية وجائنة والتبعية والأدوار الموضوعية والدلية) مع العديد من العلامات والقيم السمة التي تضمن التمثيل الدلالي والبصر المناسب للقصص الإخبارية.
نقوم بتطبيق إضفاء الطابع الرسمي على الاستدلال الطبيعي الذي يشبه المنطق الطبيعي باستخدام أشكال منطقية غير مستقرة غير مستقرة (ULFS) بواسطة كيم وآخرون.(2020).نوضح قدرة هذا النظام على التعامل مع مجموعة متنوعة من الظواهر الدلالية الصعبة باستخدام DataSet F racas (Cooper et al.، 1996).تعطي هذه النتائج أدلة تجريبية للمطالبات السابقة أن ULF هو تمثيل مناسب للتوسط في استنتاجات من المنطق الطبيعي.
نماذج العصبية المدربة لتوليد الكلام المقبل في مهمة الحوار تعلم تحاكي تسلسلات N-Gram في التدريب المحدد بأهداف التدريب مثل احتمال السجل السلبي (NLL) أو Cross-Enterpy. هذه الأهداف التدريبية الشائعة الاستخدام لا تعزز تحقيق ردود بديلة إلى سياق. ولكن، فإن آثار التقليل من هدف تدريب بديل يعزز نموذجا لتوليد استجابة بديلة وسجله على التشابه الدلالي لم يتم دراسة جيد. نحن نفترض أن نموذج توليد اللغة يمكن أن يتحسن على تنوعه من خلال التعلم لتوليد نص بديل أثناء التدريب وتقليل الخسارة الدلالية كهدف إضافي. نستكشف هذه الفكرة على مجموعتي بيانات مختلفة الحجم في مهمة توليد الكلام التالي في الحوارات الموجهة نحو الأهداف. نجعل ملاحظتين (1) تقلل من تنوع تحسن من الهدف الدلالي في الردود في مجموعة البيانات الأصغر (الإطارات) ولكن فقط جيدة مثل تقليل NLL في مجموعة البيانات الأكبر (MultiWoz) (2) أكثر فائدة كهدف فقدان الدلالي من كهيئة لمضادات الرمز المميز.
تم استكشاف نقل النمط على نطاق واسع في توليد اللغة الطبيعية مع استخراج Corpus غير الموازي بشكل مباشر أو غير مباشر فكرة من النمط من مصدر المجال المصدر والمستهدف. يعد القصور المشترك للنهج القائمة شرط التعليقات التوضيحية المشتركة في جميع الأبعاد الأسلوبي ة قيد النظر. يوفر توفر مجموعة البيانات هذه عبر مزيج من الأساليب من امتداد هذه الإعدادات إلى أبعاد أسلوب متعددة. في حين أن النماذج المتتالية الأبعاد المتتالية عبر أنماط متعددة هي احتمال، فإنه يعاني من خسارة المحتوى، خاصة عندما لا تكون أبعاد النمط مستقلة تماما عن بعضها البعض. في عملنا، نترخى هذا الشرط للبيانات المشروح بشكل مشترك عبر أنماط متعددة باستخدام البيانات المكتسبة بشكل مستقل عبر أبعاد نمط مختلفة دون أي شروح إضافية. نقوم بتهيئة إعداد برنامج فك تشفير التشفير مع طراز اللغة المستندة إلى المحول المدرب مسبقا على كائن عام وتعزيز قدرته على إعادة كتابة الأبعاد ذات الأرقام المستهدفة المتعددة عن طريق توظيف نماذج لغة واضحة على الطراز كتمييز. من خلال التقييم الكمي والنوعي، نعرض قدرة نموذجنا على التحكم في الأساليب عبر أبعاد أسلوب متعددة مع الحفاظ على محتوى نص الإدخال. قارنناها مع خطوط الأساس التي تنطوي على نماذج نقل أسلوب UNI-VIDELAL لحكام أحادي الأبعاد.
معظم أساليب تلخيص المستندات النسخة الاستخراجية الحالية (MDS) تسجل كل جملة بشكل فردي واستخراج الجمل الباردة واحدا تلو الآخر لتكوين ملخص، ولديه عاطفي رئيسيين: (1) إهمال العلاقات داخل الوثائق بين الجمل؛ (2) إهمال التماسك وجواء الملخص بأكمله. في هذه الور قة، نقترح إطار عمل MDS الرواية (SGSUM) لصياغة مهمة MDS كأداة اختيار Sub-Graph، حيث تعتبر المستندات المصدر بيانيا العلاقة من الجمل (على سبيل المثال، الرسم البياني التشابه أو الرسم البياني الخطابي) والمرشح الملخصات هي الرسوم البيانية الفرعية لها. بدلا من اختيار الجمل البارزة، حدد SGSUM رسم بياني فرعي بارز من الرسم البياني العلاقة كملخص. مقارنة بالطرق التقليدية، فإن طريقةنا لها مزايا رئيسية: (1) يتم التقاط العلاقات بين الأحكام من خلال نمذجة كل من هيكل الرسم البياني لمجموعة الوثيقة بأكملها والرسوم البيانية الفرعية المرشحة؛ (2) يخرج مباشرة ملخصا دمج في شكل رسم بياني فرعي وهو أكثر إفادة وتماسك. تظهر تجارب واسعة على مجموعات بيانات متعددة الوظائف و DUC أن أسلوبنا المقترح يجلب تحسينات كبيرة على العديد من خطوط الأساس القوية. توضح نتائج التقييم البشري أيضا أن طرازنا يمكن أن ينتج ملخصات أكثر متماسكا وكفاحيا مقارنة بطرق MDS التقليدية. علاوة على ذلك، فإن الهندسة المعمارية المقترحة لديها قدرة نقل قوية من إدخال واحد إلى متعدد الوثائق، والتي يمكن أن تقلل من عنق الزجاجة في مهام MDS.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا