ترغب بنشر مسار تعليمي؟ اضغط هنا

التحليل الأول من الصفر

RST Parsing from Scratch

348   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم رواية من أعلى إلى أسفل صياغة نهاية إلى نهاية لخطاب مستوى الوثيقة في إطار نظرية الهيكل البوليكي (RST).في هذه الصياغة، نحن نفكر في تحليل الخطاب كتسلسل لتقسيم القرارات في حدود الرمز المميز واستخدام شبكة SEQ2SEQ لنموذج قرارات تقسيم.يسهل إطار عملنا تخليل الخطاب من نقطة الصفر دون الحاجة إلى تجزئة خطاب كشرط مسبق؛بدلا من ذلك، فإنه يسبب تجزئة كجزء من عملية التحليل.يعتمد نموذج التحليل الموحد لدينا بحث شعاع لفك تشفير أفضل هيكل الأشجار من خلال البحث من خلال مساحة من أشجار التسجيل العالية.مع تجارب واسعة على TreeBank Standard RST TreeBank، نوضح أن محللنا يتفوقون على الأساليب الموجودة بتهامش جيد في كل من التحليلات المتنامية والتحليل مع تجزئة الذهب.والأهم من ذلك، فإنه يفعل ذلك دون استخدام أي ميزات يدوية، مما يجعلها أسرع ويمكن تكيفها بسهولة مع لغات جديدة ومجالات.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يهدف مشروع Multitrainmt Erasmus + + إلى تطوير منهج مبتكر مفتوح في الترجمة الآلية العصبية (NMT) للمتعلمين اللغوي والمترجمين كمواطنين متعدد اللغات.ينظر إلى الترجمة الآلية كمورد يمكن أن يدعم المواطنين في محاولتهم للحصول على المهارات اللغوية وتطويرها إذا تم تدريبهم بطريقة مستنيرة وحاسمة.وبالتالي يمكن أن تساعد الترجمة الآلية في معالجة عدم التطابق بين الاتحاد الأوروبي المطلوب من وجود مواطنين متعدد اللغات الذين يتحدثان لغتين أجنبية على الأقل والوضع الحالي الذي يسقط المواطنون بشكل عام هذا الهدف عموما.تتكون المواد التدريبية من كتاب سيارات مفتوح، وهو تطبيق ويب مفتوح المصدر يسمى Mutnmt لأغراض التدريب، والأنشطة المقابلة.
تستند معظم طرق تحليل البنية الخطابية السابقة (RST) إلى التعلم الخاضع للإشراف مثل الشبكات العصبية، والتي تتطلب وجعة مشروح من الحجم والجودة الكافية. ومع ذلك، فإن Treebank Treebank RST RST (RST-DT)، والجورباس القياسي للحل الصادر باللغة الإنجليزية، وهو ص غير بسبب التعليق التوضيحي بشكل مكلف للأشجار الأولى. عدم وجود بيانات تدريبية كبيرة مشروحة تسبب أداء ضعيف خاصة في العلامات المتعلقة بالعلامات. لذلك، نقترح طريقة لتحسين نماذج التحليل العصبي RST من خلال استغلال البيانات الفضية، أي البيانات المشروحة تلقائيا. نقوم بإنشاء بيانات فضية واسعة النطاق من Corpus غير المستمر باستخدام محلل دائري للحكومة الأولى. للحصول على بيانات فضية عالية الجودة، نستخلص من الاتفاقية من الأشجار الأولى للوثائق التي تم بناؤها باستخدام المحللين RST. بعد ذلك، قم بتدريب المحلل الوراثي العصبي مع البيانات الفضية التي تم الحصول عليها وضبطها بشكل جيد على RST-DT. تظهر النتائج التجريبية أن طريقتنا حققت أفضل درجات Micro-F1 للأرضيات القومية والعلاقة عند 75.0 و 63.2 على التوالي. علاوة على ذلك، حصلنا على مكاسب ملحوظة في درجة العلاقة، 3.0 نقطة، ضد المحللين السابقين من الحديثة.
تهدف التحليل الدلالي إلى ترجمة كلام اللغة الطبيعية (NL) على البرامج القابلة للتفسير بالآلة، والتي يمكن تنفيذها مقابل بيئة عالمية حقيقية. منذ فترة طويلة تم الاعتراف بالشروح باهظة الثمن لأزواج برنامج الكلام كعقوبة رئيسية لنشر النماذج العصبية المعاصرة ل تطبيقات الحياة الحقيقية. في هذا العمل، نركز على مهمة التعلم شبه الإشراف حيث يتوفر كمية محدودة من البيانات المشروحة مع العديد من الكلمات غير المستقرة غير المسبقة. بناء على الملاحظة التي يجب أن تكون البرامج التي تتوافق مع الكلام NL قابلة للتنفيذ دائما، نقترح تشجيع المحلل المحلل لتوليد برامج قابلة للتنفيذ للكلمات غير المسبقة. نظرا لمسافة البحث الكبير للبرامج القابلة للتنفيذ، والأساليب التقليدية التي تستخدم شعاع البحث عن التقريب، مثل التدريب الذاتي والتدريب الهامشي الأعلى، لا تؤدي كذلك. بدلا من ذلك، نقترح مجموعة من أهداف التدريب الجديدة المستمدة من خلال الاقتراب من مشكلة التعلم من عمليات الإعدام من منظور التنظيم الخلفي. أهدافنا الجديدة تفوق الطرق التقليدية في الليلة الماضية والجيوقي، سد الفجوة بين التعليم شبه الإشرافه والإشراف.
أدى توفر Corpora إلى تقدم كبير في تدريب المحللين الدلاليين باللغة الإنجليزية.لسوء الحظ، لغات أخرى غير اللغة الإنجليزية، البيانات المشروحة محدودة وكذلك أداء المحللين المتقدمة.لقد أثبتت نماذج متعددة اللغات مؤخرا مفيدة للتحويل الصفر اللغوي في العديد من مهام NLP.ماذا يحتاج إلى تطبيق محلل محلل مدرب باللغة الإنجليزية إلى لغات أخرى من التحليل الدلالي الصفر اللغوي؟هل ستساعد ميزات بسيطة من اللغة المستقلة؟تحقيقا لهذه الغاية، نقوم بتجربة ستة بنية تمثيل خطوبة (DRS) المحللين الدلاليين باللغة الإنجليزية، وتعميمهم إلى الإيطالية والألمانية والهولندية، حيث لا يوجد سوى عدد قليل من الحواجز المشروحة يدويا.تظهر تجارب مكثفة أنه على الرغم من بساطته، مضيفا علاقات التبعية العالمية (UD) وعلامات نقاط البيع العالمية (UPOS) حيث تحقق ميزات نموذجية للأذرع تحسن قوي بشكل مدهش على جميع المحللين.
ركزت معظم الدراسات الحالية للاستخدام اللغوي في محتوى الوسائط الاجتماعية على الميزات اللغوية على مستوى السطح (على سبيل المثال، كلمات الوظائف وعلامات الترقيم) وجوانب المستوى الدلالي (على سبيل المثال، الموضوعات والمعنويات والعواطف) للتعليقات. لم يتم است كشاف استراتيجيات الكاتب لبناء وربط قطاعات النص على نطاق واسع على الرغم من أن هذه المعرفة من المتوقع أن تتخلص الضوء على كيفية سبب الناس في البيئات عبر الإنترنت. المساهمة في هذا الاتجاه التحليل لدراسات وسائل التواصل الاجتماعي، نبني نظام تحليل عصبي عصبي يمكن الوصول إليه علنا ​​يحلل علاقات الخطاب في تعليق عبر الإنترنت. توضح تجاربنا أن هذا النظام يحقق أداء مماثل بين جميع أنظمة التحليل العصبي العصبي. لإظهار استخدام هذه الأداة في تحليل وسائل التواصل الاجتماعي، فإننا نطبق عليه لتحديد علاقات الخطاب في تعليقات مقنعة وغير مقنعة وفحص العلاقات بين عمق شجرة الخطاب الثنائي، وعلاقات الخطاب، والإقناع المتصور للتعليقات عبر الإنترنت. يوضح عملنا إمكانية تحليل هياكل خطاب التعليقات عبر الإنترنت مع نظامنا وآثار هذه الهياكل لفهم الاتصالات عبر الإنترنت.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا