ترغب بنشر مسار تعليمي؟ اضغط هنا

التسجيل الظواهر الاستعلامية في الحوار الموجود

Annotating anaphoric phenomena in situated dialogue

230   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في السنوات الأخيرة، تم تطوير العديد من Corpora للحصول على مهام الرؤية واللغة.مع هذه الورقة، نعتزم بدء مناقشة حول شرح الظواهر المرجانية في حوار الموقع.نقول أنه لا يزال هناك غرفة هامة للشريعة التي تزيد من تعقيد كل من المجالات البصرية واللغوية والتي تلتقط أصناف مختلفة من السياقات الحسي والمحادثة.بالإضافة إلى ذلك، فإن نظام توضيحي غني يغطي مجموعة واسعة من الظواهر المرجانية ومتوافق مع المهمة النصية لدقة Coureference ضرورية من أجل الاستفادة القصوى من هذه الشركات.وبالتالي، هناك العديد من الأسئلة المفتوحة فيما يتعلق بصفحة الإشارة والشروح، ومدى حسابات الهوية النصية القياسية لنوع الحوار الموجود.العمل مع سورانيا على الحوار المحتمل، نقدم امتدادنا إلى مخطط التشريح في Arrau (Uryupina et al.، 2020) من أجل بدء هذه المناقشة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم صفحة التكلمة التوضيحية للتجميل الذي نستخدمه حاليا للتعليق على بعض البيانات القياسية الكمي في الأعمال الخيالية للأدب.تتميز النصوص الأدبية مجموعة متنوعة غنية في التعبير عن الكمي، بما في ذلك مجموعة واسعة من Lexemes للتعبير عن الكميات وهياكل الجملة المعقدة للتعبير عن مقيد النطاق الكمي.تتكون Tagset لدينا من سبع علامات وتغطي جميع أنواع الكميات التي تحدث باللغة الطبيعية، بما في ذلك كمية غامضة وتجميل عام.في الجزء الثاني من الورقة، نقدم أعمالنا الألمانية مع شروح عن البيانات العامة، والتي تشكل مجموعة فرعية مناسبة من البيانات القياسية.
بدأت أنظمة التلخيص المبخر مسبقا مدربة مسبقا في تحقيق أداء موثوق، ولكن عائق رئيسي أمام استخدامها في الممارسة العملية هو ميلهم لإخراج الملخصات التي لا تؤيد المدخلات وتحتوي على أخطاء واقعية. في حين تم استكشاف عدد من مجموعات البيانات المشروحة والنماذج ال إحصائية لتقييم التوظيف، إلا أنه لم يتم استكشاف صورة واضحة للأخطاء الأكثر أهمية لاستهداف أو عندما تنجح التقنيات الحالية والفشل. نستكشف كل من مصادر البيانات الاصطناعية والإنسانية ذات العلامات بين النماذج التدريبية لتحديد الأخطاء الواقعية في تلخيص، ودراسة الواقعية على مستوى الكلمة والاعتماد على مستوى الجملة. ملاحظاتنا هي ثلاثة أضعاف. أولا، تختلف الأخطاء الواقعية المعروضة بشكل كبير عبر مجموعات البيانات، والمجموعات التدريبية التي تستخدمها عادة من الأخطاء الاصطناعية البسيطة لا تعكس الأخطاء التي تم إجراؤها على مجموعات بيانات الجماعة مثل XSUM. ثانيا، توفر البيانات ذات العلامات البشرية ذات العلامات النووية ذات التوضيحية الدقيقة إشارة تدريب أكثر فعالية من التعليقات التوضيحية على مستوى الجملة أو البيانات الاصطناعية. أخيرا، نظير على أن أفضل نموذج الكشف عن الواقعين لدينا يتيح تدريب المزيد من نماذج تلخيص XSUM أكثر واقعية من خلال السماح لنا بتحديد الرموز المميزة غير الواقعية في بيانات التدريب.
تعد تسجيل الإجابة القصيرة مهمة تقييم صحة نص قصير معين كاستجابة للسؤال الذي يمكن أن يأتي من مجموعة متنوعة من السيناريوهات التعليمية.كما هو المحتوى الوحيد، وليس النموذج، أمر مهم، يجب ألا يهم الصياغة الدقيقة بما في ذلك صريح الإجابة.ومع ذلك، فإن العديد م ن نماذج التسجيل الحديثة تعتمد بشدة على المعلومات المعجمية، سواء كانت تضمين كلمة في شبكة عصبية أو غرام N في SVM.وبالتالي، فإن الصياغة الدقيقة للإجابة قد تحدث فرقا كبيرا.لذلك نحن نحدد إلى أي مدى تحدث ظاهرة اللغة الضمنية في مجموعات بيانات الإجابة القصيرة وفحص التأثير لديهم على أداء التسجيل التلقائي.نجد أن مستوى الضمنية يعتمد على السؤال الفردي، وأن بعض الظواهر متكررة للغاية.حل الصياغة الضمنية للتركيز الصريح تميل بالفعل إلى تحسين أداء التسجيل التلقائي.
قدم البحث صورة عن حياة الأخطل التغلبي و عن نشأته و قبيلته و شعره و منزلته بين شعراء عصره , و آراء النقاد و اللغويين و النحاة في شعره . كما درس أكثر الظواهر اللغوية و النحوية بروزا في شعره , و قد تمثل ذلك في الظواهر الآتية : ظاهرة الإغراب , و قد جرى ا لكلام فيها على معنى الإغراب و أنواعه و ما استخلص من شعره من شواهد مناسبة تؤيد هذه الظاهرة , و منه ظاهرة الضرورة , و قد درس فيها معنى الضرورة و أنواعها ثم عرض ما جاء من أنواعها في شعر الأخطل , و قدم الشواهد المناسبة , و منه ظاهرة الحذف , و فيه عرض البحث أنواعه و آراء النحاة فيه و أشكاله الملحوظة في شعر الأخطل , و قدم نموذجا لكل شكل من أشكاله , كما تناول ظاهرة التقديم و التأخير , و الغرض الرئيسي منه , و آراء النحاة فيه , و قدم نموذجا لكل شكل من أشكاله في شعر الأخطل , أما الخاتمة فقد عرضت أهم ما توصل إليه من نتائج .
يتم تدريب أنظمة توليد البيانات إلى النص على مجموعات البيانات الكبيرة، مثل Webnlg أو RO-Towire أو E2E أو DART. ما وراء مقاييس تقييم الرمز المميز التقليدي (بلو أو نيزك)، فإن القلق الرئيسي الذي يواجهه المولدات الأخيرة هو السيطرة على واقعية النص الذي تم إنشاؤه فيما يتعلق بمواصفات بيانات الإدخال. نبلغ عن تجربتنا عند تطوير نظام تقييم واقعي للوصول التوظيف لتوليد البيانات إلى النص الذي نختبره على بيانات Webnlg و E2E. نحن نهدف إلى إعداد بيانات ذهبية تفوحية يدويا لتحديد الحالات التي ينقل فيها النص معلومات أكثر مما يبرره على أساس البيانات قيد التشغيل (إضافي) أو فشل في توصيل البيانات التي تعد جزءا من الإدخال (مفقود). أثناء تحليل العينات المرجعية (البيانات والنص)، واجهنا مجموعة من عدم اليقين المنهجي المرتبط بالحالات المتعلقة بالظواهر الضمنية في النص، وطبيعة المعرفة غير اللغوية نتوقع أن نشارك عند تقييم الواقعية. ونحن نستمد من خبرتنا مجموعة من المبادئ التوجيهية التقييم للوصول إلى اتفاق مرتفع فيما يتعلق بالمعقيقات بشأن هذه الحالات.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا