ترغب بنشر مسار تعليمي؟ اضغط هنا

بناء نموذج لغة محادثة مفتوحة سويدية

Building a Swedish Open-Domain Conversational Language Model

274   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقدم العمل الجاري لتقييم، لمعرفتنا، أول نموذج لغز إذن كبير تم تدريبه على التحدث باللغة السويدية، باستخدام البيانات من Flashback من مناقشة النقاش عبر الإنترنت.نقوم بإجراء دراسة تجريبية للتقييم البشري تشير إلى أن النموذج غالبا ما يكون في الغالب من الاستجابة للمحادثات بطريقة تشبه الإنسان والمعلومات، على مجموعة متنوعة من الموضوعات.في حين أن البيانات من المنتديات عبر الإنترنت يمكن أن تكون مفيدة لبناء أنظمة محادثة، فإننا نفكر في العواقب السلبية التي قد يكون لها تطبيق غير حكيم، والحاجة إلى اتخاذ تدابير فعالة لحماية ضدهم.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبح استخدام نماذج اللغة المحددة مسبقا، التي تم ضبطها بشكل جيد لأداء مهمة محددة من النهر، على نطاق واسع في NLP.ومع ذلك، قد يكون استخدام نموذج لغة عامة في المجالات المتخصصة، دون المستوى شبه الأمثل بسبب الاختلافات في استخدام اللغة والمفردات.في هذه الور قة، يتم التحقيق في ما إذا كان يمكن تحسين نموذج لغة قائم على اللغة السويدية للمجال السريري من خلال استمرار الاحتجاج بالنص السريري.يتم ضبط نماذج اللغة العامة ومجموعة من المجال بشكل جيد وتقييمها على ثلاثة مهام NLP السريرية الممثلة: (1) تحديد المعلومات الصحية المحمية، (2) تعيين رموز تشخيص ICD-10 إلى الملخصات التفريغ، و (3) عدم اليقين على مستوى الجملةتنبؤ.تظهر النتائج أن الاحيلية المستمرة على البيانات داخل المجال تؤدي إلى تحسين الأداء على جميع المهام الثلاثة المصب، مما يشير إلى وجود قيمة مضافة محتملة لنماذج اللغة الخاصة بالمجال ل NLP السريري.
تمكين أنظمة حوار المجال المفتوح لطرح أسئلة توضيحية عند الاقتضاء هو اتجاه مهم لتحسين جودة استجابة النظام.وهي، بالنسبة للحالات عندما يكون طلب المستخدم غير محددا لنظام محادثة لتوفير إجابة على الفور، فمن المستحسن طرح سؤال توضيحي لزيادة فرص استرداد إجابة مرضية.لمعالجة مشكلة توضيح الأسئلة في الحوارات المفتوحة في الحوارات ": (1) نجمع وتحرير مجموعة بيانات جديدة تركز على المحادثات المفتوحة ومتعددة الدورات، (2) نحن معيارا عدة حالاتخطوط الأساس العصبية الفن، و (3) نقترح خط أنابيب يتكون من خطوات غير متصلة بالإنترنت وعلى الإنترنت لتقييم جودة توضيح الأسئلة في حوارات مختلفة.هذه المساهمات مناسبة كمؤسسة لمزيد من البحث.
نقدم تاريخ DART، سجل بيانات منظم في المجال المفتوح إلى مجموعة بيانات جيل النص مع أكثر من 82 ألف حالة (لعبة السهام). يمكن أن تكون التعليقات التوضيحية البيانات إلى النص عملية مكلفة، خاصة عند التعامل مع الجداول التي تعد المصدر الرئيسي للبيانات المنظمة و يحتوي على هياكل غيرية. تحقيقا لهذه الغاية، نقترح إجراءات لاستخراج ثلاث مرات الدلالية من الجداول التي ترميز هياكلها من خلال استغلال التبعيات الدلالية بين رؤوس الطاولة وعنوان الجدول. اندمج إطار عمل مواد DataSet لدينا مصادر غير متجانسة بفعالية من أنظمة التحليل الدلالي المفتوح المجال والتحريغ عن طريق استخدام التقنيات بما في ذلك التوضيح التوضيحية في علم الأطباق، زوج الإجابة السؤالية إلى تحويل الجملة التصريحي، وتوحيد المسند، كل ذلك مع الحد الأدنى من التحرير بعد التحرير. نقدم التقييم المنهجي على DART بالإضافة إلى نتائج جديدة من أحدث النتائج على WebNLG 2017 لإظهار أن Dart (1) يطرح تحديات جديدة إلى مجموعات البيانات الحالية إلى النص و (2) تسهيل التعميم خارج النطاق وبعد يمكن العثور على بيانات ورمز لدينا في https://github.com/yale-lily/dart.
في هذه الورقة، نقدم دورة جديدة مفتوحة مفتوحة على الإنترنت على معالجة اللغة الطبيعية، وتستهدف الطلاب غير الإنجليزيين.تستمر الدورة 12 أسبوعا، كل أسبوع يتكون من محاضرات وجلسات عملية واعتيادات مسابقة.ثلاثة أسابيع من أصل 12 تليها الاعتمادات الترميز على غر ار Kaggle.حدة الدورة لدينا لخدمة أغراض متعددة: (ط) العائلة الطلاب مع المفاهيم الأساسية والأساليب في NLP، مثل نمذجة اللغة أو تمثيلات الكلمة أو الكلمة، (II) إظهار أن التطورات الحديثة، بما في ذلك النماذج القائمة على المحولات المدربة مسبقا، هيبناء على هذه المفاهيم؛(3) تقديم هياكنا للحصول على معظم التطبيقات الحقيقية الأكثر طلبا، (3) تطوير مهارات عملية لمعالجة النصوص بلغات متعددة.تم إعداد الدورة المسجلة وتسجيلها خلال عام 2020 وحتى الآن تلقت ردود فعل إيجابية.
نقدم في هذا العمل نموذج جديد لاكتشاف المعرفة في البيانات " SCRUM-BI " يعتمد المنهجية الرّشيقة سكروم، للمساعدة في بناء تطبيقات ذكاء الأعمال ( BI ) و التنقيب في البيانات. يتميز هذا النموذج بأنّه أكثر تكيّفاً مع التغييرات في المتطلبات و الأولويات من جه ة، و التطورات المتسارعة في بيئات العمل من جهة أخرى، كما يحسّن و يعزز عملية الحصول على المعرفة و مشاركتها، مما يسهم في دعم عملية اتخاذ القرارات الاستراتيجية. جرى اختبار و تقييم النموذج باستخدام حالة دراسيّة على قطاع شركات الاتصالات في سوريا.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا