ترغب بنشر مسار تعليمي؟ اضغط هنا

frenlys: أداة لتبسيط التلقائي لنصوص اللغة الفرنسية

FrenLyS: A Tool for the Automatic Simplification of French General Language Texts

193   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يهدف التبسيط المعجمي (LS) إلى استبدال الكلمات التي تعتبر مجمعا في جملة من قبل معادلات أبسط.في هذه الورقة، نقدم أول خدمة LS أوتوماتيكية للفرنسية، والحصوية، والتي تقدم تقنيات مختلفة لتوليد واختيار ودائل الرتبة.تصف الورقة الطرق المختلفة التي اقترحتها أداةنا، والتي تشمل كلتا الأساليب الكلاسيكية (مثل توليد المرشحين من الموارد المعجمية، ومرشح التردد، وما إلى ذلك) ونهج أكثر ابتكارا مثل استغلال كاممبرت، وهو نموذج للفرنسية القائمة على روبرتاهندسة معمارية.لتقييم الطرق المختلفة، يتم تقديم مجموعة بيانات تقييم جديدة للفرنسية.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نقدم Bertweetfr، أول نموذج لغوي مدرب مسبقا على نطاق واسع للتغريدات الفرنسية.يتم تهيئ نموذجنا باستخدام نموذج اللغة الفرنسية المجال للمجال Camembert الذي يتبع بنية Base Bert.تظهر التجارب أن Bertweetfr Outperforms جميع نماذج اللغة الفرنسية العامة في الم جال السابق على اثنين من مهام Twitter Twitter من Twitter من تحديد الاجثافية التعرف على الكيان المسمى.تم إنشاء DataSet المستخدمة في مهمة كشف الاجزاسية أولا وشروحة من قبل فريقنا، وملء فجوة هذه البيانات التحليلية في الفرنسية.نجعل نموذجنا متاحا علنا في مكتبة المحولات بهدف تعزيز البحث في المستقبل في المهام التحليلية للتغريدات الفرنسية.
السجلات غير الرسمية والمحايدة واللغة الرسمية ملموسة للغاية في إنتاج خطاب.ومع ذلك، ما زالوا مدروسين بشكل سيئ في معالجة اللغة الطبيعية (NLP)، وخاصة خارج اللغة الإنجليزية، ولأنواع نصية جديدة مثل التغريدات.لتحفيز البحث، تقدم هذه الورقة كجن كبير قدره 228، 505 تغريدات فرنسية (6M كلمات) مشروح في سجلات اللغة.يتم توفير التسميات من قبل مصنف كاممبرت متعدد الملصقات المدربة وتحقق من مجموعة فرعية مشروحة يدويا من Corpus، في حين يتم تحديد التغريدات لتجنب التحيزات غير المرغوب فيها.بناء على Corpus، يتم توفير تحليل أولي للسمات اللغوية من النحاذج البشرية أو الاستخراج التلقائي لوصف Corpus وتمهيد الطريق لمكاميات NLP المختلفة.تتوفر Corpus، دليل التوضيحية والتصنيف على http://tremolo.irisa.fr.
تصبح الصحة العقلية أكثر اهتماما مؤخرا مؤخرا، والاكتئاب كونه مرض شائع جدا في الوقت الحاضر، ولكن أيضا اضطرابات أخرى مثل القلق أو الاضطرابات القهرية الهوس أو اضطرابات التغذية أو اضطرابات نقص الانتباه / اضطرابات نقص الانتباه / فرط النشاط. توفر كمية كبيرة من البيانات من وسائل التواصل الاجتماعي والسلف الحديث لنماذج التعلم العميق وسيلة قيمة للكشف عن الاضطرابات النفسية تلقائيا من نص عادي. في هذه المقالة، نقوم بتجربة أساليب حديثة في مجموعة بيانات الصحة العقلية SMHD من Reddit (كوهان وآخرون، 2018). مساهمتنا ثلاثة أضعاف: استخدام مجموعة بيانات تتكون من المزيد من الأمراض أكثر من معظم الدراسات، مع التركيز على النص العام بدلا من مجموعات دعم الصحة العقلية والتصنيف من قبل الوظائف بدلا من الأفراد أو المجموعات. بالنسبة للتصنيف التلقائي للأمراض، فإننا نوظف ثلاث نماذج تعليمية عميقة: بيرت روبرتا و XLNet. نحن مضاعفة خط الأساس الذي أنشأه كوهان وآخرون. (2018)، على عينة فقط من مجموعة البيانات الخاصة بهم. نحن نحسن النتائج التي حصلت عليها جيانغ وآخرون. (2020) على تصنيف ما بعد المستوى. إن الدقة التي حصلت عليها مصنف اضطراب الأكل هو أعلى نظرا للوجود الحامل للمناقشات المتعلقة بالسعرات الحرارية والوجبات الغذائية والوصفات وما إلى ذلك، في حين أن الاكتئاب كان لديه أدنى درجة F1، ربما لأن الاكتئاب أكثر صعوبة في تحديد الأفعال اللغوية.
لبناء أنظمة التبسيط الآلي، وهي كورسا من الجمل المعقدة وإصداراتها المبسطة هي الخطوة الأولى لفهم تعقيد الجملة وتمكين تطوير أنظمة تبسيط النص التلقائي.نقدم مجموعة تبسيط الأردية المعجمية والمبسلة بموجبها بتحليل مفصل لعمليات التبسيط المختلفة والتقييم البشر ي لجودة Corpus.لدينا أيضا تحليل شريونا باستخدام تدابير قابلية لقراءة النص وتقديم مقارنة بين الشركات الأصلية المعجمية والمبسطة بسيطة ومبسرة.بالإضافة إلى ذلك، قارنا كوربوس لدينا مع شركة تبسيط موجودة أخرى من خلال بناء أنظمة تبسيط وتقييم هذه الأنظمة باستخدام درجات بلو وسري.يحقق نظامنا أعلى درجة بلو ونتيجة ساري مقارنة بالمقارنة مع الأنظمة الأخرى.ونحن نطلق سرورا تبسيطنا لصالح مجتمع البحث.
لا يتوقف المدرس عن إعطاء تعليمات و صياغة أسئلة لطلابه الذين يتوجب عليهم تطبيقها أو الإجابة عليها, إلا أن هذه التعليمات أو الأسئلة قد لا يتم تطبيقها أو الإجابة عنها بشكل دقيق، و يتكرر الوضع في حل التمارين أو في مواضيع الامتحان. إن تالتوجيها أو السؤال يطرحان صعوبات كثيرة تتعلق بصياغتهما من قبل المدرس أو من قبل مؤلفي الكتاب إضافة إلى الصعوبات التي يعاني منها الطالب في فهمهما. إن صياغة التوجيهات أو السؤال تتطلب جهداً كبيراً و انتباهاً و مهارات خاصة يجب أن يتمتع بها من يصوغهما، إذ أن التطبيق الصحيح و الإجابة الصحيحة تتعلق بشكل مباشر بالصياغة السليمة للتوجيهات أو السؤال.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا