ترغب بنشر مسار تعليمي؟ اضغط هنا

لاماد: نموذج الاهتمام اللغوي للترشف عن النص العربي

LAMAD: A Linguistic Attentional Model for Arabic Text Diacritization

649   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

باللغة العربية، يتم استخدام علامات التشكيل لتحديد المعاني وكذلك النطق.ومع ذلك، غالبا ما يتم حذف الدروع من النصوص المكتوبة، مما يزيد من عدد المعاني والنطوقتين المحتملة.هذا يؤدي إلى نص غامض ويجعل العملية الحسابية على النص غير المسموح به أكثر صعوبة.في هذه الورقة، نقترح نموذج إعماري لغوي للترشف عن النص العربي (لاماد).في لاماد، يتم تقديم تمثيل ميزة لغوية جديدة، والذي يستخدم كل من ملامح الكلمة والأحرف السياقية.بعد ذلك، يقترح آلية الاهتمام اللغوي التقاط الميزات اللغوية المهمة.بالإضافة إلى ذلك، نستكشف تأثير الميزات اللغوية المستخرجة من النص على درج النص العربي (ATD) عن طريق إدخالها لآلية الاهتمام اللغوي.توضح النتائج التجريبية الواسعة على ثلاث مجموعات بيانات بأحجام مختلفة أن لاماد تتفوق على النماذج الحالية للحالة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تكمن الشبكة العصبية الباهظة الثمنية والذاكرة الكثيفة وراء النجاح الأخير لتعلم تمثيل اللغة. نقل المعرفة، وهي تقنية رئيسية لنشر مثل هذا النموذج اللغوي الواسع في البيئات النادرة من الموارد، ينقل المعرفة المتعلقة بتمثيلات الكلمات الفردية المستفادة دون قي ود. في هذه الورقة، مستوحاة من الملاحظات الأخيرة أن تمثيلات اللغة في وضع معرفة نسبيا ولديها معرفة أكثر دلالة ككل، نقدم هدف تقطير معارف جديد لتعلم تمثيل اللغة الذي ينقل المعرفة السياقية عبر نوعين من العلاقات عبر الإنترنت: علاقة كلمة وطبقة تحول العلاقة. على عكس تقنيات التقطير الأخيرة الأخرى لنماذج اللغة، فإن تقطيرنا السياقي ليس لديه أي قيود على التغييرات المعمارية بين المعلم والطالب. نحن نقوم بالتحقق من فعالية طريقتنا حول المعايير الصعبة لمهام فهم اللغة، ليس فقط في بنية الأحجام المختلفة ولكن أيضا بالاشتراك مع Dynabert، طريقة تشذيب الحجم التكيفي المقترح مؤخرا.
تقوم المشفر المزدح المجرقة بإجراء استرجاع من خلال ترميز المستندات والاستعلامات في متجهات كثيفة منخفضة الأبعاد، حيث سجل كل وثيقة عن طريق المنتج الداخلي مع الاستعلام.نحن نبحث في قدرة هذه الهندسة المعمارية بالنسبة إلى نماذج كيس من الكلمات المتفرقة والشب كات العصبية الاهتمام.باستخدام كل من التحليلات النظرية والتجريبية، نقوم بإنشاء اتصالات بين بعد ترميز، الهامش بين الذهب والوثائق ذات المرتبة الأدنى، وطول الوثيقة، مما يشير إلى حد قيود في سعة الترميزات ذات الطول الثابت لدعم استرجاع الدقة الدقيقة للوثائق الطويلة.بناء على هذه الأفكار، نقترح نموذجا عصبا بسيطا يجمع بين كفاءة الترميز المزدوج مع بعض التعبير عن هياكل التعبير الأكثر تكلفة، واستكشاف الهجينة الكثيفة المتنارية للاستفادة من دقة الاسترجاع المتناقضة.تتفوق هذه النماذج بدائل قوية في استرجاع واسع النطاق.
مع الاستخدام المتزايد لأحكام الخوارزميات المدفوعة بالجهاز، من الأهمية بمكان تطوير النماذج القوية في المدخلات المتطورة أو التلاعب بها.نقترح تحليلا واسع النطاق من المتانة النموذجي ضد التباين اللغوي في تحديد الكشف الأخبار الخادع، وهي مهمة مهمة في سياق ا لمعلومات الخاطئة المنتشرة عبر الإنترنت.نحن نفكر في مهام التنبؤ ومقارنة ثلاثة من المدينات الحديثة لتسليط الضوء على الاتجاهات المتسقة في الأداء النموذجي، وتظليل الثقة العالي، والإخفاقات عالية التأثير.من خلال قياس فعالية استراتيجيات الدفاع المشددي وتقييم الحساسية النموذجية للهجمات الخصومة باستخدام نص غير مضطرب للشخصية، نجد أن الطابع أو النماذج المختلطة هي الدفاعات الأكثر فعالية وأن تكتيكات الهجوم القائم على الاضطرابات الأكثر نجاحا.
أثبتت نماذج اللغة أنها مفيدة للغاية عند تكييفها مع مجالات محددة.ومع ذلك، تم إجراء القليل من الأبحاث على تكيف نماذج بيرت الخاصة بالمجال في اللغة الفرنسية.في هذه الورقة، نركز على إنشاء نموذج لغة تتكيف مع النص القانوني الفرنسي بهدف مساعدة محترفي القانون .نستنتج أن بعض المهام المحددة لا تستفيد من نماذج اللغة العامة المدربة مسبقا على كميات كبيرة من البيانات.نستكشف استخدام الهندسة الصغيرة في اللغات الفرعية الخاصة بالمجال ومزاياها للنص القانوني الفرنسي.نثبت أن النماذج المحددة مسبقا للمجال يمكن أن تؤدي أفضل من تلك المعادلة المكافئة في المجال القانوني.أخيرا، نطلق سراح جوريبارت، مجموعة جديدة من نماذج بيرت تتكيف مع المجال القانوني الفرنسي.
وقد لوحظت مفارقة خسارة التعقيد، التي توضح أن الأفراد الذين يعانون من الأمراض من مرض ديناميات سلوكية يمكن التنبؤ بها بشكل مدهش، وقد لوحظ في مجموعة متنوعة من النظم الفسيولوجية البشرية والحيوانية. يعرض ظهور العلاج المستند عبر الإنترنت حديثا فرصة جديدة ل تحليل مفارقة فقدان التعقيد في التشغيل الجديد: فقدان التعقيد اللغوي في محادثات العلاج بالنصوص. في هذه الورقة، نقوم بتحليل التعقيد اللغوي يرتبط بالصحة العقلية في رسائل العلاج عبر الإنترنت المرسلة بين المعالجين و 7170 عملاء قدموا 30،437 ردود للمسح المقابلة على قلقهم. وجدنا أنه عندما أبلغ العملاء المزيد من القلق، أظهروا انخفاض التنوع المعجمي على النحو الذي يقدر بمتوسط ​​نسبة TECE-TECEN المتوسطة. يستخدم المعالجون، من ناحية أخرى، لغة صعوبة في القراءة، التعقيد النحوي، وعمر الاستحواذ عندما كان العملاء أكثر قلقا. أخيرا، وجدنا أن العملاء، وإلى حد كبير، المعالجين، عرضوا مستويات متسقة من العديد من تدابير التعقيد اللغوي. توضح هذه النتائج كيفية الاستفادة من التحليل اللغوي للاتصالات القائمة على النص كعلامة للقلق، وهو احتمال مثير في وقت زيادة الاتصال عبر الإنترنت وزيادة قضايا الصحة العقلية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا