اللغة العربية هي اللغة الرسمية البالغ 22 دولة، تحدث بأكثر من 400 مليون متحدث.تستخدم كل واحد من هذا البلد على الأقل لهجة محادثة الحياة اليومية.ثم، العربية لديها 22 لهجة على الأقل.يمكن كتابة كل لهجة في البرامج النصية العربية أو العربية.تركز أحدث الأبحاث على بناء نموذج لغة وجزعة تدريب لكل لهجة، في كل برنامج نصي.بعد هذه التقنية تعني إنشاء 46 موارد مختلفة (بما في ذلك اللغة العربية القياسية الحديثة، MSA) للتعامل مع لغة واحدة فقط.في هذه الورقة، استخرفنا مجموعة واحدة، ونقترح خوارزمية واحدة لإنشاء كائن تدريب واحد تلقائيا باستخدام بنية نموذج تصنيف واحد لتحليل المعنويات MSA ولهجات مختلفة.بعد مراجعة كوربوس التدريب يدويا، تتفوق النتائج التي تم الحصول عليها جميع نتائج الأدب البحثية ل Test Test Corpora.
Arabic is the official language of 22 countries, spoken by more than 400 million speakers. Each one of this country use at least on dialect for daily life conversation. Then, Arabic has at least 22 dialects. Each dialect can be written in Arabic or Arabizi Scripts. The most recent researches focus on constructing a language model and a training corpus for each dialect, in each script. Following this technique means constructing 46 different resources (by including the Modern Standard Arabic, MSA) for handling only one language. In this paper, we extract ONE corpus, and we propose ONE algorithm to automatically construct ONE training corpus using ONE classification model architecture for sentiment analysis MSA and different dialects. After manually reviewing the training corpus, the obtained results outperform all the research literature results for the targeted test corpora.
المراجع المستخدمة
https://aclanthology.org/