تلقت الأساليب القائمة على القاموس في تحليل المعنويات الاهتمام العلمي مؤخرا، وأكثر الأمثلة الشاملة التي يمكن العثور عليها باللغة الإنجليزية. ومع ذلك، فإن العديد من اللغات الأخرى تفتقر إلى قواميس القطبية، أو تلك الموجودة صغيرة الحجم كما في حالة SentiTurknet، أول وفقط القطبية القاسم في التركية. وبالتالي، تهدف هذه الدراسة إلى تمديد محتوى SentiTurknet من خلال مقارنة الكلامين المتاحين في التركية، وهي Kenet و TR-Wordnet من Balkanet. تحقيقا لهذه الغاية، تم إنشاء قاموس الأسقفية التركية الحالية بالاعتماد على 76825 متلازمة مطابقة Kenet، حيث تم تفاح كل Synset مع ثلاث ملصقات قطبية، وهي إيجابية وسلبية ومحايدة. وفي الوقت نفسه، كشفت مقارنة Kenet و Tr-Wordnet of Balkanet عن نقاط الضعف الخاصة بهم مثل تكرار نفس الحواس، ونقص الدمج اللازم للعناصر التي تنتمي إلى نفس المكامنة ووجود إصدارات أضيق زائدة من التزامن، والتي تتم مناقشتها في ضوء إمكاناتهم لتحسين قواعد البيانات المعجمية الحالية التركية.
Dictionary-based methods in sentiment analysis have received scholarly attention recently, the most comprehensive examples of which can be found in English. However, many other languages lack polarity dictionaries, or the existing ones are small in size as in the case of SentiTurkNet, the first and only polarity dictionary in Turkish. Thus, this study aims to extend the content of SentiTurkNet by comparing the two available WordNets in Turkish, namely KeNet and TR-wordnet of BalkaNet. To this end, a current Turkish polarity dictionary has been created relying on 76,825 synsets matching KeNet, where each synset has been annotated with three polarity labels, which are positive, negative and neutral. Meanwhile, the comparison of KeNet and TR-wordnet of BalkaNet has revealed their weaknesses such as the repetition of the same senses, lack of necessary merges of the items belonging to the same synset and the presence of redundant narrower versions of synsets, which are discussed in light of their potential to the improvement of the current lexical databases of Turkish.
المراجع المستخدمة