Do you want to publish a course? Click here

Text-to-Phonemes in Arabic

تحويل النصوص العربية من رموز كتابية

3107   0   54   0 ( 0 )
 Publication date 2003
and research's language is العربية
 Created by Shamra Editor




Ask ChatGPT about the research

This research is one stage of the construction of an Arabic speech synthesis system, which is “text-to-phonemes transliteration”. A complete text-to-phonemes transliteration system has been built for Arabic language. In this system we used TOPH (Orthographic-Phonetic Transcription) method, used for transliterating the French language, to perform the transliteration from text to phonemes in Arabic. We also wrote the Arabic textto- phonemes rules in TOPH formal language.


Artificial intelligence review:
Research summary
يتناول هذا البحث مرحلة من مراحل بناء نظام توليد الكلام العربي، وهي مرحلة "تحويل النصوص إلى رموز صوتية". تم بناء نظام كامل لتحويل النصوص إلى رموز صوتية للغة العربية باستخدام طريقة TOPH (التحويل الكتابي-الصوتي)، وهي طريقة مستخدمة لتحويل النصوص الفرنسية إلى رموز صوتية. كما تم كتابة قواعد تحويل النصوص العربية إلى رموز صوتية باستخدام لغة TOPH الرسمية. يقدم البحث أمثلة تطبيقية على كيفية تطبيق قواعد TOPH على اللغة العربية، مثل حذف اللام الشمسية، همزة الوصل، وحروف المد، والتقاء الساكنين. يهدف النظام إلى تحسين دقة تحويل النصوص العربية إلى رموز صوتية، مما يسهم في تطوير أنظمة توليد الكلام باللغة العربية.
Critical review
دراسة نقدية: على الرغم من أن البحث يقدم نظامًا شاملاً لتحويل النصوص العربية إلى رموز صوتية باستخدام طريقة TOPH، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، لم يتم تقديم تحليل كافٍ حول كيفية تأثير الفروق الصوتية بين اللغة الفرنسية والعربية على دقة النظام. ثانيًا، يمكن أن يكون هناك حاجة إلى مزيد من الاختبارات العملية لتقييم أداء النظام في سياقات مختلفة من النصوص العربية. أخيرًا، يمكن أن يكون هناك اهتمام أكبر بتقديم مقارنة بين نظام TOPH وأنظمة أخرى لتحويل النصوص إلى رموز صوتية في اللغة العربية لتوضيح الفوائد والعيوب النسبية لكل نظام.
Questions related to the research
  1. ما هو الهدف الرئيسي من البحث؟

    الهدف الرئيسي هو بناء نظام لتحويل النصوص العربية إلى رموز صوتية كجزء من نظام توليد الكلام العربي.

  2. ما هي الطريقة المستخدمة لتحويل النصوص إلى رموز صوتية في هذا البحث؟

    تم استخدام طريقة TOPH (التحويل الكتابي-الصوتي) لتحويل النصوص إلى رموز صوتية.

  3. ما هي بعض الأمثلة على تطبيق قواعد TOPH على اللغة العربية؟

    بعض الأمثلة تشمل حذف اللام الشمسية، همزة الوصل، وحروف المد، والتقاء الساكنين.

  4. ما هي النقاط التي يمكن تحسينها في البحث؟

    يمكن تحسين البحث من خلال تقديم تحليل كافٍ للفروق الصوتية بين الفرنسية والعربية، إجراء اختبارات عملية إضافية، وتقديم مقارنة بين نظام TOPH وأنظمة أخرى لتحويل النصوص إلى رموز صوتية.


References used
Dakkak,Ghneim ٩٩] Oumayma Aldakkak, Nada Ghneim, "Towards Man- Machine Communication in Arabic", Syria-Lebanese Conference, Damascus University
[البواب، ميرعلم، والطيان ٨٤ ] مروان البواب، يحيى ميرعلم، محمد حسان الطيان، إشراف محمد نشرة داخلية، مركز الدراسات والبحوث العلمية، دمشق، ،« الكتابة الصوتية العربية » مراياتي . سورية، ١٩٨4
rate research

Read More

In this paper, we introduce an algorithm for grouping Arabic documents for building an ontology and its words. We execute the algorithm on five ontologies using Java. We manage the documents by getting 338667 words with its weights corresponding to each ontology. The algorithm had proved its efficiency in optimizing classifiers (SVM, NB) performance, which we tested in this study, comparing with former classifiers results for Arabic language.
In our research we offer detailed study of one of the data mining functions within the text data using the object properties in databases. It studies the possibility of applying this function on the Arabic texts. We use procedural query language P L / SQL that deals with the object of Oracle databases. Data mining model Has been built. It works on classification of Arabic texts documents using SVM algorithm for indexing of texts and texts preparation, Naïve Bayes algorithm to classify data after transformation it into nested tables. So we made an evaluation of the obtained results and conclusions.
This paper presents ArOntoLearn, a Framework for Arabic Ontology learning from textual resources. Supporting Arabic language and using domain knowledge in the learning process are the main features of our framework. Besides it represents the learne d ontology in Probabilistic Ontology Model (POM), which can be translated into any knowledge representation formalism, and implements data-driven change discovery. Therefore it updates the POM according to the corpus changes only, and allows user to trace the evolution of the ontology with respect to the changes in the underlying corpus. Our framework analyses Arabic textual resources, and matches them to Arabic Lexico-syntactic patterns in order to learn new Concepts and Relations. Supporting Arabic language is not that easy task, because current linguistic analysis tools are not efficient enough to process unvocalized Arabic corpuses that rarely contain appropriate punctuation. So we tried to build a flexible and freely configured framework whereas any linguistic analysis tool can be replaced by more sophisticated one whenever it is available.
The main purpose of the present research is to support Arabic Text- to - Speech synthesizers, with natural prosody, based on linguistic analysis of texts to synthesize, and automatic prosody generation, using rules which are deduced from recorded s ignals analysis, of different types of sentences in Arabic. All the types of Arabic sentences (declarative and constructive) were enumerated with the help of an expert in Arabic linguistics . A textual corpus of about 2500 sentences covering most of these types was built and recorded both in natural prosody and without prosody. Later, these sentences were analyzed to extract prosody effect on the signal parameters, and to build prosody generation rules. In this paper, we present the results on negation sentences, applied on synthesized speech using the open source tool MBROLA. The results can be used with any parametric Arabic synthesizer. Future work will apply the rules on a new Arabic synthesizer based on semi-syllables units, which is under development in the Higher Institute for Applied Sciences and Technology.
This paper deals with automatic detection of plagiarism in Arabic documents. We present in this paper a new idea based on the experimentation of lexical chains. The proposed method extracts those chains from original document and uses a search engine to verify if such chains occur in other documents. The second step in our methods uses automatic translation system to translate lexical chains and verify by using search engine if those chain occurs in document in other languages. Then we compute a correlation ratio between lexical chains and lexical chains extracted from documents provided by the search engine to detect plagiarism in the original document. We present in the end of this paper our prototype called « Alkachef » developed to detect plagiarism in Arabic document .
comments
Fetching comments Fetching comments
Sign in to be able to follow your search criteria
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا