A Comparative Study of CpG Islands Detected by Different Tools: Newcpgreport and CpGCluster

دراسة مقارنة لخصائص جزر الCpG المكتشفة باستخدام أداتي newCpGReport و CpGCluster

 Publication date 2012
and research's language is العربية
CpG islands play an important role in genes transcription regulation, due to the fact that these islands overlap with the genes’ promoter regions, and the methylation of those CpG islands may repress the transcription of the associated genes. Previous studies reported that methylation of CpG islands is an important indicator of the presence and possibility of developing cancers. There are mainly two types of algorithms to identify CpG islands in the nucleotides sequences: distance-based and sliding-window algorithms. The outputs of these algorithms are different for the same nucleotide sequence. The aim of this study is to compare the performance of the above mentioned algorithms by using two web tools named CpGCluster and newCpGReport. CpG islands in human chromosome 22 were identified by applying the two algorithms on this chromosome, and the variation in the number and length of the identified islands was clear. The results also show that about 60% of both tools’ output is crossed. Moreover, the effect of the traditional parameters of CpG islands (length, C+G content and Observed/expected ratio) on the number of the identified islands was studied. The results show that the length parameter has a great effect on the number of islands identified by newCpGReport, while it does not affect CpGCluster’s performance. The effect of making CpG islands identified by newCpGReport start and end with CpG was also studied, due to this operation C+G content and Observed/expected ratio increased for most islands, taking into account that 25% of the islands became shorter than 200 nucleotides.

تؤدي جزر الـ CpG دورًا مهمًا في تنظيم عملية نسخ الجينات، حيث يمكن لمثيلة هذه الجزر في منطقة المحفزات أن تعطل عملية النسخ، مما يؤدي إلى توقف إنتاج البروتينات المرتبطة بهذه الجينات. هذا البحث يهدف إلى مقارنة أداء خوارزميتين للكشف عن جزر الـ CpG: CpGCluster وnewCpGReport. تعتمد الأولى على المسافة بين أزواج النكليوتيدات، بينما تعتمد الثانية على مبدأ النافذة المنزلقة. أظهرت النتائج وجود اختلافات واضحة بين عدد الجزر المكتشفة وطولها بين الخوارزميتين، مع تقاطع حوالي 60% من الجزر المكتشفة. كما دُرس تأثير قيم بارامترات الطول ومحتوى C+G ونسبة الملاحظ/المتوقع على عدد الجزر المكتشفة. تبين أن عتبة الطول لها تأثير كبير على عدد الجزر المكتشفة باستخدام newCpGReport، بينما لا تتأثر خوارزمية CpGCluster بهذه العتبة. كما أظهرت النتائج أن جعل الجزر المكتشفة باستخدام newCpGReport تبدأ وتنتهي بزوج النكليوتيدات CpG يزيد من قيم بارامتري المحتوى ونسبة الملاحظ/المتوقع لنسبة كبيرة من الجزر، مع انخفاض طول نحو 25% من الجزر إلى ما دون 200 نكليوتيد.
دراسة نقدية: على الرغم من أن البحث يقدم مقارنة شاملة بين خوارزميتين للكشف عن جزر الـ CpG، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، كان من الأفضل تضمين خوارزميات أخرى للكشف عن جزر الـ CpG لتعزيز شمولية الدراسة. ثانيًا، لم يتم التطرق بشكل كافٍ إلى تأثير العوامل البيولوجية الأخرى التي قد تؤثر على دقة الكشف. ثالثًا، كان من الممكن تقديم تحليل أعمق للنتائج المتقاطعة بين الخوارزميتين لتحديد أيهما أكثر فاعلية في سياقات بيولوجية مختلفة. وأخيرًا، كان من المفيد تضمين تطبيقات عملية لهذه الخوارزميات في أبحاث السرطان أو الجينات لتوضيح الفائدة العملية لهذه الدراسة.
  1. ما هو الدور الذي تلعبه جزر الـ CpG في تنظيم عملية نسخ الجينات؟

    تؤدي جزر الـ CpG دورًا مهمًا في تنظيم عملية نسخ الجينات، حيث يمكن لمثيلة هذه الجزر في منطقة المحفزات أن تعطل عملية النسخ، مما يؤدي إلى توقف إنتاج البروتينات المرتبطة بهذه الجينات.

  2. ما هي الخوارزميتان اللتان تمت مقارنتهما في هذا البحث؟

    الخوارزميتان هما CpGCluster وnewCpGReport. تعتمد الأولى على المسافة بين أزواج النكليوتيدات، بينما تعتمد الثانية على مبدأ النافذة المنزلقة.

  3. ما هو تأثير عتبة الطول على عدد الجزر المكتشفة باستخدام الخوارزميتين؟

    عتبة الطول لها تأثير كبير على عدد الجزر المكتشفة باستخدام newCpGReport، بينما لا تتأثر خوارزمية CpGCluster بهذه العتبة.

  4. ما هي نسبة التقاطع بين الجزر المكتشفة باستخدام الخوارزميتين؟

    نسبة التقاطع بين الجزر المكتشفة باستخدام الخوارزميتين هي حوالي 60%.

Illingworth R.S., Bird A.P., (2009), “CpG islands – ‘A rough guide’”, FEBS letters, Vol. 583, p.p. 1713-1720
Hou P., Ji M., Liu Z., Shen J., Cheng L., He N., Lu Z., (2003), “A microarray to analyze methylation patterns of p16Ink4a gene 5’-CpG islands”, Clinical Biochemistry, Vol. 36, p.p. 197-202
Bastian P.J., Yegnasubramanian S., Palapattu G.S., Rogers C.G., Lin X., De Marzoa A.M., Nelson W.G., (2004), “Molecular Biomarker in Prostate Cancer: The Role of CpG Island Hypermethylation”, European Urology, Vol. 46, p.p. 698-708
