Parallelization of bioinformatics methods using a computational grid

Download Article

DOI: 10.21522/TIJAR.2014.03.01.Art023

Authors : Mauricio Adami Mariani, Samuel Brando Oldra, Precious Adewopo

Abstract:

Recent advances in computer science improve research in several areas. These include an area with great emphasis, the biology, which is the field of study of this work. The use of computer for analysis of data, and processing methods of biology is called bioinformatics. However, when are analyzed DNA sequences from complex organisms which have thousands nucleotides is required a greater processing power. Due to the increase the amount of data to be processed we can use HPCA. Within this context in this work, we study the use of computing capabilities in performance processing DNA sequences. More specifically the parallelization of methods used by the research group in bioinformatics at UCS(University of Caxias do Sul). For development this work we chose to use computational grids, since this type of platform provides a high processing capacity at low cost.

References:

[1.] ANDRADE, N.;COSTA, L .;GERMÓGLIO, G.; CIRNE, W.; Peer-to-peer grid computing with the OurGrid Community. Universidade Federal de Campina Grande, Campina Grande, 2005.

[2.] ANDRADE, N.; CIRNE W.; BRASILEIRO, F.; OurGrid: An Approach to Easily Assemble Grids with Equitable Resource Sharing. Federal University of Campina Grande, Campina Grande, 2003.

[3.] BUYYA, R. High Performance Cluster Computing: Architectures and Systems. [S.l.]: Prentice Hall, 1999.

[4.] CIRNE, W.; NETO, E. S.; Grids Computacionais: Da Computação de Alto Desempenho a Serviços Sob Demanda. Fortaleza, CE: SBC, Federal University of Ceara, State University of Ceara, 2005.

[5.] DANTAS, M. Computacão distribuída de alto desempenho. Rio de Janeiro: Axcel Books, 2005.

[6.] FARACH, M.; NOORDEWIER M.; SAVARI S.; SHEPP L.; WYNER A.; ZIV J.; On the entropy of DNA: Algorithms and measurements based on memory and rapid convergence. Proc. 5th Annual ACM-SIAM symposium on Discrete Algorithms; ACM-SIAM, 1994.

[7.] FOSTER Ian. Designing and Building Parallel Programs. 1. ed. Reading, USA: Addison Wesley, 1995.

[8.] GERHARDT ,G. J.L.; LEMKE, N.; CORSO,G.;Network clustering coefficient approach to DNA sequence analysis; Paper published in Chaos, Solitons and Fractals, 2005;

[9.] GERHARDT ,G. J. L.; PANIS, R. J.; SANTOS, L. Presença de Períodos em Sequências de DNA. Caxias do Sul: UCS, Artigo não publicado, ano 2004.

[10.] GERHARDT, G. J. L., SILVA, S. de A.; PANIS, R. J.; SANTOS, L. dos; Correlações entre Cromossomos Usando Periodicidades em Seqüências de DNA. II Workshop of Technology in Computer Applied at Natural Enviroment; Publicado em 2004.

[11.] GIBAS, C.; JAMBECK, P.; Developing Bioinformatics Computer Skills; Estados Unidos, O’Reilly, 2001.

[12.] HAYKIN, S.. Neural networks: a comprehensive foundation. 2. ed. New Jersey: Prentice-Hall, 2005.

[13.] HORTA, J. O. C.; Estimadores de Entropia para Sequências de DNA; 2001; 144p. Dissertation (Masters dissertation in Computer Applied) - University of Sao Paulo, São Paulo.

[14.] JACOB, B.; BROWN, M.; FUKUI, K.; TRIVEDI, N. Introduction to Grid Computing. , 2005. Disponvel em: http://www.redbooks.ibm.com/abstracts/sg246778.html. Access in: october. 2009.

[15.] KONIGES, A. E.; Industrial Strength Parallel Computing; San Francisco, California, Morgan Kaufmann Publishers, 2000.

[16.] LESK, Arthur M., Introdução à Bioinformática, 2a Ed.- Porto Alegre: Artmed, 2008.

[17.] LEWIN, B.; Genes VII; 1.ed.; Porto Alegre, Artmed, 2001.

[18.] MARIANI, M. A. ,GERHARDT, G. J. L., SILVA, S. de A.;MARTINOTTO, A. L., ECHEVER-RIGARAY, S.; Utilização de Grids Computacionais para a Paralelização de um Algoritmo de Aprendizado de Máquina; XVII Encontro de Jovens Pesquisadores da UCS; 009.

[19.] MOUNT, David W. Bioinformatics : Sequence and Genome Analysis. New York: Cold Spring Harbor Laboratory, 2000.

[20.] NELSON, D. L.; COX, M. M.; Lehninger Princípios de Bioquímica.; 3.ed.; São Paulo, Sarvier, 2002.

[21.] Regulon DB. Disponvel em: <http://regulondb.ccg.unam.mx>. Access in: october. 2009.

[22.] RUSSELL, S.; NORVIG, P.; Inteligencia Artificial; Rio de Janeiro. Elsevier. 2004.

[23.] SANTOS, L. dos;Caracterização Computacional de Padrões Estruturais em Sequências de DNA Relacionadas a Processos em Redes Metabólicas; 2009; 127p.; Dissertation(Masters dissertation in Computer Applied) – National Institute of Space Research(INPE), São José dos Campos.

[24.] SEEFELD, K.; R For Bioinformatics; OREILLY & ASSOC; 2005

[25.] SHANNON, C.; WEAVER, W. The Mathematical theory of communication. 5 ed. Urbana/Chicago, Illinois State University Press, 1963

[26.] SILVA, S. de A.; Redes Neurais Artificiais Aplicadas na Caracterização e Predição de Regiões Promotoras; 2006; 144 p.; Dissertation (Masters dissertation in Computer Applied) - University of Vale dos Sinos(UNISINOS), São Leopoldo.

[27.] TANENBAUM, A. S.;Organização Estruturada de Computadores; Rio de Janeiro, RJ, Livros Técnicos e Científicos Editora, 2007.

[28.] VOET, D.; VOET J. G.; Bioquímica; 3.ed; Porto Alegre, Artmed, 2006.

[29.] WHEELER, David L.; BARRET, Tanya; BENSON, Dennis A.; BRYANT, Stephen H.; Canese, Kathi; CHETVERNIN, Vyacheslav; CHURCH, Deanna M.; DICUCCIO, Michael; EDGAR, Ron; FEDERHEN, Scott; GEER, Lewis Y.; HELMBERG, Wolfgang; KAPUSTIN, Yuri; KENTON, David L.; KHOVAYKO, Oleg; LIPMAN, David J.; MADDEN, Thomas L.; MAGLOTT, James Ostell; PRUITT, Kim D.; SCHULER, Gregory D.; SCHRIML, Lynn M.; SEQUEIRA, Edwin; SHERRY, Stephen T.; SIROTKIN, Karl; SOUVOROV, Alexandre; STARCHENKO, Grigory; SUZEK, Tubga O.; TATUSOV, Roman; TATUSOVA, Tatiana A.; WAGNER, Lukas; YASCHENKO, Eugene. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research, v. 34, 2006.