Análise de viabilidade de ferramenta para correção híbrida de sequências genômicas em ambiente de memória compartilhada com FPGA

Felipe Almeida; Liria Sato; Edson Midorikawa

doi:10.5753/wscad.2019.8688

Felipe Almeida Universidade de São Paulo
Liria Sato Universidade de São Paulo
Edson Midorikawa Universidade de São Paulo

DOI: https://doi.org/10.5753/wscad.2019.8688

Resumo

A análise do genoma compreende pesquisas com amplo escopo, com foco em doenças e em tratamento das mesmas. Em apoio a tais atividades, pesquisadores valem-se de ferramentas computacionais para montagens de genomas. Este trabalho apresenta uma análise de viabilidade de uma ferramenta para correção hı́brida de sequências genômicas, etapa esta necessária para a montagem do genoma. É proposta uma arquitetura para ambientes heterogêneos, com implementação feita em CPU e uma placa FPGA. Os resultados obtidos no levantamento dos dados teóricos e práticos apontam que a implementação com o acelerador em hardware possui ganhos de desempenho de até cerca de 19 vezes em relação à versão sequencial, podendo aumentar a depender da tecnologia de comunicação utilizada.

Referências

Almeida, F., Sato, L., Midorikawa, E., and Torres, T. (2019). Análise de desempenho de algoritmos para correção hı́brida de sequências genômicas em ambiente de memória compartilhada e distribuı́da. In Anais do XVIII Workshop em Desempenho de Sistemas Computacionais e de Comunicação, Porto Alegre, RS, Brasil. SBC.

Del Angel, V. D., Hjerde, E., Sterck, L., Capella-Gutierrez, S., Notredame, C., Pettersson, O. V., Amselem, J., Bouri, L., Bocs, S., Klopp, C., et al. (2018). Ten steps to get started in genome assembly and annotation. F1000Research, 7.

Goodwin, S., McPherson, J. D., and McCombie, W. R. (2016). Coming of age: ten years of next-generation sequencing technologies. Nature Reviews Genetics, 17(6):333.

Hu, Y. and Georgiou, P. (2015). A real-time de novo dna sequencing assembly platform based on an fpga implementation. IEEE/ACM transactions on computational biology and bioinformatics, 13(2):291–300.

Koren, S., Walenz, B. P., Berlin, K., Miller, J. R., Bergman, N. H., and Phillippy, A. M. (2017). Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation. Genome research, 27(5):722–736.

Mahram, A. and Herbordt, M. C. (2012). Fmsa: Fpga-accelerated clustalw-based multiple sequence alignment through pipelined prefiltering. In 2012 IEEE 20th International Symposium on Field-Programmable Custom Computing Machines, pages 177–183.

Ramachandran, A., Heo, Y., Hwu, W., Ma, J., and Chen, D. (2015). Fpga accelerated dna error correction. In 2015 Design, Automation Test in Europe Conference Exhibition (DATE), pages 1371–1376.

Salmela, L. and Rivals, E. (2014). Lordec: accurate and efficient long read error correction. Bioinformatics, 30(24):3506–3514.

Varma, B. S. C., Paul, K., Balakrishnan, M., and Lavenier, D. (2013). Fassem: Fpga based acceleration of de novo genome assembly. In 2013 IEEE 21st Annual International Symposium on Field-Programmable Custom Computing Machines, pages 173–176.