SSAHA: A Fast Search Method for Large DNA Databases

Este artigo descreve o algoritmo SSAHA (Sequence Search and Alignment by Hashing Algorithm) que serve para pesquisas rápidas em banco de dados de sequências genéticas que contem vários gigabytes de dados.
Ele funciona primeiramente criando hashs das todas as sequências e suas sub-sequencias (n-tuples) do banco e armazenando as posições destas.
Desta forma, quando haver uma pesquisa, ela será muito mais veloz, pois já será conhecida as posições das sub-sequencias.
Leitura recomendada principalmente a estudantes de ciências da computacão.

A Página do projeto SSHA é http://www.sanger.ac.uk/Software/analysis/SSAHA/