Bioinformática Bash 03/04/2026
Filtrar Sequências DNA em Arquivo FASTA com Grep
Um one-liner simples para contar ou encontrar padrões de DNA em arquivos de sequenciamento.
Filtrar Sequências DNA com Grep 🧬
Uma dica rápida para o dia a dia na bioinformática usando o terminal Linux:
Contando sequências em um arquivo FASTA
Para saber quantas sequências existem em um arquivo .fasta, basta procurar pelo caractere > que inicia cada registro:
grep -c ">" arquivo.fasta
Procurando por um padrão específico (ex: motifs)
Se você busca um motif de DNA específico em suas sequências (ignora o cabeçalho):
grep -v ">" arquivo.fasta | grep "GATTACA"
Dica: Use o parâmetro
-ipara ignorar o caso (maiúsculas/minúsculas).
Série: Introdução à Manipulação de Dados Genômicos2 / 3