← Voltar para a Bancada
Bioinformática Bash 03/04/2026

Filtrar Sequências DNA em Arquivo FASTA com Grep

Um one-liner simples para contar ou encontrar padrões de DNA em arquivos de sequenciamento.

Filtrar Sequências DNA com Grep 🧬

Uma dica rápida para o dia a dia na bioinformática usando o terminal Linux:

Contando sequências em um arquivo FASTA

Para saber quantas sequências existem em um arquivo .fasta, basta procurar pelo caractere > que inicia cada registro:

grep -c ">" arquivo.fasta

Procurando por um padrão específico (ex: motifs)

Se você busca um motif de DNA específico em suas sequências (ignora o cabeçalho):

grep -v ">" arquivo.fasta | grep "GATTACA"

Dica: Use o parâmetro -i para ignorar o caso (maiúsculas/minúsculas).

Série: Introdução à Manipulação de Dados Genômicos2 / 3