Variação Genética: Definição, Tipos e Fluxo de Trabalho para Chamada de Variantes

O que é Variação Genética

A composição genética dos organismos dentro de uma população muda, o que é referido como variação genética. Os genes são segmentos de DNA herdados que contêm as instruções para a produção de proteínas. Versões alternativas de genes, conhecidas como alelos, determinam características distintas que podem ser transmitidas dos pais para os filhos. A seleção natural e a evolução biológica dependem fortemente da variação genética. A seleção natural não ocorre por acaso, mas as variações genéticas que surgem em uma população sim.

Transposões são outro termo importante associado à variação genética. As mutações podem ser causadas por transposões de várias maneiras. Um transposão quase certamente danificará um gene funcional se se inserir nele. Para interromper ou alterar a atividade de um gene, exões, íntrons e até mesmo o DNA que flanqueia os genes (que pode conter promotores e intensificadores) podem ser implantados.

Quais são os Tipos de Variação Genética

Substituição de par de bases único

Os SNPs (polimorfismos de nucleotídeo único) são substituições de ácidos nucleicos que também são conhecidos como polimorfismos de nucleotídeo único (SNPs). (1) transição, que envolve a troca de ácidos nucleicos purinas (Adenina/Guanina) ou pirimidinas (Citosina/Timina), e (2) transversão, que envolve a troca de ácidos nucleicos purinas e pirimidinas.

Inserção ou deleção

Inserção ou deleção de um único trecho de sequência de DNA que pode variar em comprimento de dois a centenas de pares de bases, também conhecido como 'indel'.

Variação estrutural

A variação genética que ocorre em uma sequência de DNA maior é comumente referida como variação cromossômica. Tanto a variação no número de cópias quanto os eventos de rearranjo cromossômico estão incluídos nesta categoria de variação genética.

Variação no Número de Cópias

O fenômeno da variação no número de cópias (CNV) ocorre quando seções do genoma são repetidas e o número de repetições varia entre indivíduos.

Figura 1. Visão geral de um fluxo de trabalho generalizado para chamada de variantes (Bewicke-Copley, 2019).Figura 1. Um fluxo de trabalho generalizado para chamada de variantes. (Bewicke-Copley, 2019)

Como Funciona a Chamada de Variantes

A chamada de variantes a partir de dados de leitura bruta é um processo em várias etapas que pode ser realizado com uma ampla gama de ferramentas e recursos. Os seguintes são os passos do procedimento:

  • Para gerar arquivos FASTQ, sequencie todo o genoma ou exoma.
  • Alinhe as sequências a um genoma de referência para gerar arquivos BAM ou CRAM.
  • Crie um arquivo VCF determinando onde as leituras alinhadas diferem do genoma de referência.

Aquisição de dados de leitura bruta: a configuração do arquivo FASTQ

A abordagem mais popular para obter dados brutos de uma máquina de sequenciamento é através de arquivos FASTQ, que são semelhantes aos arquivos FASTA e contêm informações de sequência, bem como informações adicionais, como informações de qualidade da sequência.

Controle de Qualidade

Os dados de sequência bruta obtidos de um prestador de serviços de sequenciamento, em geral, não estão imediatamente prontos para a descoberta de variantes. O controle de qualidade (QC), que vem após a aquisição de dados, é a primeira e mais importante fase na estrutura de avaliação de WES/WGS. O QC é um método para melhorar os dados brutos, removendo quaisquer erros que possam ser detectados. Ao realizar o controle de qualidade (QC) no início da avaliação, as chances de encontrar contaminação, viés, erro ou dados ausentes são reduzidas.

Alinhamento de Sequência

Cada leitura deve ser alinhada a um genoma de referência para determinar sua localização precisa. Como alinhar um grande número de leituras pode levar dias, e um alinhamento de baixa precisão resultará em análises insuficientes, a confiabilidade e a precisão são críticas durante esta fase. Um arquivo de Mapa de Alinhamento de Sequência (SAM) é criado uma vez que o alinhamento está completo.

Processamento Pós-Alinhamento

O processamento de dados pós-alinhamento para construir arquivos BAM prontos para análise é essencial em qualquer estrutura de leituras para variantes. Este procedimento envolve a limpeza dos dados para remover viés técnico, como a identificação de duplicatas e a recalibração das pontuações de qualidade das bases.

Descoberta de Variantes Curtas

Após passar pelos passos de processamento de dados, as leituras estão prontas para análise a montante, sendo a chamada de variantes a fase mais comum. A chamada de variantes é um método de classificar diferenças entre leituras de sequenciamento geradas por experimentos de NGS e um genoma de referência. Devido à dificuldade da chamada de variantes causada por artefatos de alinhamento e sequenciamento, uma infinidade de chamadores de variantes foram desenvolvidos e estão sendo desenvolvidos para ajudar nesta tarefa difícil.

Filtração de Variantes

Após a fase de chamada de variantes, SNVs brutos e indels no Formato de Chamada de Variantes (VCF) são obtidos. Depois disso, são aplicados filtros rigorosos nos dados ou um método mais complexo, como a Recalibração da Pontuação de Qualidade de Variantes (VQSR) do GATK, para filtrá-los.

Anotação de Variantes

A anotação variável é outro processo crucial na estrutura de avaliação de WES/WGS . O objetivo de todas as ferramentas de anotação funcional é anotar dados sobre os efeitos/consequências das variantes, como identificar quais gene(s)/transcrito(s) são influenciados, (ii) avaliar a influência na sequência da proteína, e (iii) equiparar a variante com anotações genômicas conhecidas, e (iv) encontrar e complementar variantes conhecidas em bancos de dados de variantes. O efeito de cada variante é mostrado usando termos da Ontologia de Sequência (SO). Qualificadores são frequentemente usados para denotar a gravidade e o impacto dessas consequências.

Referências:

  1. Bewicke-Copley F, Kumar EA, Palladino G, et al. Aplicações e análise de sequenciamento genômico direcionado em estudos de câncer. Revista de biotecnologia computacional e estrutural. 1 de janeiro de 2019;17.
  2. Bedo J, Goudey B, Wazny J, Zhou Z. Chamada de variantes livre de alinhamento teórico da informação. PeerJ Ciência da Computação. 25 de julho de 2016;2.
  3. Muzzey D, Evans EA, Lieber C. Compreendendo os fundamentos do NGS: do mecanismo à chamada de variantes. Relatórios atuais de medicina genética. dezembro de 2015;3(4).
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo