WGS vs. WES vs. Painéis de Sequenciação Alvo
O que são exões?
Os exões representam os segmentos do genoma capazes de transcrever RNA maduro. A totalidade dos exões dentro de um genoma forma coletivamente o que é conhecido como exoma. É crucial distinguir que o termo 'sequenciação do exoma completo' direciona-se especificamente para os exões de genes codificadores de proteínas, com envolvimento mínimo de genes não codificadores.
O termo 'gene' abrange uma sequência de nucleotídeos no DNA que transporta informações genéticas específicas. Os genes são fragmentos da molécula de DNA com efeitos hereditários, servindo como as unidades fundamentais da hereditariedade que regulam características biológicas. Os intervalos dos genes humanos variam em tamanho, desde algumas centenas de pares de bases (pb) até mais de 2 milhões de pb. O Projeto Genoma Humano estima que os humanos possuem entre 20.000 a 25.000 genes codificadores de proteínas.
Recomendado: O que é o Projeto Genoma Humano (PGH)?
O 'genoma' abrange toda a informação genética dentro do DNA de um organismo. Consiste em regiões de genes e regiões não codificantes. O tamanho do genoma humano é de aproximadamente 3 mil milhões de pares de bases (pb) (3GB), com as regiões não codificantes a constituírem a maioria, enquanto as regiões codificantes de proteínas representam apenas cerca de 2%.
O exoma constitui a totalidade dos exões no genoma. Os exões humanos somam cerca de 180.000, representando cerca de 1% do genoma humano, equivalente a aproximadamente 30 milhões de pares de bases (30 MB).
Por favor, leia o nosso artigo: Perguntas e Respostas sobre Sequenciamento de Exomas para mais informações.
Um aspecto importante a considerar em relação aos exões envolve a região não traduzida (UTR). Isto inclui tanto os 5'UTRs (sequências iniciais) como os 3'UTRs (sequências finais) situados em cada lado do mRNA. A sua função principal é regular a iniciação e a terminação da tradução, respetivamente. Embora estas UTRs compreendam sequências exónicas, é crucial notar que não são traduzidas em aminoácidos. Consequentemente, é essencial reconhecer que nem toda a sequência exónica se traduz em aminoácidos.
Por favor, leia o nosso artigo. Os Métodos de Sequenciação do Genoma Completo para mais detalhes sobre o WGS.
As plataformas de sequenciação de alto rendimento e sequenciação de long-read da CD Genomics facilitam a análise robusta de exomas e genomas. Esta abordagem avançada de sequenciação permite um exame abrangente e eficiente do material genético, fornecendo informações valiosas sobre a paisagem molecular e potenciais biomarcadores associados a várias condições.
O que é Sequenciamento do Exoma Total?
Sequenciação do exoma completo (WES)também referido como Sequenciação do Exoma, Sequenciação do Exoma Completo e variações semelhantes, é um método de sequenciação especificamente concebido para analisar o exoma, abrangendo todos os exões dentro do genoma.
Em contraste, o sequenciamento de genoma completo (WGS) envolve o sequenciamento de todo o genoma, proporcionando uma visão abrangente da composição genética de um organismo. Por outro lado, Sequenciação Direcionadatambém conhecido como sequenciação de painel, foca na sequenciação de genes selecionados, normalmente variando de algumas dezenas a mil genes. Sequenciamento de painéis opera com base em dois princípios técnicos: sequenciação por captura de hibridação e sequenciação de amplicões multiplex. A abordagem abrangente é alcançada através da utilização de princípios de hibridação de sequências.
Artigo recomendado: Sequenciação do Exoma Completo Baseada em Protocolo de Captura por Hibridização
Portanto, em termos de cobertura do genoma, a hierarquia é a seguinte: sequenciação do genoma completo Desculpe, não há texto para traduzir. sequenciamento do exoma completo sequenciação direcionada.
É importante reconhecer que o sequenciamento do exoma completo pode ser considerado uma forma especializada de sequenciamento direcionado, uma vez que o seu foco está direcionado para a totalidade das regiões exónicas do genoma.
Tabela 1 Diferenças entre WGS, WES e painéis de NGS direcionados
| WGS | WES | Painel | |
| Região de Sequenciamento | Genoma completo | Exoma completo | Regiões selecionadas |
| Tamanho da Região | 3 G | > 30 M | Dezenas a milhares de genes |
| Profundidade de Sequenciamento | > 30X | 50-150X | > 500X |
| Dados | > 90 G | 5-10 G | - |
| Tipos de Variantes Detectáveis | SNPs InDels CNV Fusão SV |
SNPs InDels CNV Fusão |
SNPs InDels CNV Fusão |
Artigo recomendado: Como Decidir Entre Sequenciamento do Exoma Total a 100X (WES) e Sequenciamento do Genoma Total a 30X (WGS)?
Fluxo de Trabalho do Sequenciamento do Exoma Completo
O Sequenciamento do Exoma Completo (WES) O fluxo de trabalho pode ser amplamente categorizado em três etapas principais: preparação da biblioteca, sequenciação e análise bioinformática.
Preparação da Biblioteca
- Processamento de Amostras: Manuseio inicial de amostras para extrair DNA.
- Extração de DNA: Isolamento de DNA a partir das amostras processadas.
- Quantificação: Medição da concentração de DNA para garantir uma quantidade inicial adequada.
- Construção de Bibliotecas: Preparação de bibliotecas de DNA para sequenciação.
- Captura por Hibridização: Enriquecimento das regiões exónicas-alvo através da hibridização.
- Amplificação: Replicação de fragmentos de DNA para aumentar a sensibilidade de sequenciação.
- Controlo de Qualidade: Avaliação da qualidade da biblioteca para garantir condições de sequenciação ótimas.
Sequenciação
Utilização de plataformas de sequenciação, incluindo plataformas estrangeiras como a Illumina e plataformas nacionais como as fabricadas pela UWI.
Análise Bioinformática
- Controlo de Qualidade: Avaliação dos dados de sequenciação quanto à fiabilidade.
- Emenda e Correspondência: Alinhamento de leituras ao genoma de referência.
- Desduplicação e Reorganização: Remoção de leituras duplicadas e arranjo de dados.
- Deteção de Mutação: Identificação de variações genéticas e mutações.
- Redução de Ruído e Filtragem: Aplicação de filtros para minimizar o ruído de fundo.
- Anotação: Adição de informação funcional a variantes identificadas.
- Software Comumente Usado: FastQC, BWA, GATK, ANNOVAR, entre outros.
Por favor, leia o nosso artigo: Fluxo de Trabalho de Bioinformática de Sequenciamento de Exoma Completo.
Como Avaliar Probes de Painéis de Sequenciamento de Exoma Direcionado?
Ao avaliar o desempenho de um Sonda de Captura de Painel de ExomaVários critérios desempenham um papel crucial. Quer opte por sondas prontas a usar ou considere a personalização, uma análise cuidadosa é essencial. Aqui estão os aspetos-chave a avaliar:
Critérios de Avaliação da Sonda
- Especificidade: Precisão na captura das regiões genómicas pretendidas sem efeitos fora do alvo.
- Sensibilidade: Capacidade de detectar e capturar as regiões-alvo de forma eficaz.
- Uniformidade: Cobertura consistente nas regiões-alvo sem viés significativo.
- Reproduzibilidade: Desempenho fiável em múltiplos experimentos e réplicas.
Considerações Adicionais para Sondas Comerciais
- Tamanho, Comprimento e Design da Sonda: Compatibilidade com a amostra e requisitos de pesquisa.
- Alinhamento com os Objetivos da Pesquisa: Garantir que o conjunto de sondas esteja alinhado com os objetivos do estudo.
Opções de Personalização
- Adaptação a Necessidades Específicas: Adicionar áreas de interesse ou desenhar um painel completamente personalizado.
- Bases de Dados de Referência: Utilização de bases de dados como RefSeq, CCDS, Ensembl, GENCODE e ClinVar para o design de sondas.
- Densidade de Probes: Solicitação de densidades de probes adicionais para regiões específicas a fim de aumentar a eficiência de captura.
Características Especiais em Sondas Externas
- Locais SNP para Identificação de Amostras: Algumas sondas incorporam locais SNP para rastreamento de amostras, minimizando os riscos de contaminação em experimentos de NGS.
- Automação para Rastreio de Amostras: Utilização de IDs SNP para automatizar a identificação de amostras, reduzindo erros humanos em comparação com a adição manual de marcadores ou rótulos de sequenciação por índice.
- Profundidade de Sequenciação: Garantir profundidade suficiente para um rastreio preciso de amostras baseado em SNP.
Métricas Comumente Utilizadas para Avaliação de Probes WES
- Especificidade, Sensibilidade, Uniformidade e Reproduzibilidade: Tal como na avaliação geral de sondas, estas métricas aplicam-se para avaliar sondas de captura de hibridização utilizadas em sequenciação direcionadaincluindo Sequenciamento do Exoma Completo (WES).
5 Dicas para Avaliar Probes de Captura de Hibridização
A avaliação das sondas WES envolve frequentemente as seguintes métricas. Claro que, dado que WES é um tipo específico de sequenciação direcionada, estas métricas também podem ser utilizadas para avaliar sondas de captura por hibridização usadas em outras sequenciações direcionadas.
Taxa de Precisão
A taxa de acerto é uma percentagem crucial que indica a medida em que os dados de sequenciação se alinham com a região alvo. Embora os exões sejam o foco principal, muitas áreas genómicas, como os íntrons e as regiões intergénicas, partilham homologia com os exões. Na prática, as regiões não-alvo (exão) capturadas durante a hibridização são consideradas fora do alvo. Os dados fora do alvo são considerados inválidos e não podem ser utilizados em análises subsequentes, representando um desperdício de recursos de sequenciação. Uma taxa de acerto mais elevada e um desperdício reduzido fora do alvo significam uma sonda mais eficiente.
Cobertura
A cobertura, frequentemente associada à profundidade (por exemplo, "10X cobertura" ou "30X cobertura"), denota a extensão em que as leituras de sequenciamento cobrem uma determinada região. Por exemplo, "10X cobertura de 90%" indica que 90% dos dados de sequenciamento cobrem a região alvo pelo menos 10 vezes. Se a cobertura não for especificada com profundidade, é interpretada como "1X cobertura", implicando que a região é coberta por pelo menos uma leitura. Coberturas mais altas e percentagens mais baixas de alvos não atingidos aumentam a eficácia da sonda.
Homogeneidade
A homogeneidade avalia a uniformidade da cobertura em diferentes locais dentro da região-alvo. A uniformidade ideal garante que a profundidade em cada local se alinhe de perto com a profundidade média. O Fold-80, uma métrica que avalia a homogeneidade, representa o sequenciamento adicional necessário para garantir que 80% das bases-alvo atinjam a profundidade média. Um Fold-80 mais baixo significa uma captura eficiente, minimizando o sequenciamento desnecessário. Probes com excelente homogeneidade contribuem para um sequenciamento eficaz e rentável.
Taxa de Duplicação
A taxa de duplicação reflete a percentagem de leituras duplicadas no total da sequência sequenciada. Leituras duplicadas, desprovidas de informação adicional, são removidas na análise subsequente para melhorar a precisão na deteção de mutações. Uma taxa de duplicação mais elevada reduz a utilização dos dados, levando a custos de sequenciação desperdiçados. Taxas de duplicação mais baixas, no mesmo contexto, resultam em economias de custos, indicando a eficiência da sonda.