Desafios e Limitações Comuns do Sequenciamento do Exoma Total

Sequenciação do exoma completo (WES), como uma das tecnologias fundamentais na investigação genómica, fornece uma ferramenta importante para o diagnóstico de doenças genéticas, investigação de tumores e desenvolvimento de medicamentos, ao direcionar e capturar sequências de DNA em regiões codificadoras de proteínas (exões). No entanto, a sua aplicação ainda enfrenta muitos desafios técnicos, analíticos e éticos. A seção seguinte revisa sistematicamente as principais limitações de WES, combinando a pesquisa mais recente com a prática clínica.

Alt:WES's list of unresolved challenges.Lista de desafios não resolvidos da WES (Bertier G et al., 2016)

I. Limitações Técnicas

Cobertura Incompleta e Viés de Captura

  • O WES cobre apenas aproximadamente 1%-2% do genoma (ou seja, regiões de exão), mas alguns exões não podem ser capturados de forma eficaz devido a limitações técnicas. Por exemplo:
  • Regiões com Alto Conteúdo de GC: Por exemplo, o conteúdo de GC das regiões de exon do gene BRCA1 é tão alto quanto 70%, levando a uma eficiência de hibridação de sondas reduzida e uma taxa de falsos negativos de 5%-10%.
  • Interferência de Sequências Repetitivas: Por exemplo, o pseudogene (CYP21A2P) do gene CYP21A2 tem uma similaridade de sequência de até 98% com o gene funcional, tornando fácil para sondas de captura convencionais se ligarem incorretamente, resultando em resultados falso negativos.
  • Diferenças de Plataforma: A uniformidade de cobertura pode variar entre diferentes kits de enriquecimento de captura (por exemplo, Agilent vs. IDT) e plataformas de sequenciação, mas as plataformas domésticas atuais (como DNBSEQ-T7/G400) alcançaram um desempenho comparável ao da Illumina. NovaSeq na sequenciação do exoma completo.

Limitações na Detecção de Variações Estruturais e Mutação Complexas

  • Variações no Número de Cópias (CNVs): O WES tem uma sensibilidade de menos de 60% para CNVs >50 bp, enquanto sequenciação de leitura longa (tais como PacBio HiFi) pode melhorar a sensibilidade para mais de 90%. Por exemplo, a síndrome de microdeleção 22q11.2 pode ser negligenciada na WES devido à cobertura insuficiente de sondas.
  • Sensibilidade Insuficiente para Variantes de Baixa Frequência: O WES clínico padrão (tipicamente com uma profundidade média de ~100×) tem uma capacidade limitada para detectar variantes de baixa frequência, como mutações somáticas ou mosaicismo com uma frequência alélica abaixo de 5%. Embora a sensibilidade possa ser melhorada aumentando a profundidade de sequenciamento (>300×), esta abordagem eleva significativamente tanto os custos como o volume de dados, tornando-a menos rentável em comparação com painéis de sequenciamento mais direcionados ou sequenciamento de genoma completo (WGS).

Interferência de Pseudogenes e Homologia de Sequência

  • Interferência de Pseudogenes: Por exemplo, o pseudogene SBDSP do gene SBDS tem uma similaridade de sequência de até 97% com o gene funcional. O sequenciamento Sanger pode identificá-lo erroneamente como uma mutação heterozigótica, necessitando de verificação por qPCR ou sequenciamento de long-read.
  • Dificuldade em Distinguir Genes Homólogos: Por exemplo, a similaridade de sequência entre PTEN e PTENP1 pode facilmente levar a contaminação cruzada durante a captura direcionada, exigindo um design específico de sondas ou verificação por MLPA.

II. Desafios na Análise e Interpretação de Dados

Complexidade da Anotação de Variantes

  • Pontualidade e Limitações da Anotação de Bases de Dados: O Sequenciamento do Exoma Completo (WES) gera um vasto número de variantes raras, cuja interpretação depende fortemente de bases de dados públicas (por exemplo, ClinVar, gnomAD). No entanto, existem dois desafios principais: (1) Atraso na Anotação: As mutações familiares privadas recém-descobertas são frequentemente classificadas como Variantes de Significado Incerto (VUS) e podem exigir anos de evidências acumuladas para reclassificação; (2) Viés Populacional: As bases de dados existentes (por exemplo, gnomAD) são predominantemente compostas por dados de populações europeias. Este viés pode levar à classificação errónea de variantes raras encontradas em outras populações como patogénicas. Consequentemente, o WES enfrenta desafios significativos de interpretação tanto na descoberta de novos genes causadores de doenças como ao servir populações sub-representadas.
  • Fontes de Anotação Conflitantes: A mesma variante pode ser rotulada como "patogénica" ou "benigna" em ferramentas como ANNOVAR e SnpEff, exigindo verificação manual. Por exemplo, a mutação c.743G>A no gene TP53 está listada como patogénica em algumas bases de dados, mas estudos recentes mostram que não é fenotipicamente relevante.

Risco Duplo de Falsos Positivos e Falsos Negativos

  • Erros Técnicos: O viés de amplificação por PCR pode levar à perda de alelos, como a mutação c.1521_1523delCTT no gene CFTR, que pode ser ignorada durante a amplificação.
  • Erros de mutação de baixa frequência: Quando a frequência de mutação está abaixo de 1%, a taxa de deteção de WES pode ser inferior a 30%, necessitando de verificação por ddPCR ou NGS sequenciação profunda.

Falta de colaboração multidisciplinar e padronização

  • Interpretação de discrepâncias: A classificação de patogenicidade do mesmo VUS pode variar até 40% entre diferentes laboratórios. Por exemplo, a mutação c.3985C>T no gene SCN1A pode ser classificada como "patogénica" ou "de significado desconhecido" no diagnóstico de epilepsia.
  • Associação fenótipo-genótipo insuficiente: Aproximadamente 30% dos resultados de WES não podem ser efetivamente associados a genes específicos devido a descrições fenotípicas vagas (por exemplo, "atraso no desenvolvimento").

Alt:Issues that were encountered in data analysis.Questões que foram encontradas na análise de dados (Corominas J et al., 2022)

III. Questões Éticas e Práticas em Aplicações Clínicas

Dilemas Éticos das Descobertas Incidenciais

  • Risco de Doença Não-Alvo: O WES pode detectar mutações patogénicas não relacionadas com o fenótipo atual (por exemplo, BRCA1 c.68_69delAG), exigindo notificação prévia ao paciente e planos de gestão. Estudos mostram que 15% dos participantes experienciam sintomas de ansiedade devido a descobertas incidentais.
  • Controvérsias Relativas à Reportagem de Doenças em Adultos: Por exemplo, mutações no gene APC podem indicar um risco de câncer colorretal, mas o paciente pode ainda não estar assintomático, exigindo uma consideração cuidadosa da necessidade de divulgação.

Correspondência de qualidade de amostra e fenótipo

  • Impacto da degradação do ADN: A fragmentação do ADN em amostras FFPE pode levar a uma diminuição da profundidade de cobertura e a um aumento de 2 a 3 vezes nas taxas de erro de sequenciação nas regiões das bordas dos exões (como os códons de início/paragem).
  • Mudanças dinâmicas no fenótipo: Por exemplo, o fenótipo da encefalopatia epiléptica neonatal pode evoluir ao longo de vários meses, exigindo atualizações regulares das informações clínicas para a reanálise dos dados.

IV. Melhorias Tecnológicas e Direções Futuras

Inovação Tecnológica

  • Integração de sequenciação de leitura longa: as tecnologias PacBio HiFi e Oxford Nanopore podem resolver variações estruturais complexas (como translocações equilibradas), aumentando a taxa de deteção de CNV para 90%.
  • CRISPR enriquecimento direcionado: O enriquecimento mediado por CRISPR combinado com sequenciação de leitura longa permite a captura específica de regiões genómicas de longo alcance (por exemplo, >10 kb) com alta especificidade, melhorando a sensibilidade de deteção de mutações de baixa frequência (<1%) em 40%-60% em comparação com a sequenciação de leitura longa não direcionada. Esta abordagem é particularmente útil para resolver regiões genómicas complexas (por exemplo, sequências repetitivas, variantes estruturais) que são desafiadoras para o WES tradicional de leitura curta.

Otimização de algoritmos e bases de dados

  • Modelos de aprendizagem profunda: Modelos como o ECOLE, que utilizam a arquitetura Transformer, melhoram a precisão na deteção de CNV de 50,1% para 68,7% e a sensibilidade de 49,6% para 78,4%.
  • Atualizações dinâmicas da base de dados: A base de dados gnomAD (v4.0) integra dados de mais de 800.000 indivíduos (incluindo 730.947 exomas e 76.215 genomas), suportando consultas de frequência de variantes em tempo real e reduzindo falsos positivos de VUS.

Fluxos de trabalho clínicos padronizados

  • Equipa multidisciplinar (EMD): Equipas compostas por geneticistas, clínicos e bioinformáticos podem melhorar a precisão do diagnóstico em 20%.
  • Sistema de controlo de qualidade: os laboratórios certificados pela CAP são obrigados a ter uma profundidade de sequenciação de ≥100×, cobertura de ≥95% e a participar regularmente em avaliações de qualidade interlaboratoriais (como o UK NEQAS).

V. Análise de Caso Típico

Caso 1: Interferência entre o gene SBDS e o pseudogene

  • Contexto: A síndrome de Shwachman-Diamond (SDS) é frequentemente causada por mutações bialélicas no gene SBDS. Este gene possui um pseudogene altamente homólogo, SBDSP (semelhança de sequência >97%).
  • Limitações e Consequências do WES: O WES de leituras curtas tem dificuldades em distinguir sequências entre o SBDS e o SBDSP. Isso pode levar a: 1) Falsos positivos: Interpretação errada de variações de sequência no pseudogene como mutações no gene funcional; 2) Falsos negativos/Misinterpretação: Quando existe uma grande deleção (por exemplo, uma deleção de exon) no gene funcional juntamente com uma variante de nucleotídeo único no pseudogene, os dados do WES podem ser erroneamente interpretados como uma "mutação pontual homozigótica" em vez do correto "estado heterozigótico composto com uma deleção." A clarificação requer sequenciação de leituras longas ou PCR quantitativa (qPCR).
  • Argumento Central: Este caso revela a limitação fundamental do WES na resolução de regiões genómicas altamente homólogas.

Caso 2: Detecção Perdida de uma Grande Deleção de Fragmento no Gene CYP21A2

  • Contexto: A forma mais comum de hiperplasia adrenal congénita (HAC) é causada por mutações no gene CYP21A2. Este gene é também altamente homólogo ao pseudogene CYP21A1P (similaridade >98%).
  • Limitações e Consequências do WES: Para um paciente suspeito de ter CAH, o WES apenas identificou uma Variante de Significado Incerto (VUS) no gene CFTR, que não conseguiu explicar a apresentação clínica. O sequenciamento genómico (GS) subsequente ou o teste MLPA revelaram uma grande deleção heterozigótica (por exemplo, exões 1-7) no gene CYP21A2, uma variante com clara patogenicidade. As razões para a falha do WES são: 1) Grandes deleções excedem o alcance de deteção: Os pipelines bioinformáticos padrão do WES são insensíveis a deleções >50 bp; 2) Dificuldade de alinhamento em regiões homólogas: Mesmo que fragmentos sejam capturados, leituras curtas não podem ser alinhadas com precisão entre CYP21A2 e CYP21A1P.
  • Argumento Principal: Este caso ilustra a elevada taxa de falsos negativos do WES na deteção de grandes variantes estruturais (SVs). Quando a suspeita clínica permanece elevada apesar de um resultado negativo do WES, é necessário realizar testes genómicos suplementares ou testes direcionados.

Resumo

As limitações do sequenciamento do exoma completo (WES) envolvem múltiplas dimensões, incluindo tecnologia, análise e ética. Essas limitações exigem avanços graduais através da inovação tecnológica (como o sequenciamento de leituras longas), otimização de algoritmos (como modelos de aprendizagem profunda) e processos padronizados (como a colaboração de equipas multidisciplinares (MDT)). No futuro, com a melhoria dos quadros de consentimento informado dinâmico e o compartilhamento global de dados (como o projeto GA4GH), espera-se que o WES desempenhe um papel mais central na medicina de precisão; no entanto, a sua aplicação clínica ainda precisa equilibrar o potencial tecnológico com os riscos éticos.

As pessoas também perguntam

Quais são as limitações do sequenciamento do exoma completo?

O sequenciamento do exoma não abrange 100% dos genes no genoma humano; aproximadamente 97% dos exões são alvo. No entanto, cerca de 10% dos exões podem não estar cobertos a níveis suficientes para identificar de forma fiável variantes heterozigóticas. Cada indivíduo pode ter distribuições de rendimento de cobertura ligeiramente diferentes ao longo do exoma.

Quais são as limitações do sequenciamento do exoma na deteção de doenças raras e não diagnosticadas?

Embora o sequenciamento do exoma cubra quase 99 % das mutações em painéis de genes direcionados, tem limitações na deteção de mutações como mosaicos de baixo grau, variantes intrónicas profundas, pequenas CNVs e mutações em regiões repetitivas e regiões de alto GC.

O que não pode ser detetado pela sequenciação do exoma completo?

Podem existir variantes funcionais em regiões não codificantes que regulam a expressão génica, como os potenciadores e os longos RNAs não codificantes. No entanto, estas variantes não codificantes (VNCs), mesmo que identificáveis geneticamente, não são cobertas pela WES e, portanto, não podem ser detetadas.

Qual é um desafio ao sequenciar um genoma inteiro?

Problemas de produção como contaminação de amostras, quimeras de biblioteca e qualidade variável de execução tornaram-se cada vez mais problemáticos na transição do laboratório de desenvolvimento de tecnologia para o chão de produção.

Quais são as questões éticas do sequenciamento do genoma completo?

Identificamos três principais considerações éticas que têm sido implicadas na investigação do genoma completo: o retorno dos resultados da pesquisa aos participantes; as obrigações, se existirem, que são devidas aos familiares dos participantes; e o uso futuro de amostras e dados recolhidos para o sequenciamento do genoma completo.

Referências:

  1. Bertier G, Hétu M, Joly Y. Desafios não resolvidos do sequenciamento de exoma completo clínico: uma revisão sistemática da literatura sobre as opiniões dos utilizadores finais.. BMC Genómica Médica. 2016, 11 de agosto; 9(1):52.
  2. Miya F, Nakato D, Suzuki H, Yamada M, Watanabe D, Takenouchi T, Kosaki K. Aumentar a relação custo-eficácia no diagnóstico clínico utilizando sequenciação do exoma completo alargada: SNVs, SVs e além.. J Hum Genet2026 Jan;71(1):13-21.
  3. Corominas J, Smeekens SP, Nelen MR, Yntema HG, Kamsteeg EJ, Pfundt R, Gilissen C. Sequenciação do exoma clínico - Erros e precauções. Hum Mutat. 2022 Ago;43(8):1041-1055.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo