Princípios e Fluxo de Trabalho do Sequenciamento do Exoma Completo
O que é WES
O exoma é comumente definido como englobando todos os exões dentro de genes codificadores de proteínas, incluindo elementos que não codificam proteínas, como sequências de microRNA ou lncRNA. A análise do exoma ajuda na identificação de loci que podem precipitar doenças específicas. Para a investigação de distúrbios mendelianos raros, o sequenciamento do exoma revela-se um método particularmente eficaz para a deteção de variações genéticas.
Acelerado pelos avanços em enriquecimento direcionado estratégias e avanços nas tecnologias de sequenciação de DNA, a evolução de sequenciamento do exoma completo (WES) tem sido instrumental. WES representa uma técnica de análise genómica direcionada para a investigação detalhada de todos os exões transcritos dentro de um genoma. Isso é realizado através da utilização de ADN. microarranjos ou sequenciação do genoma completo plataformas em conjunto com tecnologias de captura de sequências. Estas ferramentas permitem a captura e enriquecimento seletivo das regiões de exões no DNA, que são posteriormente submetidas a sequenciação de alto rendimento para obter informações sobre os mecanismos regulatórios da expressão génica.
O WES demonstra a capacidade de detectar potenciais mutações que podem estar associadas a fenótipos ou doenças, bem como variações genómicas gerais, descoberta de novos genes e as relações fenótipo-genótipo de mutações genéticas.
Diferença entre WES e WGS
WES implica a extração de todas as regiões exónicas, os principais domínios que orquestram a síntese de proteínas. As proteínas formam o núcleo estrutural e funcional do corpo humano, tornando as zonas do exoma dentro do ADN de maior valor genético. Dado que os exões constituem apenas 1% do genoma de um indivíduo, o WES consegue controlar os custos enquanto amplifica a profundidade dos testes—um fator crítico que influencia a precisão. Resultados significativos de investigação académica estão atualmente centrados na região exónica, assim, os dados gerados pelo WES são adequadamente substanciais para futuras atualizações. Com o advento de novas descobertas de investigação, a análise direta de dados pode ser empregue sem necessitar de um novo teste.
Sequenciação do Genoma Completo (WGS) esforça-se por capturar todos os loci genéticos. As áreas além dos exões, que representam 99% do total de loci, contêm segmentos repetitivos e sem sentido em abundância. O rendimento de literatura académica relevante também é notavelmente escasso, implicando que o conteúdo legível derivado do WGS é quase indistinguível do conteúdo extraído do WES. No entanto, custos significativos são desproporcionalmente desperdiçados em loci 'sem sentido' no WGS, tornando difícil garantir a profundidade de sequenciamento. Em certos testes genéticos de WGS que custam vários milhares, a profundidade média é de apenas 30X. Para os loci em análise, a profundidade de sequenciamento pode diminuir para níveis de um único dígito, tornando os dados praticamente sem valor para referência.
Comparado com o WGS, o WES apresenta uma vantagem nos seguintes três aspectos:
- O WES requer menos tempo do que o WGS.
- Os conjuntos de dados gerados pelo WES são significativamente menores do que os do WGS, tornando-os mais manejáveis para a análise bioinformática.
- Custo: O custo do WGS é três a quatro vezes superior ao do WES.
Portanto, o WES é atualmente considerado a técnica de teste genético mais rentável.
Serviços que pode estar interessado em
Princípio da Sequenciação do Exoma
Sequenciação do Exoma Completo como uma técnica analítica genómica, procura mutações genéticas ligadas a variações na função das proteínas. O princípio básico abrange:
Captura e Enriquecimento de DNA: Probes de DNA ou RNA específicas para regiões de éxons são primeiro utilizadas para capturar e enriquecer sequências de DNA. Normalmente, isso é alcançado através da tecnologia de captura híbrida em fase líquida, que emprega os princípios de emparelhamento de bases para hibridizar probes de RNA marcados com biotina com bibliotecas de DNA que possuem sequências de adaptadores, e depois enriquece o DNA da área alvo através da ligação a esferas magnéticas.
Sequenciação de Alto Débito: As sequências de ADN enriquecidas são então sequenciadas através da tecnologia de sequenciação de alto rendimento. A sequenciação é o processo de descobrir todos os arranjos de desoxirribonucleotídeos no exoma, o que pode ajudar a entender potenciais alterações patofisiológicas em certas doenças.
Análise de Dados: Os resultados da sequenciação são submetidos a uma análise bioinformática para identificar mutações genéticas associadas a variações na função das proteínas.
Fluxo de Trabalho Geral de Sequenciação do Exoma
O processo de trabalho convencional de Sequenciação do Exoma Total (WES) inclui preparação de amostras, captura de exoma e design de bibliotecas, enriquecimento direcionado, sequenciação e análise bioinformática. Uma ilustração que representa o fluxo de trabalho do WES pode ser apresentada abaixo.
Figura 1. Fluxo de trabalho de WGS.
Aviso: Os protocolos precisos diferem entre os vários tipos de amostras, kits de reagentes e equipamentos de sequenciação. Os investigadores devem seguir as instruções especificadas para os reagentes, kits e maquinaria de sequenciação em uso.
Preparação da amostra: amostras de sangue total, células mononucleares do sangue periférico (PBMCs), tecidos congelados frescos, amostras fixadas em formalina e embebidas em parafina (FFPE), amostras de plasma e células do líquido amniótico, entre outros, podem ser utilizadas para sequenciação do exoma. O DNA é extraído das amostras biológicas a serem testadas e fragmentado através de métodos físicos ou processos enzimáticos. A desagregação física inclui cisalhamento, sonicação e cisalhamento dinâmico de fluidos, onde o cisalhamento e a sonicação servem como os métodos principais de fragmentação do DNA. Os processos enzimáticos geralmente envolvem a utilização de nucleases ou transposases, que fragmentam o DNA em pedaços menores. As nucleases induzem a quebra das ligações fosfodiéster dentro dos ácidos nucleicos, resultando na fragmentação do DNA.
Captura e enriquecimento de exões: Durante a captura e enriquecimento do exoma, os exões são seletivamente enriquecidos utilizando tecnologia de captura de exoma. O conceito fundamental por trás do enriquecimento de alvos refere-se à exploração das diferenças físico-químicas entre o composto alvo e outras substâncias para facilitar a sua separação. Após a isolação do exoma do restante do genoma, são necessárias várias etapas de lavagem para obter um exoma mais puro. Embora água destilada seja tipicamente utilizada para eluir os alvos, certos kits especializados podem exigir soluções de eluição específicas.
Construção de biblioteca: A construção da biblioteca envolve a reparação das extremidades dos fragmentos de DNA exónicos enriquecidos, a ligação de conectores e a amplificação das bibliotecas para converter os fragmentos de DNA exónicos enriquecidos em bibliotecas de sequenciação—um passo que fornece amplos modelos de DNA para a sequenciação subsequente.
Tabela 1. Kits comuns de enriquecimento de alvos para sequenciação.
| Kits | Região Alvo | Entrada de DNA Genómico Necessária | Adição de Adaptador | Comprimento da Sonda (mer) |
| Agilent SureSelect XT2 V6 Exoma | 60 Mb | 100 ng | Ligadura | 120 |
| Agilent SureSelect XT2 V5 Exoma | 51 Mb | 100 ng | Ligadura | 120 |
| Painel Exómico IDT xGEN | 39 Mb | 500 ng | Ligadura | não descrito |
| Illumina Nextera Captura Rápida Exoma Expandido | 62 Mb | 50 ng | Transposase | noventa e cinco |
| Roche NimblegenSeqCap EZ Exoma v3.0 | 64 Mb | 1 ug | Ligadura | 60 - 90 |
Sequenciação: Com os avanços nas técnicas de sequenciação, a Sequenciação de Nova Geração (NGS) é mais extensivamente utilizada para sequenciação do exoma. A lógica por trás da NGS envolve acoplar a amostra do exoma a uma base apropriada (como o flowcell no Illumina Hiseq e as esferas magnéticas no Roche-454), seguido pela duplicação de PCR in situ para garantir a amplificação do sinal em cada ronda. O ddNTP é examinado após cada ronda de extensão, e a sequência completa é eventualmente compilada utilizando um algoritmo de bioinformática. A alta eficiência e as capacidades de elevado rendimento tornam a NGS uma opção atraente para sequenciação de alto rendimento.
Para além do NGS, as tecnologias de sequenciação de terceira geração estão a evoluir rapidamente e possuem eficiências que superam amplamente o NGS. A sequenciação de moléculas únicas, uma característica distintiva da sequenciação de terceira geração, pode reduzir drasticamente o tempo e o custo associados à sequenciação do genoma completo para meros minutos. Empresas como a PacificBio e a Oxford Nanopore demonstraram a eficiência dos seus métodos, que poderiam potencialmente incitar uma revolução no domínio da sequenciação do exoma.
Tabela 2. Métodos comuns utilizados para sequenciação atualmente.
| Métodos | Empresa | Geração | Comprimento de leitura | Precisão | Leituras por execução | Tempo por corrida |
| Semicondutor iónico | Ion Torrent | 2ª geração | Até 600 pb | 99,60% | até 80 milhões | 2 horas |
| Pirosequenciação (454) | Roche | 2ª geração | 700 bp | 99,90% | 1 milhão | 24 horas |
| Sequenciação por síntese | Illumina | 2ª geração | 75-300 pb | 99,90% | 1 milhão a 3 mil milhões | 1 a 11 dias |
| Sequenciação por ligadura (SOLiD) | ABI | 2ª geração | 50+35 ou 50+50 pb | 99,90% | 1,2 a 1,4 mil milhões | 1 a 2 semanas |
| Sequenciação por Nanoporos | Oxford Nanopore Technologies | 3ª geração | até 500 kb | 92–97% (leitura única)* | dependente do comprimento de leitura selecionado pelo utilizador | 1 minuto a 48 horas |
| Sequenciação em tempo real de molécula única | Pacific Biosciences | 3ª geração | 30.000 bp | 87% (leitura única)* | 10-20 mil milhões | 0,5-20 horas |
Análise de dados: O processo de análise de dados envolve a eliminação de leituras de baixa qualidade durante o sequenciamento através do controlo de qualidade, o alinhamento de leituras de alta qualidade com o genoma de referência, a quantificação de polimorfismos de nucleotídeo único (SNPs), inserções e deleções (Indels) e variações no número de cópias (CNVs), seguido de anotação, triagem, análise e validação. A análise de dados constitui um ponto crítico no sequenciamento do exoma, abrangendo a avaliação e processamento da qualidade dos dados de sequenciamento, o alinhamento das leituras de sequenciamento ao genoma de referência e a identificação de mutações genéticas nas amostras. As mutações genéticas detectadas precisam ser anotadas, incluindo a distinção da função da mutação, a sua significância patológica e o seu impacto potencial.
Figura 2. O pipeline típico de chamada de variantes.
Vantagens do Sequenciamento do Exoma
Custo-efetividade: Comparado a Sequenciação do Genoma Completo, Sequenciação do Exoma Completo oferece uma cobertura mais profunda, maior precisão e é mais economicamente eficiente.
Alta profundidade de sequenciação: A profundidade de sequenciação pode ultrapassar os 120x.
Alto rendimento: Atende às necessidades de investigação de várias regiões-alvo a partir de um grande número de amostras.
Alta precisão: Com uma cobertura de sequenciamento profundo, a precisão dos dados é alta e eficiente.
Aplicação do Sequenciamento de Exoma
Sequenciação do exoma completo (WES) encontra aplicações em vários domínios da investigação biomédica, incluindo o estudo de monogénicos. doenças hereditáriasdoenças complexas, mutações somáticas em tumores, descoberta de oncogenes e genes supressores de tumores, e avanço de iniciativas de medicina personalizada.
Os tumores, sendo doenças complexas instigadas por múltiplas mutações genéticas, podem ser efetivamente compreendidos com a ajuda de sequenciação do exoma completo. Permite que cientistas e clínicos descubram variações em genes relacionados com tumores para alcançar um diagnóstico e prognóstico precisos do tumor. Isto inclui principalmente investigação sobre genes condutores, subtipagem molecular de tumores, investigação de metástases recorrentes e medicação personalizada para tumores individuais.
Os distúrbios genéticos frequentemente originam-se de mutações genéticas, que ocorrem frequentemente nas regiões exónicas que codificam proteínas. Os métodos tradicionais de deteção de mutações exigem uma investigação minuciosa de genes relacionados com a doença um de cada vez, o que é demorado, intensivo em mão-de-obra e requer um tamanho de amostra substancial. No entanto, o sequenciamento do exoma mitiga estas desvantagens ao investigar simultaneamente múltiplos genes relacionados com a doença, resultando em uma eficiência e precisão de deteção significativamente melhoradas. Ao aplicar o WES, podemos sequenciar todas as regiões exónicas necessárias para codificar proteínas, identificando posteriormente mutações genéticas ou loci polimórficos relacionados com o início da doença. Isto facilita o diagnóstico e tratamento precisos de distúrbios genéticos.
Figura 3. WES e impacto das suas consequências genéticas na saúde pública humana. (Rabbani B et al., 2014)
O WES suscita um grande interesse para aplicações clínicas, principalmente porque abrange as regiões acionáveis dentro de um genoma. O objetivo principal é identificar variações nas regiões exónicas e determinar as mutações causais para doenças ou variantes patogénicas. A interseção da análise de grandes dados e do WES está a impulsionar avanços na medicina personalizada em várias dimensões.
Se estiver interessado nos nossos serviços de genómica, não hesite em contactar os nossos cientistas. Estamos mais do que felizes em ajudar. Além de sequenciação genómicatambém fornecemos serviços incluindo transcriptómica, epigenómica, genómica microbiana, e Sequenciação SMRT da PacBio.
Referências:
- Warr A, Robert C, Hume D, et al. Sequenciação do exoma: perspetivas atuais e futuras. G3: Genes, Genomas, Genética, 2015, 5(8): 1543-1550.
- Rabbani B, Tekin M, Mahdieh N. A promessa do sequenciamento do exoma completo na genética médica. Revista de Genética Humana, 2014, 59(1): 5-15.
- Suwinski P, Ong C, Ling MHT, et al. Avançando a medicina personalizada através da aplicação de sequenciação do exoma completo e análise de grandes dados. Fronteiras em Genética, 2019, 10:49.
- Shashi V, McConkie-Rosell A, Schoch K, et al. Considerações práticas na aplicação clínica do sequenciamento do exoma completo. Genética clínica, 2016, 89(2): 173-181.
- Goh G, Choi M. Aplicação do sequenciamento do exoma completo para identificar variantes causadoras de doenças em doenças humanas hereditárias. Genómica e informática, 2012, 10(4): 214.
- Albertsen H M, Matalliotaki C, Matalliotakis M, et al. O sequenciamento do exoma completo identifica deleções hemizigóticas nos genes UGT2B28 e USP17L2 numa família de três gerações com endometriose. Relatórios de Medicina Molecular, 2019, 19(3): 1716-1720.
- Erjavec S O, Gelfman S, Abdelaziz A R, et al. O sequenciamento do exoma completo em Alopecia Areata identifica variantes raras em KRT82. Comunicações da Natureza, 2022, 13(1): 800.
- Luo W, Zhang C, Jiang Y, et al. Reconstrução sistemática da biologia do autismo a partir de perfis massivos de mutações genéticas. A ciência avança, 2018, 4(4): e1701799.