Princípios e Fluxo de Trabalho do Sequenciamento do Exoma Completo

Visão Geral Rápida

01 O que é WES 02 Diferença entre WES e WGS 03 Princípio da Sequenciação do Exoma 04 Fluxo de Trabalho Geral de Sequenciação de Exoma 05 Vantagens do Sequenciamento do Exoma 06 Aplicação do Sequenciamento de Exoma

O que é WES

O exoma é comumente definido como englobando todos os exões dentro de genes codificadores de proteínas, incluindo elementos que não codificam proteínas, como sequências de microRNA ou lncRNA. A análise do exoma ajuda na identificação de loci que podem precipitar doenças específicas. Para a investigação de distúrbios mendelianos raros, o sequenciamento do exoma revela-se um método particularmente eficaz para a deteção de variações genéticas.

Acelerado pelos avanços em enriquecimento direcionado estratégias e avanços nas tecnologias de sequenciação de DNA, a evolução de sequenciamento do exoma completo (WES) tem sido instrumental. WES representa uma técnica de análise genómica direcionada para a investigação detalhada de todos os exões transcritos dentro de um genoma. Isso é realizado através da utilização de ADN. microarranjos ou sequenciação do genoma completo plataformas em conjunto com tecnologias de captura de sequências. Estas ferramentas permitem a captura e enriquecimento seletivo das regiões de exões no DNA, que são posteriormente submetidas a sequenciação de alto rendimento para obter informações sobre os mecanismos regulatórios da expressão génica.

O WES demonstra a capacidade de detectar potenciais mutações que podem estar associadas a fenótipos ou doenças, bem como variações genómicas gerais, descoberta de novos genes e as relações fenótipo-genótipo de mutações genéticas.

Diferença entre WES e WGS

WES implica a extração de todas as regiões exónicas, os principais domínios que orquestram a síntese de proteínas. As proteínas formam o núcleo estrutural e funcional do corpo humano, tornando as zonas do exoma dentro do ADN de maior valor genético. Dado que os exões constituem apenas 1% do genoma de um indivíduo, o WES consegue controlar os custos enquanto amplifica a profundidade dos testes—um fator crítico que influencia a precisão. Resultados significativos de investigação académica estão atualmente centrados na região exónica, assim, os dados gerados pelo WES são adequadamente substanciais para futuras atualizações. Com o advento de novas descobertas de investigação, a análise direta de dados pode ser empregue sem necessitar de um novo teste.

Sequenciação do Genoma Completo (WGS) esforça-se por capturar todos os loci genéticos. As áreas além dos exões, que representam 99% do total de loci, contêm segmentos repetitivos e sem sentido em abundância. O rendimento de literatura académica relevante também é notavelmente escasso, implicando que o conteúdo legível derivado do WGS é quase indistinguível do conteúdo extraído do WES. No entanto, custos significativos são desproporcionalmente desperdiçados em loci 'sem sentido' no WGS, tornando difícil garantir a profundidade de sequenciamento. Em certos testes genéticos de WGS que custam vários milhares, a profundidade média é de apenas 30X. Para os loci em análise, a profundidade de sequenciamento pode diminuir para níveis de um único dígito, tornando os dados praticamente sem valor para referência.

Comparado com o WGS, o WES apresenta uma vantagem nos seguintes três aspectos:

O WES requer menos tempo do que o WGS.
Os conjuntos de dados gerados pelo WES são significativamente menores do que os do WGS, tornando-os mais manejáveis para a análise bioinformática.
Custo: O custo do WGS é três a quatro vezes superior ao do WES.

Portanto, o WES é atualmente considerado a técnica de teste genético mais rentável.

Serviços que pode estar interessado em

Princípio da Sequenciação do Exoma

Sequenciação do Exoma Completo como uma técnica analítica genómica, procura mutações genéticas ligadas a variações na função das proteínas. O princípio básico abrange:

Captura e Enriquecimento de DNA: Probes de DNA ou RNA específicas para regiões de éxons são primeiro utilizadas para capturar e enriquecer sequências de DNA. Normalmente, isso é alcançado através da tecnologia de captura híbrida em fase líquida, que emprega os princípios de emparelhamento de bases para hibridizar probes de RNA marcados com biotina com bibliotecas de DNA que possuem sequências de adaptadores, e depois enriquece o DNA da área alvo através da ligação a esferas magnéticas.

Sequenciação de Alto Débito: As sequências de ADN enriquecidas são então sequenciadas através da tecnologia de sequenciação de alto rendimento. A sequenciação é o processo de descobrir todos os arranjos de desoxirribonucleotídeos no exoma, o que pode ajudar a entender potenciais alterações patofisiológicas em certas doenças.

Análise de Dados: Os resultados da sequenciação são submetidos a uma análise bioinformática para identificar mutações genéticas associadas a variações na função das proteínas.

Fluxo de Trabalho Geral de Sequenciação do Exoma

O processo de trabalho convencional de Sequenciação do Exoma Total (WES) inclui preparação de amostras, captura de exoma e design de bibliotecas, enriquecimento direcionado, sequenciação e análise bioinformática. Uma ilustração que representa o fluxo de trabalho do WES pode ser apresentada abaixo.

Figure1. Workflow of WGS. Figura 1. Fluxo de trabalho de WGS.

Aviso: Os protocolos precisos diferem entre os vários tipos de amostras, kits de reagentes e equipamentos de sequenciação. Os investigadores devem seguir as instruções especificadas para os reagentes, kits e maquinaria de sequenciação em uso.

Preparação da amostra: amostras de sangue total, células mononucleares do sangue periférico (PBMCs), tecidos congelados frescos, amostras fixadas em formalina e embebidas em parafina (FFPE), amostras de plasma e células do líquido amniótico, entre outros, podem ser utilizadas para sequenciação do exoma. O DNA é extraído das amostras biológicas a serem testadas e fragmentado através de métodos físicos ou processos enzimáticos. A desagregação física inclui cisalhamento, sonicação e cisalhamento dinâmico de fluidos, onde o cisalhamento e a sonicação servem como os métodos principais de fragmentação do DNA. Os processos enzimáticos geralmente envolvem a utilização de nucleases ou transposases, que fragmentam o DNA em pedaços menores. As nucleases induzem a quebra das ligações fosfodiéster dentro dos ácidos nucleicos, resultando na fragmentação do DNA.

Captura e enriquecimento de exões: Durante a captura e enriquecimento do exoma, os exões são seletivamente enriquecidos utilizando tecnologia de captura de exoma. O conceito fundamental por trás do enriquecimento de alvos refere-se à exploração das diferenças físico-químicas entre o composto alvo e outras substâncias para facilitar a sua separação. Após a isolação do exoma do restante do genoma, são necessárias várias etapas de lavagem para obter um exoma mais puro. Embora água destilada seja tipicamente utilizada para eluir os alvos, certos kits especializados podem exigir soluções de eluição específicas.

Construção de biblioteca: A construção da biblioteca envolve a reparação das extremidades dos fragmentos de DNA exónicos enriquecidos, a ligação de conectores e a amplificação das bibliotecas para converter os fragmentos de DNA exónicos enriquecidos em bibliotecas de sequenciação—um passo que fornece amplos modelos de DNA para a sequenciação subsequente.

Tabela 1. Kits comuns de enriquecimento de alvos para sequenciação.

Kits	Região Alvo	Entrada de DNA Genómico Necessária	Adição de Adaptador	Comprimento da Sonda (mer)
Agilent SureSelect XT2 V6 Exoma	60 Mb	100 ng	Ligadura	120
Agilent SureSelect XT2 V5 Exoma	51 Mb	100 ng	Ligadura	120
Painel Exómico IDT xGEN	39 Mb	500 ng	Ligadura	não descrito
Illumina Nextera Captura Rápida Exoma Expandido	62 Mb	50 ng	Transposase	noventa e cinco
Roche NimblegenSeqCap EZ Exoma v3.0	64 Mb	1 ug	Ligadura	60 - 90

Sequenciação: Com os avanços nas técnicas de sequenciação, a Sequenciação de Nova Geração (NGS) é mais extensivamente utilizada para sequenciação do exoma. A lógica por trás da NGS envolve acoplar a amostra do exoma a uma base apropriada (como o flowcell no Illumina Hiseq e as esferas magnéticas no Roche-454), seguido pela duplicação de PCR in situ para garantir a amplificação do sinal em cada ronda. O ddNTP é examinado após cada ronda de extensão, e a sequência completa é eventualmente compilada utilizando um algoritmo de bioinformática. A alta eficiência e as capacidades de elevado rendimento tornam a NGS uma opção atraente para sequenciação de alto rendimento.

Para além do NGS, as tecnologias de sequenciação de terceira geração estão a evoluir rapidamente e possuem eficiências que superam amplamente o NGS. A sequenciação de moléculas únicas, uma característica distintiva da sequenciação de terceira geração, pode reduzir drasticamente o tempo e o custo associados à sequenciação do genoma completo para meros minutos. Empresas como a PacificBio e a Oxford Nanopore demonstraram a eficiência dos seus métodos, que poderiam potencialmente incitar uma revolução no domínio da sequenciação do exoma.

Tabela 2. Métodos comuns utilizados para sequenciação atualmente.

Métodos	Empresa	Geração	Comprimento de leitura	Precisão	Leituras por execução	Tempo por corrida
Semicondutor iónico	Ion Torrent	2ª geração	Até 600 pb	99,60%	até 80 milhões	2 horas
Pirosequenciação (454)	Roche	2ª geração	700 bp	99,90%	1 milhão	24 horas
Sequenciação por síntese	Illumina	2ª geração	75-300 pb	99,90%	1 milhão a 3 mil milhões	1 a 11 dias
Sequenciação por ligadura (SOLiD)	ABI	2ª geração	50+35 ou 50+50 pb	99,90%	1,2 a 1,4 mil milhões	1 a 2 semanas
Sequenciação por Nanoporos	Oxford Nanopore Technologies	3ª geração	até 500 kb	92–97% (leitura única)*	dependente do comprimento de leitura selecionado pelo utilizador	1 minuto a 48 horas
Sequenciação em tempo real de molécula única	Pacific Biosciences	3ª geração	30.000 bp	87% (leitura única)*	10-20 mil milhões	0,5-20 horas

Análise de dados: O processo de análise de dados envolve a eliminação de leituras de baixa qualidade durante o sequenciamento através do controlo de qualidade, o alinhamento de leituras de alta qualidade com o genoma de referência, a quantificação de polimorfismos de nucleotídeo único (SNPs), inserções e deleções (Indels) e variações no número de cópias (CNVs), seguido de anotação, triagem, análise e validação. A análise de dados constitui um ponto crítico no sequenciamento do exoma, abrangendo a avaliação e processamento da qualidade dos dados de sequenciamento, o alinhamento das leituras de sequenciamento ao genoma de referência e a identificação de mutações genéticas nas amostras. As mutações genéticas detectadas precisam ser anotadas, incluindo a distinção da função da mutação, a sua significância patológica e o seu impacto potencial.

Figure2. The typical variant calling pipeline. Figura 2. O pipeline típico de chamada de variantes.

Vantagens do Sequenciamento do Exoma

Custo-efetividade: Comparado a Sequenciação do Genoma Completo, Sequenciação do Exoma Completo oferece uma cobertura mais profunda, maior precisão e é mais economicamente eficiente.

Alta profundidade de sequenciação: A profundidade de sequenciação pode ultrapassar os 120x.

Alto rendimento: Atende às necessidades de investigação de várias regiões-alvo a partir de um grande número de amostras.

Alta precisão: Com uma cobertura de sequenciamento profundo, a precisão dos dados é alta e eficiente.

Aplicação do Sequenciamento de Exoma

Sequenciação do exoma completo (WES) encontra aplicações em vários domínios da investigação biomédica, incluindo o estudo de monogénicos. doenças hereditáriasdoenças complexas, mutações somáticas em tumores, descoberta de oncogenes e genes supressores de tumores, e avanço de iniciativas de medicina personalizada.

Os tumores, sendo doenças complexas instigadas por múltiplas mutações genéticas, podem ser efetivamente compreendidos com a ajuda de sequenciação do exoma completo. Permite que cientistas e clínicos descubram variações em genes relacionados com tumores para alcançar um diagnóstico e prognóstico precisos do tumor. Isto inclui principalmente investigação sobre genes condutores, subtipagem molecular de tumores, investigação de metástases recorrentes e medicação personalizada para tumores individuais.

Os distúrbios genéticos frequentemente originam-se de mutações genéticas, que ocorrem frequentemente nas regiões exónicas que codificam proteínas. Os métodos tradicionais de deteção de mutações exigem uma investigação minuciosa de genes relacionados com a doença um de cada vez, o que é demorado, intensivo em mão-de-obra e requer um tamanho de amostra substancial. No entanto, o sequenciamento do exoma mitiga estas desvantagens ao investigar simultaneamente múltiplos genes relacionados com a doença, resultando em uma eficiência e precisão de deteção significativamente melhoradas. Ao aplicar o WES, podemos sequenciar todas as regiões exónicas necessárias para codificar proteínas, identificando posteriormente mutações genéticas ou loci polimórficos relacionados com o início da doença. Isto facilita o diagnóstico e tratamento precisos de distúrbios genéticos.

Figure3. WES and impact of its genetic consequences on human public health. Figura 3. WES e impacto das suas consequências genéticas na saúde pública humana. (Rabbani B et al., 2014)

O WES suscita um grande interesse para aplicações clínicas, principalmente porque abrange as regiões acionáveis dentro de um genoma. O objetivo principal é identificar variações nas regiões exónicas e determinar as mutações causais para doenças ou variantes patogénicas. A interseção da análise de grandes dados e do WES está a impulsionar avanços na medicina personalizada em várias dimensões.

Se estiver interessado nos nossos serviços de genómica, não hesite em contactar os nossos cientistas. Estamos mais do que felizes em ajudar. Além de sequenciação genómicatambém fornecemos serviços incluindo transcriptómica, epigenómica, genómica microbiana, e Sequenciação SMRT da PacBio.

Referências:

Warr A, Robert C, Hume D, et al. Sequenciação do exoma: perspetivas atuais e futuras. G3: Genes, Genomas, Genética, 2015, 5(8): 1543-1550.
Rabbani B, Tekin M, Mahdieh N. A promessa do sequenciamento do exoma completo na genética médica. Revista de Genética Humana, 2014, 59(1): 5-15.
Suwinski P, Ong C, Ling MHT, et al. Avançando a medicina personalizada através da aplicação de sequenciação do exoma completo e análise de grandes dados. Fronteiras em Genética, 2019, 10:49.
Shashi V, McConkie-Rosell A, Schoch K, et al. Considerações práticas na aplicação clínica do sequenciamento do exoma completo. Genética clínica, 2016, 89(2): 173-181.
Goh G, Choi M. Aplicação do sequenciamento do exoma completo para identificar variantes causadoras de doenças em doenças humanas hereditárias. Genómica e informática, 2012, 10(4): 214.
Albertsen H M, Matalliotaki C, Matalliotakis M, et al. O sequenciamento do exoma completo identifica deleções hemizigóticas nos genes UGT2B28 e USP17L2 numa família de três gerações com endometriose. Relatórios de Medicina Molecular, 2019, 19(3): 1716-1720.
Erjavec S O, Gelfman S, Abdelaziz A R, et al. O sequenciamento do exoma completo em Alopecia Areata identifica variantes raras em KRT82. Comunicações da Natureza, 2022, 13(1): 800.
Luo W, Zhang C, Jiang Y, et al. Reconstrução sistemática da biologia do autismo a partir de perfis massivos de mutações genéticas. A ciência avança, 2018, 4(4): e1701799.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.

Serviços Relacionados