Visão Geral do Sequenciamento Direcionado
O que é Sequenciamento Direcionado?
Sequenciação direcionada (tNGS) envolve o enriquecimento preciso de regiões ou loci específicos dentro do genoma, seguido de sequenciação utilizando métodos de próxima geração, como a sequenciação de próxima geração. Isso inclui técnicas como a sequenciação do exoma completo, que se concentra nas regiões codificadoras de proteínas do genoma, bem como painéis de sequenciação personalizados adaptados para a investigação de genes específicos de interesse.
Leitura recomendada: WGS vs. WES vs. Painéis de Sequenciamento Alvo.
As plataformas de sequenciação de leitura curta e de leitura longa da CD Genomics facilitam a análise robusta de exomas e genomas. Esta abordagem avançada de sequenciação direcionada permite uma exame abrangente e eficiente do material genético, proporcionando informações valiosas sobre a paisagem molecular e potenciais biomarcadores associados a várias condições.
História do Sequenciamento Direcionado
A origem do sequenciamento de genes na investigação em ciências da vida remonta a momentos cruciais na história da ciência:
Em 1977, Walter Gilbert e Frederick Sanger pioneiros do primeiro sequenciador, utilizando a sequenciação por terminação de cadeia para decifrar a sequência do genoma do fago X174, que abrange 5.375 bases. Esta descoberta marcou o início formal da sequenciação de genes na exploração científica.
Baseando-se nesta fundação, em 1988, Chambehian et al. introduziram a tecnologia de PCR multiplex, estabelecendo as bases para os avanços subsequentes nas metodologias de sequenciação de amplicões de PCR multiplex.
Um marco significativo na evolução de sequenciação direcionada ocorreu em 2005, quando a Nature Methods publicou um artigo intitulado "Seleção Genómica Direta." Esta abordagem utilizou DNA BAC rotulado com biotina de 150kb para hibridização com DNA genómico humano, seguido pela captura de fragmentos de DNA utilizando esferas de afinidade de estreptavidina. A amplificação por PCR subsequente facilitou o sequenciamento, revelando que aproximadamente 50% dos fragmentos sequenciados provinham da região alvo.
Hoje, o sequenciamento direcionado utiliza predominantemente duas metodologias: captura direcionada e PCR multiplex, também conhecida como sequenciamento de amplicões.
Sequenciação Alvo vs. Sequenciação do Genoma Completo
Sequenciação do genoma completo (WGS) envolve o sequenciamento de todas as bases do genoma inteiro, proporcionando um perfil abrangente da sequência do genoma. As suas principais aplicações incluem a montagem do genoma e a identificação de várias variantes genómicas, incluindo variantes estruturais.
Sequenciação Direcionada (também conhecido como sequenciação de painel genético) sequencia seletivamente genes específicos, tipicamente variando de algumas dezenas a mil genes. Portanto, em termos de cobertura do genoma, a sequenciação do genoma completo > sequenciação do exoma completo > sequenciação direcionada.
A Sequenciação do Exoma Total pode ser vista como um subconjunto da sequenciação direcionada, focando exclusivamente na sequenciação de todos os exões dentro do genoma.
O WGS oferece o mais extenso alcance de deteção, abrangendo regiões codificantes e não codificantes, assim como regiões regulatórias e variantes estruturais. Mas, em comparação com o sequenciamento direcionado, o WGS tem algumas limitações.
- As complexidades de análise e interpretação surgem da deteção de numerosos intrões e variantes intragénicas.
- Incur custos de deteção mais elevados em comparação com o WES, particularmente ao garantir a profundidade e a qualidade dos dados.
- Requer metodologias complexas para armazenamento, análise e anotação de dados devido ao aumento do volume de dados.
- A falta de referência para variantes raras em grandes amostras pode dificultar a análise de patogenicidade.
Em comparação, o sequenciamento direcionado permite um sequenciamento profundo devido à sua região de deteção menor (por exemplo, os exões representam apenas 1% de todas as sequências genéticas humanas). Isso possibilita a deteção de variantes de baixa frequência e raras, ao mesmo tempo que reduz custos e requisitos de armazenamento. Portanto, o sequenciamento direcionado oferece uma solução mais económica, especialmente para projetos de investigação com financiamento limitado e estudos focados em doenças causadas por variantes de proteínas codificantes.
Métodos de DNA-seq. (Bewicke-Copley et al., 2019)
Sequenciação Alvo por Captura de Hibridização
A captura por hibridização é uma sequenciação direcionada maravilha, fundindo de forma harmoniosa a hibridação molecular com técnicas de sequenciação de próxima geração. Este método sofisticado baseia-se no design e síntese meticulosos de sondas adaptadas à região genómica-alvo. Estas sondas, atuando como ímanes moleculares, ligam-se seletivamente aos fragmentos desejados dentro da região-alvo, enquanto segmentos extraneous são rapidamente removidos.
- Hibridação em Fase Sólida: Esta variante envolve a ligação da sonda a um chip em fase sólida, facilitando a captura da região-alvo através de interações precisas entre a sonda e o alvo.
- Hibridação em Fase Líquida: Nesta iteração, o processo experimental desenrola-se num meio líquido. Os sondas estão equipadas com grupos biotina, permitindo a sua recuperação após a hibridação utilizando esferas magnéticas revestidas de estreptavidina. Após a conclusão da hibridação, estas esferas aprisionam seletivamente os fragmentos-alvo ligados às sondas. A subsequente eluição remove da solução os fragmentos não ligados, seguida de desnaturação para libertar os fragmentos-alvo capturados. Através de uma captura magnética estratégica, as sondas residuais não ligadas são então removidas, assegurando a pureza e a completude das sequências capturadas.
A captura por hibridização orquestra assim uma sinfonia de interações moleculares, culminando na isolação e sequenciação precisas de regiões genómicas-alvo.
Sequenciação Direcionada por PCR Multiplex
PCR multiplexo sequenciação direcionada, também referido como sequenciação de amplicões direcionados, integra perfeitamente a tecnologia de PCR multiplex com métodos de sequenciação de nova geração. Esta abordagem inovadora permite a amplificação simultânea de múltiplas sequências de regiões-alvo, resultando em produtos de amplicão. Subsequentemente, sequências de adaptadores necessárias para a sequenciação de nova geração são introduzidas em ambas as extremidades dos produtos de amplicão, alcançado através de amplificação por PCR ou reações de ligadura enzimática. Este passo transforma os amplicões em bibliotecas prontas para a sequenciação de nova geração.
Após a preparação da biblioteca, é realizada a sequenciação de nova geração, seguida de uma análise dos dados brutos. Este processo abrangente gera informações de sequência específicas para as regiões-alvo, cumprindo o objetivo principal da sequenciação direcionada.
- Aplicações Comuns
A sequenciação direcionada por PCR multiplex encontra ampla aplicação em diversos campos. Por exemplo, no domínio da deteção de patógenos, esta técnica facilita a análise da composição e distribuição da comunidade de microrganismos patogénicos. Essas análises desempenham um papel crucial no diagnóstico de infeções patogénicas clínicas, contribuindo significativamente para a gestão e estratégias de tratamento de doenças.
A sequenciação direcionada por PCR multiplex surge assim como uma ferramenta versátil, facilitando a deteção e caracterização precisas de regiões genómicas-alvo em diversas aplicações.
Tabela 1 Diferenças entre WGS, painéis de NGS por captura de hibridação e painéis de NGS por PCR multiplex
| Sequenciação do Genoma Completo | Captura por Hibridização (Sequenciação do Exoma) | PCR multiplex (Sequenciação do Exoma) | |
| Tamanho da Região Alvo | 3 G (humano) | 50 M | 10 kb - 5 M (variável) |
| Cobertura do Genoma | 100% do genoma | 1,30% (variável) | <0,1% (variável) |
| Custo de Construção da Biblioteca | $ | $$ | $$ (variável) |
| Profundidade de Sequenciamento Típica | 30x | 100x | 500-10.000x |
| Volume de Dados de Sequenciamento | 90 Gb | 5 Gb | 1 Gb (variável) |
| Custo de Sequenciamento | $$$ | $$ | $ (variável) |
| Custo de Armazenamento de Dados | $$$ | $$$ | $ |
| Dificuldade em Analisar Dados Brutos | Alta Complexidade | Complexidade Média | Baixa Complexidade |
Avaliação de Dados para Sequenciação Direcionada
A qualidade dos dados obtidos a partir da captura da região do gene alvo é avaliada principalmente através dos seguintes indicadores-chave: cobertura da região alvo, eficiência de captura e homogeneidade da cobertura da região alvo.
- Cobertura da Região AlvoEsta métrica denota a proporção de regiões detectadas em comparação com a região-alvo total. Idealmente, todas as regiões de interesse deveriam ser cobertas. No entanto, devido a considerações de design de sondas, como o conteúdo de GC, características da sequência, variação no número de cópias e similaridade de sequência, uma pequena fração da região-alvo pode ser excluída da captura, tipicamente em torno de 0-3%. Geralmente, uma maior cobertura do alvo indica um melhor desempenho da sonda ou da PCR multiplex.
- Eficiência de CapturaEsta medida representa a percentagem de dados alinhados à região-alvo em relação ao total de dados obtidos. Uma maior eficiência de captura reflete uma maior utilização dos dados de sequenciação. É crucial avaliar as características da sequência ao projetar sondas. Sondas que se ligam frequentemente a regiões de sequência duplicadas ou de alta cópia podem capturar regiões não-alvo, reduzindo assim a eficiência de captura. Projetar sondas mais específicas pode mitigar a ligação a sequências não específicas, melhorando assim a eficiência de captura.
A avaliação destes parâmetros garante a fiabilidade e eficácia dos dados de sequenciação direcionada, proporcionando informações valiosas sobre as regiões genómicas pretendidas.
Fluxo de trabalho de amostragem e processamento de dados de sequenciação de próxima geração direcionada. (Gulilat et al., 2019)
Fatores que Influenciam a Eficiência de Captura
- Regiões de Alto GCRegiões como regiões não traduzidas (UTRs) e promotores frequentemente apresentam um elevado conteúdo de GC, levando a eficiências de captura mais baixas. Esta discrepância na eficiência de captura entre regiões de alto GC e outras pode resultar em uma cobertura desigual.
- Qualidade do DNAA qualidade do DNA de entrada impacta significativamente o viés de captura, particularmente evidente em amostras extraídas de tecidos fixados em formalina e embebidos em parafina (FFPE), onde os níveis de fragmentação variam. A utilização de instrumentos de eletroforese automatizados da Agilent, como o 2100 Bioanalyzer ou o Tapestation analyzer, para controlo de qualidade assegura uma captura equilibrada e minimiza o viés na análise subsequente.
- Quantidade de Entrada de DNAA insuficiência de DNA de entrada exige ciclos adicionais de PCR durante a construção da biblioteca, aumentando os duplicados de PCR e diminuindo a utilidade dos dados. Os avanços na tecnologia reduziram a quantidade de DNA necessária de microgramas para nanogramas para sequenciação direcionada.
- PseudogenesA presença de pseudogenes pode perturbar a uniformidade da cobertura, afetando a precisão dos dados.
- Tamanho do Fragmento de DNAO emparelhamento ótimo do tamanho dos fragmentos ao design da sonda melhora a eficiência de captura. A utilização de instrumentos de eletroforese automatizados da Agilent, como o 2100 Bioanalyzer, garante uma deteção precisa do tamanho dos fragmentos.
- Elementos RepetidosElementos repetidos podem dificultar a uniformidade da distribuição das leituras dentro do exoma, necessitando de uma maior profundidade de sequenciamento para a deteção de SNPs.
- Homogeneidade de CoberturaGarantir uma profundidade de cobertura uniforme entre regiões é vital para dados de alta qualidade. Alcançar uma cobertura de alta homogeneidade envolve uma cuidadosa construção da pré-biblioteca. Métodos como a fragmentação de DNA imparcial, o uso de enzimas de amplificação com baixa preferência por conteúdo de GC, a minimização dos ciclos de enriquecimento por PCR e a otimização do design de sondas e das condições de hibridação melhoram a homogeneidade da cobertura durante os experimentos de captura.
Aplicações de Sequenciação Direcionada
Sequenciação direcionada serve como um complemento valioso ao sequenciamento de genoma completo, simplificando tanto os procedimentos experimentais como os objetivos analíticos. A sua natureza rápida e eficaz criou um nicho único no sequenciamento de alta capacidade de próxima geração, com uma gama crescente de áreas de aplicação.
- Ensaios de Tipagem de SNP: O sequenciamento direcionado facilita ensaios de tipagem de polimorfismos de nucleotídeo único (SNP), permitindo uma análise precisa da variação genética.
- Sequenciação do Exoma CompletoAo focar-se nas regiões codificadoras de proteínas, o sequenciamento do exoma completo com abordagens direcionadas oferece informações sobre a variação genética associada a doenças e características.
- Identificação de Linhas: O sequenciamento direcionado ajuda na identificação e caracterização de linhas genéticas específicas, sendo crucial em programas de melhoramento e estudos genéticos.
- Análise de Hereditariedade Populacional: Estudar variações genéticas entre populações ajuda a compreender a hereditariedade e a diversidade genética, fundamentais para a genética populacional e estudos evolutivos.
- Organoide de FolhaSequenciação do Genoma MitocondrialO sequenciamento direcionado de genomas de organelas específicas ou regiões específicas de tecidos fornece informações valiosas para compreender o desenvolvimento de organoides ou a genética mitocondrial.
- Tecnologia de Captura: Tecnologias de captura direcionada permitem o sequenciamento preciso de regiões genómicas específicas, oferecendo flexibilidade e eficiência no design experimental.
- Triagem de Traços Dominantes: O sequenciamento direcionado facilita a identificação de variantes genéticas subjacentes a traços dominantes, ajudando na mapeação de traços e nos esforços de melhoria genética.
- Localização de QTL: Mapeamento de Locus de Característica Quantitativa (QTL) usando sequenciação direcionada ajuda a identificar regiões genómicas associadas a características complexas, melhorando a nossa compreensão das relações genótipo-fenótipo.
- Desenvolvimento de Marcadores Moleculares para Melhoramento: O sequenciamento direcionado contribui para o desenvolvimento de marcadores moleculares para programas de melhoramento, permitindo a seleção assistida por marcadores e a melhoria acelerada das culturas.
- Sequenciação de MetilaçãoA sequenciação direcionada permite uma análise precisa dos padrões de metilação do DNA, oferecendo insights sobre a regulação epigenética e a dinâmica da expressão génica.
- Classificação de Espécies, Desenvolvimento Filogenético: O sequenciamento direcionado ajuda na classificação de espécies e em estudos filogenéticos ao examinar regiões ou marcadores genómicos específicos, iluminando as relações evolutivas e a biodiversidade.
Referências:
- Bewicke-Copley, Findlay, et al. "Aplicações e análise de sequenciação genómica direcionada em estudos de cancro." Revista de Biotecnologia Computacional e Estrutural 17 (2019): 1348-1359.
- Gulilat, Markus, et al. "Sequenciação de próxima geração direcionada como uma ferramenta para a medicina de precisão." BMC genómica médica 12 (2019): 1-17.