Os Métodos de Sequenciação do Genoma Completo
Visão Geral do Sequenciamento do Genoma Completo
O genoma de cada organismo individual contém toda a sua informação genética. Sequenciação do genoma completo A tecnologia pode analisar de forma abrangente e precisa genomas inteiros, quebrando assim a informação contida neles e revelando a complexidade e diversidade do genoma. O surgimento da tecnologia de sequenciação de genoma completo é um avanço revolucionário em todas as áreas das ciências da vida. A sequenciação de genoma completo pode detectar variantes, incluindo variantes de nucleotídeo único, inserções/deleções, alterações no número de cópias e variantes estruturais em grande escala. Sequenciação do genoma completo pode ser bifurcado em duas categorias com base na disponibilidade de um genoma de referência: sequenciação de novo e re-sequenciação. A presença de um genoma de referência simplifica e agiliza o processo de montagem do genoma.
Diferenças entre WGS e WES
Sequenciação do Exoma Completo (WES) envolve a utilização de técnicas de enriquecimento de alvos para capturar e sequenciar toda a região exónica do genoma. Este método pode detectar diretamente Polimorfismos de Nucleotídeo Único (SNPs) associados a variações funcionais em proteínas. Dentro do genoma humano, apesar de os exões (regiões codificadoras de proteínas) representarem apenas 1% do conteúdo génico, cerca de 85% das mutações causadoras de doenças estão localizadas nessas regiões, tornando o WES crucialmente significativo.
Sequenciação do Genoma Completo (WGS), por outro lado, refere-se ao sequenciamento de alto rendimento de todo o genoma, analisando variações interindividuais e anotando SNPs juntamente com estruturas genómicas. Devido às grandes quantidades de dados abrangentes que o WGS fornece, captura detalhes exclusivos que o WES ou sequenciação direcionada pode ser negligenciado. Com os avanços na tecnologia de sequenciamento e reduções substanciais nos custos associados nos últimos anos, o uso de WGS tornou-se cada vez mais viável. Além disso, o WGS tem a vantagem quando se trata de identificar SNPs, inserções e deleções; por isso, tornou-se uma escolha alternativa tanto para aplicações clínicas como para pesquisa básica.
Serviços que pode estar interessado em
Duas Abordagens Clássicas para Sequenciar Genomas Grandes
No início dos anos 80, Sanger completou com sucesso o sequenciamento do genoma completo do fago lambda utilizando o método shotgun, e este método foi aplicado com sucesso ao DNA de vírus maiores, ao DNA de organelas e ao sequenciamento do DNA do genoma bacteriano. O sequenciamento shotgun é uma estratégia clássica para o sequenciamento do genoma completo. A estratégia de sequenciamento shotgun fornece uma garantia técnica para o sequenciamento em larga escala. A tecnologia primeiro interrompe aleatoriamente uma sequência-alvo completa em pequenos fragmentos, sequenciados separadamente, e depois junta-os numa sequência consistente utilizando as relações de sobreposição desses pequenos fragmentos. Inclui principalmente dois métodos: um é o sequenciamento shotgun hierárquico (método clone a clone) e o outro é o sequenciamento shotgun do genoma completo.
Sequenciação clone a clone
Este método foi uma vez adotado pelo consórcio HGP. Este método pode gerar mapas de alta densidade, facilitando a montagem do genoma. Geralmente inclui quatro etapas: preparação da biblioteca de clones BAC, preparação da impressão digital dos clones, sequenciação dos clones BAC e montagem das sequências. No entanto, este método é demorado e dispendioso, pelo que é raramente utilizado atualmente.
Figura 1. Etapas envolvidas no sequenciamento clone por clone.
Sequenciação de Genoma Completo por Shotgun (WGS)
O WGS envolve geralmente seis etapas: isolamento de DNA genómico, fragmentação aleatória de DNA genómico, seleção de tamanho usando eletroforese, construção de biblioteca, sequenciação de extremidades pareadas (sequenciação PE) e montagem do genoma. Dois tamanhos diferentes de fragmentos de DNA, incluindo inserções longas (2-2,5 kb) e inserções curtas (0,5-1,2 kb), são selecionados a partir do gel de agarose. Enquanto as inserções longas são clonadas em vetores de fago ou socmid, as inserções curtas são clonadas em vetores de plasmídeo. A biblioteca de clones de inserção curta é utilizada para sequenciação a partir de ambas as extremidades. Uma vez que um grande número de clones é sequenciado, cada um dos genomas será coberto mais de 10 vezes. Os clones de inserção longa podem ser utilizados para aumentar a eficiência da montagem do genoma.
Figura 2. Etapas envolvidas no sequenciamento de genoma completo por shotgun.
Vantagens:
- Não requer mapas genómicos.
- Menos dispendioso em termos de tempo
- Dinheiro poupado
Desvantagens:
- A montagem do genoma para genomas eucarióticos é difícil devido à abundância de sequências repetitivas.
- O sequenciamento do genoma utilizando este método não é preciso.
NGS Acelera o WGS
Ao contrário das abordagens de bibliotecas baseadas em clonagem, as plataformas de sequenciação de próxima geração utilizam um método de construção de bibliotecas dramaticamente simplificado, o que simplificou e acelerou a sequenciação do genoma completo por shotgun. Em geral, o ADN genómico é primeiro fragmentado aleatoriamente utilizando sonicação ou nebulização, e depois é ligado a um conjunto específico de adaptadores de dupla fita para a plataforma, para gerar uma biblioteca de shotgun. Subsequentemente, estes fragmentos da biblioteca podem ser amplificados in situ por hibridação e extensão a partir de adaptadores complementares que estão covalentemente ligados à superfície de uma célula microfluídica de vidro ou a uma pequena esfera (dependendo da plataforma de sequenciação). Todos os instrumentos de NGS utilizam um dispositivo microfluídico para conter os fragmentos amplificados da biblioteca de shotgun, seguido de uma etapa de imagem que coleta dados dos fragmentos que estão a ser sequenciados ativamente.
Figura 3. Principais etapas na utilização de metodologias de sequenciação de DNA de alto rendimento (Ginsburg & Willard 2008).
Processo WGS
Vamos usar o sequenciador Illumina como exemplo para ilustrar o fluxo de trabalho do WGS baseado em sequenciação de alto rendimento.
- Construção da Biblioteca de Sequenciamento
O genoma é primeiro preparado e, em seguida, o DNA é fragmentado aleatoriamente em centenas de bases ou fragmentos mais curtos com adaptadores específicos em ambas as extremidades. Se o grupo de transcrição for sequenciado, a construção da biblioteca é um pouco mais complicada. Após a fragmentação do RNA, é necessário reverter para cDNA, adicionar o conector ou reverter o RNA para cDNA primeiro, depois fragmentar e adicionar a junção. O tamanho do fragmento (tamanho do inserto) tem um impacto na análise de dados subsequente e pode ser selecionado de acordo com as necessidades. Para sequenciação do genoma, geralmente são escolhidos vários tamanhos de inserto diferentes para obter mais informações durante a montagem.
- Afixação à Superfície e Amplificação de Ponte
A reação de sequenciação Solexa é realizada em um tubo de vidro chamado célula de fluxo, que é subdividida em 8 faixas, cada uma das quais possui um número de junções de fita simples fixas na superfície interna de cada faixa. O fragmento de DNA da junção foi transformado em uma fita simples e combinado com os primers no canal de sequenciação para formar uma estrutura em forma de ponte para a subsequente pré-amplificação.
- Desnaturação e Amplificação Completa
Os dNTP não rotulados e a enzima Taq comum foram adicionados para a amplificação por PCR em ponte de fase sólida, e a amostra de ponte de cadeia simples foi amplificada em um fragmento de ponte de cadeia dupla. Por desnaturação, uma cadeia simples complementar é liberada e ancorada à superfície sólida próxima. Ao ciclar continuamente, milhões de clusters de analitos de cadeia dupla serão obtidos na superfície sólida da célula de fluxo.
- Extensão de Base Única e Sequenciação
Quatro dNTPs marcados fluorescentemente, polimerases de DNA e primers de ligação foram adicionados às células de fluxo sequenciadas para amplificação. Quando cada cluster de sequenciamento estende a fita complementar, cada dNTP marcado fluorescentemente é adicionado para liberar a fluorescência correspondente. O sequenciador obtém informações de sequência do fragmento a ser testado ao capturar um sinal fluorescente e converter o sinal óptico em um pico de sequenciamento através de software de computador. O comprimento da leitura é afetado por vários fatores que causam atenuação do sinal, como o corte incompleto dos marcadores fluorescentes. À medida que o comprimento da leitura aumenta, a taxa de erro também aumentará.
- Análise de Dados
Este passo não é estritamente parte do processo de sequenciação, mas só faz sentido através do trabalho realizado antes deste passo. Os dados brutos obtidos pela sequenciação são uma sequência de apenas algumas dezenas de bases de comprimento, e os contigs que montam essas curtas sequências através de ferramentas de bioinformática são até a estrutura de todo o genoma. Alternativamente, essas sequências são alinhadas a um genoma existente ou a uma sequência de genoma de uma espécie semelhante, e analisadas mais a fundo para obter resultados biologicamente significativos.
Figura 4. O Processo WGS
Serviços que pode estar interessado em
Métricas de Sequenciação WGS
- Profundidade
A profundidade de sequenciamento, uma das métricas-chave utilizadas para avaliar o volume em genómica, é definida como a razão entre o total de pares de bases (pb) registados e o tamanho do genoma. Existe uma correlação direta entre a profundidade de sequenciamento e o nível de cobertura do genoma, de tal forma que um aumento na primeira contribui para uma diminuição nos resultados falso-positivos ou erros de sequenciamento. No contexto do sequenciamento individual, uma cobertura do genoma eficaz e o controlo de erros podem ser alcançados ao empregar estratégias de sequenciamento de extremidade dupla ou Mate-Pair, dado que a profundidade de sequenciamento está acima da faixa de 50X-100X. Esta profundidade substancial facilita, consequentemente, a posterior montagem de sequências em cromossomas, tornando o processo mais eficiente e preciso.
- Cobertura
Entretanto, a medida da cobertura de sequenciação refere-se à proporção do genoma total que é sequenciado com sucesso. Este indicador é um sinal significativo da aleatoriedade envolvida na sequenciação. A relação entre a profundidade de sequenciação e a cobertura pode ser efetivamente determinada através do renomado modelo de Lander-Waterman (1988). De acordo com este modelo, alcançar uma profundidade de sequenciação de 5X corresponde aproximadamente a uma cobertura de 99,4% do genoma total.
Aplicação de WGS
O WGS encontra aplicações em várias áreas, incluindo a determinação da taxa de mutação, estudos de associação em todo o genomadiagnósticos médicos, estudos pertinentes a variações raras, oncologia, investigações epidemiológicas e genética médica, entre outros.
Diagnóstico Médico
No domínio do diagnóstico médico, em 2009, a Illumina, a principal empresa de genómica, introduziu o seu primeiro sequenciador de genoma completo. Este foi um marco significativo, pois foi aprovado para uso clínico em vez de ser utilizado exclusivamente para fins de investigação. No mesmo ano, uma equipa liderada por Euan Ashley na Universidade de Stanford interpretou clinicamente o genoma humano completo do bioengenheiro Stephen Quake, simbolizando o estabelecimento prático desta tecnologia no campo do diagnóstico médico.
Genética Médica
A esfera da genética médica também aproveitou muito a natureza económica de sequenciação do genoma completoA WGS está a ser cada vez mais utilizada na decifração das bases genéticas de doenças mendelianas, bem como de doenças complexas, iluminando a nova biologia das doenças e proporcionando uma assistência substancial nos diagnósticos clínicos e nas estratégias de tratamento.
Frequências de mutação
O WGS facilita a identificação da taxa de mutação do genoma humano completo. A taxa de mutação entre diferentes gerações humanas (dos pais para os filhos) é de aproximadamente 70 novas mutações por geração.
Oncologia
Dentro da oncologia, a WGS abrangente abrange a reconstrução de subclones com base no DNA tumoral circulante.ctDNA) no plasma. Isto abre caminho para análises epigenómicas e genómicas aprofundadas, revelando a expressão dinâmica do DNA tumoral circulante em todas as situações.
Investigações Epidemiológicas
Em investigações epidemiológicas, o sequenciamento de genoma completo (WGS), com o seu poder discriminativo máximo na diferenciação de estirpes patogénicas estreitamente relacionadas, melhora significativamente as investigações epidemiológicas tradicionais de surtos de doenças infeciosas. Ao combinar o WGS com uma análise epidemiológica aprofundada, foram obtidas novas percepções sobre vários aspectos. Estes incluem as origens e dinâmicas de propagação de vastos surtos causados por Escherichia coli e Vibrio cholerae. Surtos hospitalares induzidos por Staphylococcus aureus resistente à meticilina (MRSA), Klebsiella pneumoniae e bacilos Abscessus também foram investigados. Surtos centrados na comunidade por Mycobacterium tuberculosis e surtos fúngicos ambientais associados a desastres naturais receberam uma análise abrangente devido à integração do WGS.
Se estiver interessado nos nossos serviços de genómica, não hesite em contactar os nossos cientistas. Estamos mais do que felizes em ajudar. Além de sequenciação genómica, também oferecemos serviços incluindo transcriptómica, epigenómica, genómica microbianae Sequenciação SMRT da PacBio.
Referências:
- Bentley D R. Re-sequenciamento do genoma completo. Opinião Atual em Genética e Desenvolvimento, 2006, 16(6):545-552.
- Fuentespardo A P, Ruzzante D E. Abordagens de sequenciação do genoma completo para a biologia da conservação: vantagens, limitações e recomendações práticas. Ecologia Molecular, 2017, 26(20):5369.
- Batzoglou S, Berger B, Mesirov J, et al. Sequenciamento de um genoma através da caminhada com sequências de extremidade de clones (resumo): uma análise matemática// Conferência Internacional sobre Biologia Molecular Computacional. DBLP, 2000:45.
- Sanger F, Coulson A R, Hong G F, et al. Sequência de nucleótidos do DNA do bacteriófago lambda. Revista de Biologia Molecular, 1982, 162(4):729-73.
- Kawarabayasi Y, Sawada M, Horikawa H, et al. Sequência completa e organização genética do genoma de uma arqueobactéria hipertermofílica, Pyrococcus horikoshii OT3. Pesquisa de DNA, 1998, 5(2):55.
- Kaneko T, Sato S, Kotani H, et al. Análise de sequência do genoma do cianobactério unicelular Synechocystis sp. estirpe PCC6803. II. Determinação da sequência do genoma completo e atribuição de regiões potenciais codificadoras de proteínas. Pesquisa de DNA, 1996, 3(3):185-209.
- Myers E W, Sutton G G, Delcher A L, et al. Uma Montagem de Genoma Completo. Ciência, 2014.
- Siegel A F, Engh G V D, Hood L, et al. Modelagem da Viabilidade do Sequenciamento de Genoma Completo por Shotgun Usando uma Estratégia de Extremidade em Par. Genómica, 2000, 68(3):237.
- White O, Fraser C M. Sequência do genoma da bactéria radioresistente Deinococcus radiodurans R1. Ciência, 1999, 286(5444):1571-1577.
- May B J, Zhang Q, Li L L, et al. Sequência genómica completa de Pasteurella multocida, Pm70. Atas da Academia Nacional de Ciências dos Estados Unidos da América, 2001, 98(6):3460-3465.
- Ginsburg G S, Willard H F. Medicina genómica e personalizada. Academic Press, 2008.
- Ormond K E, Wheeler M T, Hudgins L, et al. Desafios na aplicação clínica do sequenciamento do genoma completo. The Lancet, 2010, 375(9727): 1749-1751.
- Le V T M, Diep B A. Perspectivas selecionadas da aplicação do sequenciamento do genoma completo em investigações de surtos. Opinião atual em cuidados críticos, 2013, 19(5): 432-439.
- Wu J, Wu M, Chen T, et al. Sequenciação do genoma completo e suas aplicações em genética médica. Biologia Quantitativa, 2016, 4(2): 115-128.
- Ashley E A, Butte A J, Wheeler M T, et al. Avaliação clínica incorporando um genoma pessoal. The Lancet, 2010, 375(9725): 1525-1535.
- Roach JC, Glusman G, Smit AF, et al. Análise da herança genética em um quarteto familiar através do sequenciamento do genoma completo. Ciência, 2010, 328 (5978): 636–9.
- Campbell CD, Chong JX, Malig M; et al. Estimativa da taxa de mutação humana utilizando autozigoticidade numa população fundadora. Nat. Genet., 2012, 44 (11): 1277–81.
- Herberts Cameron, Annala Matti, Sipola Joonatan, et al. Cronologia profunda do ctDNA do genoma inteiro em cancro da próstata resistente ao tratamento. Natureza, 2022, 608 (7921): 199–208.