O Genoma T2T Completo por Sequenciação Abre a Porta para a Era Pós-genómica

Em 2021, no 20º aniversário do lançamento do esboço da sequência do genoma humano, o consórcio Telomere-to-Telomere (T2T) anunciou a mais recente sequência completa do genoma humano, CHM13v1.1, que não só contém todas as sequências não resolvidas, mas também corrige os erros de montagem originais, tornando-se a sequência de genoma humano mais completa até à data. Os resultados incluem a montagem contínua de todos os 22 autossomas humanos e dos cromossomas X, exceto o cromossoma Y, completando uma tarefa desafiadora que 8% do Projeto Genoma Humano ainda não conseguiu resolver.

Contexto

Os telómeros são a parte terminal dos cromossomas lineares eucarióticos, uma região estrutural especial que desempenha um papel importante na estrutura e estabilidade dos cromossomas lineares. O DNA dos telómeros é composto por sequências de DNA altamente repetitivas e simples que são difíceis de montar.

A versão mais recente do atlas do genoma humano foi lançada em 2013 antes do lançamento do genoma humano completo e foi chamada GRCh38. Desde então, tem sido repetidamente corrigida. Até à data, ainda possui lacunas, faltando mais de 8% do genoma, incluindo todos os arranjos de satélites das regiões mitóticas, telómeros, grandes repetições do genoma e regiões de rRNA que há muito estão em um estado de sequência desconhecido ou incognoscível. Esses genomas em falta estão ocultos em longas sequências com um grande número de cópias repetitivas de genes, que não podem ser aperfeiçoadas por técnicas de montagem e comprimento de leitura curta.

Com as tecnologias de sequenciamento de leitura longa da Pacific Biosciences (PacBio) HiFi e da Oxford Nanopore Technologies (ONT), superando a baixa capacidade de rendimento do sequenciamento Sanger e o comprimento de leitura curta das tecnologias de sequenciamento de leitura curta, combinadas com a otimização contínua dos algoritmos de montagem, cada vez mais genomas perfeitos de organismos modelo estão sendo publicados.

Mapa Completo do Genoma T2T

Usando dados de sequenciamento ultra-longo da ONT e dados HiFi da PacBio com alta precisão e longas sequências, os pesquisadores do consórcio T2T montaram e publicaram o primeiro mapa de conclusão do cromossoma X humano, o mapa de conclusão dos autossomas e o mapa de conclusão do genoma humano, e os resultados relacionados foram publicados na Science e em outras revistas.

O objetivo do genoma T2T é obter um genoma de alta qualidade com alta precisão, continuidade e completude do telómero ao telómero. Os pesquisadores completaram a montagem do genoma ao nível do cromossoma, combinando a tecnologia Hi-C para obter informações sobre as posições relativas dos genes nos cromossomas, e ajustes manuais para regiões complexas para obter a sequência do genoma de referência T2T.

O Genoma T2T Completo Abre a Porta para a Era Pós-GenómicaA montagem do genoma humano T2T-CHM13 completa (Nurk S et al., 2022)

Neste mapa de genoma humano completo, os investigadores adicionaram ou corrigiram 238 Mb de novas sequências, das quais 182 Mb eram completamente novas, e anotaram 2.226 novos genes. Como resultado, os resultados eliminam dezenas de milhares de variantes falsas positivas em cada amostra, incluindo a redução de falsos positivos para 269 testes genéticos relevantes para a medicina em mais de 90%.

Além do genoma humano telómero-a-telómero, a sequência completa do genoma T2T de Arabidopsis foi montada. Usando dados HiFi da PacBio e dados ultra-longos da ONT, um mapa quase completo de Arabidopsis contendo cinco telômeros foi montado: os cromossomas 1, 3 e 5 contêm a sequência completa do telómero ao telómero, enquanto os cromossomas 2 e 4 permanecem não montados na região de rDNA 45s do braço curto e na região telomérica adjacente. Através da identificação e análise de sequência, os pesquisadores revelam um modelo para o processo de homogeneização baseado em recombinação em Arabidopsis, avançando o estudo da estrutura e função dos telômeros, bem como dos mecanismos evolutivos.

Significado

A montagem do genoma T2T é muito difícil, e ainda é complicado ler através de regiões com longas sequências repetitivas, assim como regiões mitóticas em algumas espécies, pelas tecnologias atuais de sequenciamento e análise de dados. A atual montagem do genoma humano contorna alguma complexidade usando uma linha celular haploide com extensões de estafilococos humanos para evitar sequenciar 2 cromossomas X diferentes. Desde então, a construção de um genoma de referência mais perfeito contendo informações T2T, de haplótipos e de cromossomas sexuais se tornará uma tendência de pesquisa em genómica. E sequências de genoma de referência T2T de alta qualidade podem ajudar a revelar informações genéticas mais importantes sobre doenças, envelhecimento, evolução e outros processos vitais importantes.

Serviços Recomendados

A CD Genomics oferece Sequenciamento de Genoma Humano Completo PacBio SMRT e Sequenciamento de Genoma Completo baseado em Illumina, sequenciamento Nanopore e sequenciamento PacBio SMRT. Fornecemos serviços abrangentes de sequenciamento de genoma, incluindo sequenciamento, montagem e análise de dados para uma variedade de espécies.

Referências:

  1. Nurk S, Koren S, Rhie A, et al. A sequência completa de um genoma humano. Science, 2022, 376(6588): 44-53.
  2. Logsdon, G. A. et al. A estrutura, função e evolução de um cromossoma humano completo 8. Nature 593, 101–107 (2021).
  3. Naish, M. et al. A paisagem genética e epigenética dos centrômeros de Arabidopsis. Science 374, eabi7489 (2021).
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo