Sequenciação PacBio e Amplificação MDA Baseada em Gotas: Pioneirismo na Genómica de Células Únicas Humanas

O campo da investigação científica foi transformado pelas notáveis capacidades do sequenciamento de longas leituras (LRS). Entre as inúmeras perspetivas emocionantes que oferece, um domínio destaca-se na sua fase exploratória - a genómica de células únicas humanas. Este campo de investigação em crescimento, com mais de uma década de história, está atualmente repleto de atividade e potencial. A genómica de células únicas, impulsionada pelo LRS, tem a capacidade de desvendar mistérios profundos dentro da biologia celular. Pode lançar luz sobre diversos temas, como variação genética em células somáticas, evolução tumoral, taxas de mutação de novo, recombinação meiótica em células germinativas e neurogenética. Alguns estudos pioneiros já demonstraram a notável capacidade do LRS de identificar doenças anteriormente desconhecidas resultantes de variações genéticas em humanos. Além disso, pode descobrir variantes genéticas clinicamente significativas escondidas nas enigmáticas regiões de 'DNA escuro' - secções do genoma humano que desafiam a análise através de métodos padrão de sequenciamento de curtas leituras (SRS).

Revolucionando a Genómica de Células Únicas com dMDA e Sequenciamento PacBio

O paradigma existente do sequenciamento do genoma completo de células únicas com curtas leituras deixa um número substancial de variantes inexploradas, particularmente devido à sua inacessibilidade com abordagens padrão. Além disso, o LRS exige uma quantidade substancial de DNA de entrada, apresentando desafios por si só. Para contornar problemas associados a preferências de amplificação, moléculas quiméricas e deleções alélicas, frequentemente resultantes da amplificação do genoma completo (WGA), este estudo emprega uma técnica inovadora de amplificação por deslocamento múltiplo em gotículas em nanoscale (dMDA).

Metodologia

Resumidamente, este estudo aproveitou o potencial da separação de células ativadas por fluorescência (FACS) para isolar uma única célula, libertando os seus fragmentos de DNA através da lise. Estas minúsculas moléculas de DNA foram então meticulosamente embaladas em aproximadamente 50.000 gotículas, cada uma medindo menos de 100 µm de diâmetro. Dentro destas gotículas, apenas um ou alguns fragmentos de DNA estavam presentes, facilitando uma amplificação controlada e limitada. Crucialmente, esta abordagem eliminou o risco de formação de quimeras intermoleculares. O experimento focou em duas células T CD8+ distintas, A e B, ambas provenientes do mesmo dador humano. Estas células passaram por amplificação clonal in vitro, seguida de amplificação do genoma completo (WGA) e sequenciamento.

MetodologiaVisão geral do experimento de amplificação e sequenciamento de DNA de células únicas. (Hård et al., 2023)

Deteção de SNVs em Células Únicas nos Dados de Sequenciamento de Longas Leituras

Neste estudo, os autores aproveitaram o poder da tecnologia de sequenciamento de células únicas, utilizando especificamente cinco amostras de células únicas dMDA, com duas originadas do clone de células T A e três do clone de células T B. Estas amostras passaram por sequenciamento PacBio, gerando uma média de 15,7 Gb de dados por célula única, enquanto o sequenciamento Illumina produziu uma substancial quantidade de 48,7 Gb de dados. Ambos os conjuntos de dados foram fundamentais para a subsequente identificação de SNVs de células únicas.

Notavelmente, uma média de 880.000 SNVs identificados nos dados de PacBio de células únicas exibiu concordância com os dados de PacBio em massa, solidificando a sua autenticidade como verdadeiros SNVs. Para fazer uma comparação significativa, os autores também submeteram os dados de dMDA de células únicas Illumina e os dados em massa à mesma análise, resultando numa média de 1,06 milhões de SNVs validados por célula.

Surpreendentemente, apesar de o sequenciamento de células únicas PacBio ter gerado apenas 32% do volume de dados produzido pela Illumina, o número de SNVs germinativos detectados estava à altura das descobertas da Illumina. Os autores realizaram ainda uma avaliação abrangente da precisão e sensibilidade da chamada de SNVs, revelando que, no geral, a sensibilidade era relativamente baixa, especialmente para as amostras PacBio com dados limitados disponíveis. No entanto, o PacBio superou a Illumina em termos de precisão na identificação de SNVs, embora com sensibilidade ligeiramente inferior.

Intrigantemente, 284.000 SNVs de alta confiança do PacBio escaparam à deteção nas amostras em massa da Illumina. Entre estas variantes, 6.336 residiam em regiões genéticas "escuras" previamente designadas, áreas tipicamente inacessíveis a métodos padrão de sequenciamento de curtas leituras. Notavelmente, uma dessas regiões abrangia tanto intrões como exões de NBPF8 e CDC73, este último existindo na lacuna deixada pelos dados em massa da Illumina.

Além disso, para além dos SNVs germinativos, os autores descobriram com sucesso 27 SNVs somáticos dentro dos dados do PacBio, aumentando ainda mais o alcance e a profundidade da sua investigação.

Deteção de SNVs em Células Únicas nos Dados de Sequenciamento de Longas LeiturasAnálise de SNVs em dados de células únicas de curtas e longas leituras. (Hård et al., 2023)

Aprimorando a Detecção de SVs com WGS de Células Únicas de Longas Leituras

Neste estudo, os investigadores utilizaram o Sniffles2 para identificar variantes estruturais (SVs) nos dados do PacBio, revelando numerosas deleções, inserções, duplicações e inversões por célula única. Mais de 80.000 SVs únicos do PacBio, principalmente provenientes de moléculas quiméricas dMDA, estavam ausentes nas amostras em massa.

Em média, cada célula única exibiu 5.473 SVs verdadeiros, sendo a maioria deleções e inserções, enquanto duplicações e inversões eram raras. Em contraste, as amostras da Illumina detectaram apenas 327 SVs verdadeiros, significativamente menos.

A precisão do PacBio para deleções e inserções foi de 0,73 e 0,66, com sensibilidade ligeiramente superior. Duplicações e inversões tiveram baixa precisão devido às suas origens quiméricas. Notavelmente, os SVs do PacBio consistiram principalmente em inserções e deleções até 1 kb, com um pico em torno de 300 bp (elementos repetitivos ALU) e 6 kb (elementos LINE). Algumas SVs desafiadoras nos dados da Illumina foram identificadas com sucesso no conjunto de dados de células únicas do PacBio, incluindo uma inserção de 710 bp e uma deleção de 4891 bp.

Aprimorando a Detecção de SVs com WGS de Células Únicas de Longas LeiturasAnálise de SVs em dados de células únicas de longas leituras. (Hård et al., 2023)

Análise de Repetições em Tandem de Células Únicas

Utilizando Genótipos em Tandem, os autores identificaram 15.098 TRs inicialmente categorizados como puros ou heterozigóticos nos dados em massa do PacBio. Em média, 4.770 alelos de TR puderam ser genotipados com precisão em células únicas com perfis semelhantes aos dados em massa.

A maior TR observada foi 662 pares de bases mais longa do que o genoma de referência, composta principalmente por sequências dinucleotídicas AT - um aspeto difícil de resolver em dados de curtas leituras. Embora não tenha sido encontrada evidência clara de variação somática clonal nos dados de longas leituras de células únicas, um número significativo de sequências repetitivas, especialmente aquelas que excedem 500 pares de bases, estavam ausentes em células únicas devido a falhas de genotipagem. Esta falha ocorria frequentemente quando uma amostra continha mais de dois comprimentos de repetição diferentes, dificultando a determinação precisa do tamanho da TR.

Análise de Repetições em Tandem de Células ÚnicasRepetições em tandem detectadas em dados de longas leituras de células únicas. (Hård et al., 2023)

Referência:

  1. Hård, Joanna, et al. "Análise do genoma completo de longas leituras de células únicas humanas." Nature Communications 14.1 (2023): 5164.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo