Visão geral do sequenciamento PacBio SMRT: princípios, fluxo de trabalho e aplicações
Visão geral do sequenciamento PacBio
Sequenciação da Pacific Biosciences (PacBio) incorpora um método de sequenciação de terceira geração vital, na terminologia técnica, denominado "Sequenciação de DNA em Tempo Real de Molécula Única (SMRT)". Esta abordagem direta contorna a necessidade de amplificação de DNA, facilitando a leitura rápida da sequência. Em contraste com os procedimentos de sequenciação convencionais que exigem a fragmentação do DNA em porções menores para sequenciação, Sequenciação PacBio, por outro lado, realiza a leitura em tempo real de toda a molécula de DNA à medida que passa por um aparelho de sequenciação especializado.
Desde a sua criação em 2005, a PacBio tem sido uma pioneira no campo da genómica com o advento da sua tecnologia única de sequenciação em Tempo Real de Moléculas Únicas (SMRT). Ao aproveitar o poder das matrizes de Guia de Onda de Modo Zero (ZMW), a tecnologia SMRT permite a sequenciação em tempo real de moléculas de DNA com comprimentos de até dezenas de milhares de pares de bases.
Em 2010, a PacBio revelou o seu sistema de sequenciação SMRT, o PacBio RS, que apresentava vantagens como alta capacidade de processamento, leituras longas e precisão. Em 2015, após melhorias consideráveis nos reagentes e no software de análise, a plataforma RSII da PacBio começou a ganhar destaque no campo da investigação genómica. Um fluxo constante de artigos utilizando esta tecnologia foi publicado em revistas renomadas como a Nature e a Science. Especificamente, vários artigos de investigação sobre o genoma humano, abordando tudo, desde o aprimoramento do genoma até o desenvolvimento de algoritmos de montagem, apareceram em rápida sucessão.
Nos últimos anos, a PacBio tem continuamente refinado a sua tecnologia de sequenciação, levando ao lançamento dos sistemas Sequel II e Sequel IIe. Estas plataformas de segunda geração aumentam significativamente a eficiência e a precisão da sequenciação, graças ao hardware e software melhorados que suportam o processamento CCS diretamente no instrumento. Isso permite que os clientes utilizem diretamente as leituras HiFi para análises subsequentes. Estas melhorias minimizam a complexidade do fluxo de trabalho, aceleram a entrega de resultados e reduzem o custo total do sistema, contribuindo para a democratização da investigação em genómica.
Serviço que pode interessá-lo
Princípio da sequenciação SMRT da PacBio
A utilização de Sequenciação PacBio abra uma metodologia caracterizada pela síntese e sequenciação simultâneas, utilizando o chip SMRT como vetor de sequenciação. Esta técnica opera com base no princípio da atividade da DNA polimerase. Fundamentalmente, a DNA polimerase liga-se ao DNA molde, onde cada uma das quatro bases nucleotídicas (dNTPs) é marcada fluorescentemente com cores distintas.
Durante a fase de emparelhamento de bases, a incorporação de diferentes nucleotídeos emite comprimentos de onda de luz variados, discerníveis pelos seus respectivos picos e comprimentos de onda. Além disso, a enzima DNA polimerase desempenha um papel fundamental na obtenção de leituras excepcionalmente longas, uma característica atribuída à sua atividade enzimática. O comprimento das leituras correlaciona-se principalmente com a manutenção da atividade da enzima, que, por sua vez, é influenciada significativamente pelos danos causados pela irradiação a laser.
A construção da biblioteca PacBio de terceira geração envolve a ligação das extremidades das moléculas de DNA de cadeia dupla (fragmentos com comprimentos que variam entre 10-20kb ou mais) com adaptadores PacBio que possuem estruturas em forma de alça. Isso resulta na molécula de DNA assumindo uma estrutura em forma de haltere conhecida como biblioteca SMRTbell. Durante a sequenciação, a polimerase emite um sinal fluorescente sob a influência dos nucleotídeos marcados com fluorescência. Este sinal é recolhido por uma câmara de dispositivo de carga acoplada (CCD). O procedimento é repetido na biblioteca cíclica, permitindo assim que a sequenciação seja concluída.
O Sequenciação SMRT da PacBio utiliza a inovadora tecnologia de Guia de Onda de Modo Zero (ZMW) para diferenciar os sinais de fluorescência ideais dos intensos fundos fluorescentes causados por nucleotídeos flutuantes livremente. A DNA polimerase ligada e a cadeia de DNA molde estão fixadas à superfície de vidro na base do ZMW. Os lasers percolam através da base do ZMW, mas não penetram totalmente devido ao fato de que o tamanho do ZMW é menor do que o comprimento de onda da luz. Assim, permite a excitação seletiva e o reconhecimento da luz emitida pelos nucleotídeos utilizados para a extensão da base.
Fluxo de trabalho da sequenciação SMRT da PacBio
O fluxo de trabalho de Sequenciação PacBio envolve etapas como preparação de amostras, construção de bibliotecas, reação de sequenciação, análise de dados e interpretação de resultados.
A preparação da amostra envolve principalmente a isolação de DNA das amostras a serem testadas. As amostras de DNA podem ser obtidas de bactérias, plantas, animais ou células humanas.
A construção da biblioteca abrange várias etapas: avaliar a qualidade do DNA genómico (gDNA), fragmentar o gDNA utilizando um g-TUBE (Covaris); selecionar o tamanho e ajustar a concentração; reparar danos no DNA e nas extremidades dos fragmentos de DNA; purificar o DNA; realizar a ligação de extremidades cegas utilizando adaptadores em forma de grampo; e purificar o template para submissão ao sequenciador.
Figura 1. Fluxo de Trabalho de Preparação de Template para o sistema PacBio RS II.
Para a reação de sequenciação, como ilustrado na Figura 2, o SMRTbell (mostrado em cinza) difunde-se para o Guia de Onda de Modo Zero (ZMW) e o adaptador liga-se à polimerase fixada na parte inferior. Os quatro tipos de nucleotídeos estão marcados com diferentes corantes fluorescentes (representados como vermelho, amarelo, verde e azul, correspondendo a G, C, T e A, respetivamente), tendo assim espectros de emissão distintos. A polimerase produz um pulso de luz que identifica a base quando retém o nucleotídeo no volume de deteção.
A reação envolve o nucleótido marcado com fluorescência a ligar-se ao molde no local ativo da polimerase. (1) A fluorescência aumenta em correspondência com a base incorporada (aqui C representada em amarelo). (2) O conjugado de pirofosfato marcado com corante se separa do nucleótido e difunde-se para fora do ZMW, terminando o pulso fluorescente. (3) A polimerase avança para a próxima posição. (4) O nucleótido seguinte liga-se ao molde no local ativo da polimerase, iniciando o subsequente pulso fluorescente, correspondente à base A neste contexto.
Figura 2. Sequenciação através de pulsos de luz.
A análise bioinformática, como montagem de novo, mapeamento de genoma de referência, anotação genómica (previsão de genes patogénicos e de susceptibilidade, previsão de RNA não codificante, previsão de CRISPRs), anotação de função genética (COG/GO/KEGG), identificação de SNP/InDel, análise genómica comparativa e análise evolutiva e estimativa do tempo de divergência, são passos viáveis.
Figura 3. Sequenciação e montagem do transcriptoma completo de C. album pelo método SMRT. (Ye et al., 2024)
Vantagens da Sequenciação PacBio
Sequenciação PacBio tem muitas características excelentes, conforme segue:
Comprimento de leitura de sequenciamento excepcionalmente longo: O comprimento médio de leitura de sequenciamento pode atingir 8-15kb, com as sequências mais longas a chegarem até 40-70kb.
Alta precisão: Para a montagem do genoma e deteção de variantes genómicas, pode-se alcançar uma precisão de até 99,999%. Ao utilizar um modo de sequenciação especial, a precisão da sequenciação pode atingir 99% ao nível de molécula única, com um comprimento de leitura que ultrapassa o método clássico de sequenciação Sanger.
Sensibilidade extrema: Pode detectar variantes menores com uma frequência de 0,1%.
Deteção de modificação de base ampla direta: Além da deteção da modificação 5-metilcitosina, também podem ser identificadas N6-metiladenina, N4-metilcitosina, danos por oxidação no DNA e outras modificações de bases.
Viés mínimo de GC: A deteção confortável é possibilitada em áreas de GC extremamente alto e extremamente baixo, garantindo assim uma cobertura de sequência uniforme.
Sem viés de amplificação por PCR: A amplificação por PCR não é necessária para as amostras, evitando assim a cobertura desigual e a redundância da PCR.
Epigenética: Como não há uma fase de amplificação por PCR, as modificações de bases podem ser detetadas diretamente durante a sequenciação. A necessidade de modificações químicas para detetar modificações de bases é descartada devido à medição das alterações na cinética da polimerase durante a incorporação de bases de DNA. Isso permite a captura simultânea de informações de sequência e epigenéticas dentro de um único experimento.
Diferenças entre PacBio, Illumina e Nanopore
O princípio da sequenciação Illumina baseia-se na acumulação de milhares de sinais de fluorescência para sequenciar com precisão nucleotídeos individuais, produzindo leituras relativamente curtas para processamento de dados, com comprimentos de leitura de até 600 bp e uma taxa de erro mínima de 1%. Além da alta precisão, oferece uma grande saída de dados e preços relativamente mais baixos. No entanto, a sequenciação Illumina, baseada em PCR, tende a apresentar viés de GC e é limitada pelos seus comprimentos de leitura mais curtos, tornando-a inadequada para a montagem de longas sequências repetitivas e restringindo as suas aplicações mais amplas, como a montagem de genomas e a deteção de longas RNAs não codificantes.
Sequenciação PacBio, também conhecido como sequenciação em Tempo Real de Molécula Única (SMRT), utiliza a tecnologia de Guia de Onda em Modo Zero (ZMW) para confinar moléculas de DNA individuais e DNA polimerase dentro de um poro ZMW, permitindo a sequenciação enquanto se sintetiza, obtendo assim facilmente comprimentos de leitura de dezenas de quilobases com uma qualidade média de leitura de até 99%. No entanto, devido à independência dos poros ZMW e à sequenciação em tempo real, a taxa de erro das leituras chegou a 15%, apresentando desafios significativos para a análise de dados subsequente. Recentemente, a PacBio introduziu o modo CCS, que reduz drasticamente a taxa de erro através da sequenciação múltipla de moléculas individuais. Este método de sequenciação é particularmente adequado para montagem de genomas, metilação de DNA, metilação de RNA, deteção de variações estruturais e análise de transcriptoma de Long-reads.
Sequenciação por nanopore alcança comprimentos de leitura longos de até várias dezenas de quilobases, guiando moléculas de DNA ou RNA através de nanoporos numa membrana, com registos que ultrapassam megabases (como a obtenção de dados de sequenciação de 2,3Mb no genoma humano). Este método de sequenciação não depende da amplificação por PCR, evitando assim problemas de viés de GC. Embora os tipos de erro consistam principalmente em inserções e deleções, estes são aleatórios, e as taxas de erro podem ser reduzidas através de sequenciação repetida. Isso torna sequenciação por nanoporo vantajoso na montagem do genoma, sequenciação direta de RNA e deteção de mutações somáticas.
Em conclusão, cada um destes três métodos de sequenciação tem as suas próprias vantagens e desvantagens, e a escolha da estratégia de sequenciação deve ser baseada nos requisitos específicos da pesquisa.
Serviço que pode interessá-lo
Aplicações da sequenciação SMRT da PacBio
Sequenciação SMRT da PacBio tem aplicações multifacetadas, como sequenciação de genomas completos de novo, otimização ou mapeamento de rascunhos genómicos, sequenciação do transcriptoma completo, sequenciação metagenómica, sequenciação completa do rRNA 16Ssequenciação do genoma organelar, re-sequenciação do genoma completo e identificação de variantes raras, epigenética, etc. Estas diversas aplicações tornam Sequenciação SMRT da PacBio uma ferramenta formidável no campo da investigação genómica.
Assemblagem de novo: O comprimento longo das leituras da PacBio melhora significativamente a taxa de sucesso da montagem de contigs, produzindo contigs longos. Ele consegue atravessar facilmente sequências repetitivas e de alto conteúdo de GC. Na prática, os investigadores normalmente utilizam sequências da PacBio para a montagem de contigs e depois empregam sequências da Illumina para a correção de bases.
Tipagem do antígeno leucocitário humano (HLA): Preciso Tipagem HLA é crítico na transplante de órgãos humanos. O HLA abrange um longo fragmento, e o seu hapótipo desempenha um papel crucial na tipagem e transplante bem-sucedidos. Os profissionais de saúde estão agora a tentar utilizar sequências PacBio como uma solução para uma tipagem precisa. Tipagem HLA.
Pesquisa sobre metilação: A PacBio pode ler diretamente uma variedade de modificações de bases, incluindo a metilação da adenina e da citosina, e a hidroximetilação da citosina, conferindo assim à PacBio uma vantagem única na pesquisa sobre modificações de bases.
Pesquisa sobre splicing alternativo de RNA: A pré-requisito para analisar o splicing alternativo de RNA envolve uma sequência de leitura longa que se estende além do local de splicing variável de ambos os lados. As metodologias de sequenciação existentes, devido às suas menores comprimentos de leitura, não apresentam alta sensibilidade ao splicing alternativo de RNA. Aqui, a PacBio preenche essa lacuna.
Deteção de múltiplas sequências repetidas: Algumas doenças resultam da repetição de certas sequências repetitivas além do intervalo normal, como os até 750 repetições de CGG na síndrome do X frágil. Essas sequências eram difíceis de determinar completamente através de sequenciação direta no passado. Agora, os cientistas podem sequenciar diretamente essas regiões usando PacBio.
Referências:
- Ye Q, Zhang S, Xie Q, et al. Análise de Transcriptoma De Novo por PacBio SMRT-Seq e Illumina RNA-Seq Fornece Novas Perspectivas sobre a Biossíntese de Polifenóis no Fruto da Azeitona Chinesa. Horticultura, 2024, 10(3): 293.
- Kong N., Ng W., Thao K., et al. Automação da preparação de bibliotecas NGS smrtbell da pacbio para sequenciação de genomas bacterianos, Normas em Ciências Genómicas, 2017, 12(1), 27.
- Ye W, Xu W, Xu N, et al. Caracterização abrangente do transcriptoma de Grus japonensis utilizando sequenciação PacBio SMRT e Illumina. Relatórios Científicos, 2021, 11(1): 23927.
- Cuber P, Chooneea D, Geeves C, et al. Comparação da precisão e eficiência das tecnologias de sequenciação de terceira geração, Oxford Nanopore Technologies e Pacific Biosciences, para aplicações de sequenciação de código de barras de DNA. Genética e Genómica Ecológica, 2023, 28: 100181.
- Chen Z, He X. Aplicação da sequenciação de terceira geração na investigação do câncer. Revisão Médica, 2021, 1(2): 150-171.
- Site da PacBio.