O que é Sequenciação de Nova Geração (NGS)?
História do Sequenciamento de Nova Geração
Sequenciação de Nova Geração (NGS) é uma técnica revolucionária de análise genética que envolve a fragmentação do material genético (DNA ou RNA) e a ligação de oligonucleotídeos com sequências conhecidas através de um processo chamado ligação de adaptadores. Isso permite que os fragmentos resultantes interajam com a plataforma de sequenciação selecionada. Subsequentemente, as bases dentro de cada fragmento são identificadas com base nos seus sinais de emissão.
A principal distinção entre Sequenciação de Sanger e o NGS reside na escala de sequenciação; o NGS pode processar simultaneamente milhões de reações, proporcionando um rendimento excecional, sensibilidade aumentada, resultados rápidos e custo-efetividade. Agora é viável completar numerosos projetos de sequenciação de genomas em questão de horas, uma tarefa que teria demorado muito mais usando os métodos tradicionais de sequenciação Sanger.
A tecnologia NGS segue principalmente duas abordagens principais: leitura curta e sequenciação de leitura longa, cada um oferecendo as suas próprias vantagens e limitações únicas. A força motriz por trás do investimento extensivo no desenvolvimento de NGS é a sua aplicabilidade versátil tanto em contextos clínicos como de pesquisa.
Para sequenciação de leituras longas, consulte os artigos. Sequenciação por Nanoporos: Princípios, Plataformas e Vantagens e Visão geral da sequenciação SMRT da PacBio: princípios, fluxo de trabalho e aplicações para mais informações.
Plataformas e Tecnologias de Sequenciação de Próxima Geração
Os métodos de sequenciação de próxima geração estão bem estabelecidos e partilham características comuns, no entanto, podem ser categorizados com base na sua química de deteção subjacente. Estas categorias incluem sequenciação por ligação e sequenciação por síntese (SBS).
Por favor, consulte Plataformas de Sequenciação CD Genomics.
O método SBS mais prevalente é a sequenciação por terminador reversível, que utiliza a "amplificação em ponte". Fragmentos de DNA ligam-se a oligonucleotídeos numa célula de fluxo neste processo, formando uma ponte de um lado da sequência para o outro. Esta ponte é então amplificada, e os nucleotídeos marcados fluorescentemente são detetados usando imagem direta.
Princípio da Sequenciação Illumina (Sequenciação por Síntese). (Untergasser et al., 2019)
Em contraste com o SBS, a sequenciação por ligação não requer a DNA polimerase para gerar uma segunda cadeia. Em vez disso, sinais de fluorescência são utilizados para identificar a sequência alvo, aproveitando a sensibilidade da DNA ligase para detectar incompatibilidades de pares de bases.
tecnologias de NGS tipicamente oferecem várias vantagens em relação a métodos de sequenciação alternativos, permitindo leituras de sequenciação rápidas, sensíveis e rentáveis. No entanto, existem desvantagens, como desafios na interpretação de homopolímeros e erros de polimerase devido à incorporação incorreta de dNTP, o que pode resultar em erros de sequenciação.
Uma grande limitação de todas as tecnologias de NGS é a necessidade de amplificação por PCR antes da sequenciação, o que introduz viés durante a preparação da biblioteca (relacionado ao conteúdo de GC da sequência, comprimento do fragmento e pseudo diversidade) e durante a análise (resultando em erros de base e favorecendo sequências específicas em detrimento de outras).
Sequenciação SMRT da PacBio
Sequenciação em Tempo Real de Moléculas Únicas (SMRT) da PacBio aproveita o conceito de sequenciação enquanto sintetiza, utilizando o chip SMRT como meio de sequenciação. Este chip contém numerosos poros minúsculos, cada um abrigando uma molécula de DNA polimerase. Durante o processo de emparelhamento de bases, bases nucleotídicas distintas são incorporadas, emitindo comprimentos de onda e valores de pico de luz únicos. Estes sinais emitidos servem para determinar o tipo de base incorporada. Notavelmente, a sequenciação SMRT opera a uma velocidade impressionante, processando várias desoxirribonucleosídeos trifosfatos (dNTP) por segundo.
Sequenciação de Nanopore Oxford
Sequenciação Oxford Nanopore destaca-se das tecnologias de sequenciação anteriores, pois se baseia em sinais elétricos em vez de ópticos. Um componente fundamental desta tecnologia é um nanoporo especialmente projetado, capaz de acomodar apenas uma única molécula de DNA, apresentando junções moleculares ligadas covalentemente no seu interior. À medida que as bases de DNA atravessam o nanoporo, elas induzem alterações transitórias na carga elétrica, afetando a intensidade da corrente que passa pelo nanoporo. Cada tipo de base resulta em uma alteração distinta na magnitude da corrente, que é detectada de forma sensível pela eletrónica, permitindo a identificação das bases em trânsito.
Passos na Preparação da Biblioteca de Sequenciação de Próxima Geração
(1) Preparação da Amostra (Pré-tratamento)
Ácidos nucleicos (DNA ou RNA) são extraídos de amostras escolhidas (por exemplo, sangue, escarro, medula óssea). As amostras extraídas passam por uma avaliação de controlo de qualidade (CQ) utilizando métodos padrão como espectrofotometria, fluorimetria ou eletroforese em gel. Se RNA está empregado, pode ser necessário a transcrição reversa para gerar cDNA, embora alguns kits de preparação de bibliotecas possam incorporar esta etapa.
Por favor, consulte o nosso Diretrizes para Submissão de Amostras para mais informações.
(2) Otimização e Melhoria de Bibliotecas de NGS
cDNA ou DNA é tipicamente fragmentado aleatoriamente através de tratamento enzimático ou sonicação. O comprimento ótimo dos fragmentos depende da plataforma de sequenciação utilizada. A otimização pode envolver a execução de um pequeno subconjunto de amostras fragmentadas em um gel de eletroforese. Estes fragmentos são posteriormente reparados nas extremidades e ligados a fragmentos de DNA genéricos mais curtos conhecidos como adaptadores. Estes adaptadores possuem um comprimento definido e sequências de oligonucleotídeos conhecidas, compatíveis com a plataforma de sequenciação escolhida, permitindo o reconhecimento durante a sequenciação multiplex. A sequenciação multiplex, utilizando as sequências de adaptadores respetivas para cada amostra, permite a sequenciação simultânea de numerosas bibliotecas em uma única corrida. O conjunto de fragmentos de DNA com adaptadores é referido como a biblioteca de sequenciação.
Por favor, consulte o nosso artigo. Controlo de Qualidade no Fluxo de Trabalho de Preparação de Bibliotecas NGS para mais informações.
A seleção de tamanhos pode ser realizada através de eletroforese em gel ou pelo uso de esferas magnéticas para eliminar fragmentos excessivamente curtos ou longos que podem não ter um desempenho ideal na plataforma e protocolo de sequenciação selecionados. A PCR é então utilizada para amplificar/enriquecer a biblioteca. Em técnicas que envolvem PCR em emulsão, cada fragmento está ligado a uma esfera de emulsão individual, que forma a base do cluster de sequenciação. Um passo de "limpeza", frequentemente utilizando esferas magnéticas, é realizado após a amplificação para eliminar fragmentos indesejados e aumentar a eficiência da sequenciação.
A biblioteca final pode ser sujeita a controlo de qualidade utilizando PCR quantitativa (qPCR) para confirmar tanto a qualidade como a quantidade de DNA. Este passo também facilita a preparação de amostras com a concentração apropriada para sequenciação.
(3) Sequenciação
Dependendo da plataforma escolhida e da química, a amplificação clonal dos fragmentos da biblioteca pode ocorrer antes de carregar o sequenciador (PCR) ou no próprio sequenciador (PCR em ponte). As sequências são então detetadas e reportadas com base na plataforma selecionada.
(4) Análise de Dados
Os ficheiros de dados gerados são analisados de acordo com o fluxo de trabalho específico utilizado. Métodos de análise são altamente dependentes dos objetivos do estudo.
Embora a sequenciação de extremidades pareadas e a sequenciação de pares pareados possam reduzir o número de amostras analisadas em uma única corrida, elas oferecem vantagens distintas na análise de dados subsequente, especialmente para montagem de novo. Estas tecnologias combinam leituras de sequenciação obtidas a partir de ambas as extremidades de um fragmento (extremidades pareadas) ou aquelas separadas por regiões de DNA intersticiais (pares pareados).
Como Escolher uma Plataforma Apropriada de Preparação de Biblioteca e Sequenciação?
(a) Articular a questão de pesquisa
(b) Selecionando o tipo de amostra
(c) Decidir entre leituras curtas ou sequenciação de leitura longa
(d) Determinar se é necessário sequenciar DNA ou RNAgenoma ou análise do transcriptoma)
(e) Definir o alcance, se envolve o genoma completo ou regiões específicas.
(f) Estabelecer a profundidade de leitura necessária (cobertura) adaptada ao experimento
(g) Considerando o método de extração
(h) Avaliação da concentração da amostra
(i) Selecionar entre leituras de extremidade única, extremidade emparelhada ou pares emparelhados
(j) Especificar o comprimento de leitura necessário
(k) Explorar a viabilidade da multiplexação de amostras
(l) Avaliando o bioinformática ferramentas necessárias, que variam dependendo do experimento. Todo o processo de análise de sequências pode ser adaptado com base na amostra e na questão biológica em questão.
Análise de Dados de Sequenciação de Nova Geração
Cada tecnologia de Sequenciação de Nova Geração (NGS) gera um extenso volume de dados de saída. O fluxo de trabalho fundamental de análise de sequências é centralizado e abrange várias etapas-chave: controlo de qualidade das leituras brutas, pré-processamento e alinhamento dos dados, seguido de pós-processamento, anotação de variantes, chamada de variantese visualização.
O passo inicial neste fluxo de trabalho envolve a avaliação da qualidade dos dados de sequenciação bruta, um pré-requisito crucial para todas as análises subsequentes. Esta avaliação fornece informações essenciais sobre os dados globais, incluindo a quantidade e o comprimento das leituras, a presença de sequências contaminantes e quaisquer leituras com cobertura inadequada.
Por favor, consulte o nosso serviço. Serviço de Bioinformática para Sequenciação de Nova Geração para mais informações.
Desafios na Sequenciação de Próxima Geração
A NGS revolucionou a nossa capacidade de explorar e estudar genomas. Em ambientes clínicos, a NGS desempenha um papel crucial no diagnóstico de uma ampla gama de doenças ao detectar mutações germinativas ou somáticas. A crescente adoção da NGS na prática clínica é justificada pela sua capacidade de combinar eficazmente tecnologia avançada com custos decrescentes.
Além disso, o NGS é uma ferramenta indispensável no campo da investigação em metagenómica, permitindo o diagnóstico, vigilância e gestão de doenças infeciosas. Em 2020, métodos de NGS desempenhou um papel fundamental na caracterização do genoma do SARS-CoV-2 e continua a ser essencial para monitorizar a pandemia de COVID-19 em curso.
No entanto, as complexidades do processamento de amostras de NGS revelam desafios significativos na gestão, análise e armazenamento de dados. Um dos principais desafios é a considerável quantidade de recursos computacionais necessários para tarefas como montagem, anotação e análise de dados.
Além disso, o enorme volume de dados produzidos pela NGS representa um obstáculo substancial. Os centros de dados estão a enfrentar altas exigências de armazenamento e a lutar para acompanhar a crescente carga de dados, o que levanta preocupações sobre o risco de perda permanente de dados. Esforços contínuos estão em curso para melhorar a eficiência, reduzir erros de sequenciação, maximizar a reprodutibilidade e garantir uma gestão robusta dos dados, a fim de enfrentar esses desafios.
Referência:
- Untergasser, Gerold & Bucher, Philipp & Dresch, Philipp. (2019). Perfilagem Metagenómica de Tumores Usando Sequenciação de Próximas Gerações Baseada em Amplicões de 16S-rRNA.