Sequenciação de Nova Geração (NGS) da Illumina: Princípios e Fluxo de Trabalho
O fluxo de trabalho de Sequenciação de Nova Geração (NGS) da Illumina é um processo sofisticado e altamente eficiente que permite aos investigadores desvendar os mistérios da genética com rapidez e precisão. O fluxo de trabalho nas plataformas da Illumina pode ser dividido em três etapas principais: preparação da biblioteca, sequenciação e análise de dados.
Princípios da Tecnologia de Sequenciação Illumina
O princípio fundamental da tecnologia de sequenciação da Illumina gira em torno da utilização de nucleotídeos marcados com fluorescência que possuem terminadores reversíveis. Esta abordagem partilha o conceito central de "sequenciação por síntese à medida que avança", semelhante ao método de Sanger. No entanto, ao contrário do Sanger, esta técnica envolve a terminação temporária da extensão da cadeia de ADN após a incorporação de cada nucleotídeo modificado de forma única. Uma vez que os nucleotídeos adicionados são detetados opticamente utilizando marcadores fluorescentes específicos, as moléculas terminadoras são clivadas, permitindo que a síntese da nova cadeia retome para a ronda subsequente de adição de nucleotídeos.
Para detectar simultaneamente a incorporação de nucleotídeos em milhões de reações de sequenciação, o dATP, dCTP, dGTP e dTTP são cada um marcado com etiquetas fluorescentes distintas, permitindo a diferenciação dos nucleotídeos com base nos sinais fluorescentes emitidos. Estas etiquetas fluorescentes, juntamente com as moléculas terminadoras reversíveis, estão ligadas aos nucleotídeos através dos mesmos laços químicos. Como resultado, após a integração e deteção de cada nucleotídeo durante o ciclo de sequenciação, tanto as etiquetas fluorescentes como as moléculas terminadoras podem ser removidas simultaneamente numa única reação, preparando o caminho para a integração do próximo nucleotídeo.
3 Princípios da sequenciação Illumina Solexa. (Choudhuri Supratim, 2014)
Como Funciona o Sequenciamento da Illumina?
As reações de sequenciação no Sistema NGS da Illumina ocorrem dentro de uma célula de fluxo. A célula de fluxo contém canais microfluídicos, frequentemente chamados de faixas, onde a reação de sequenciação ocorre e os sinais de sequenciação são recolhidos através de escaneamento.
Dentro destes canais, as superfícies superior e inferior estão cobertas com um "relvado" de sequências de oligonucleotídeos, que complementam os componentes da sequência de ancoragem na junção. Quando a biblioteca de sequenciamento é introduzida em cada canal, os modelos de DNA dentro da biblioteca ligam-se a estas sequências de oligonucleotídeos, tornando-se imobilizados na superfície do canal.
Após a imobilização, cada molécula de DNA template passa por uma amplificação clonal através de um processo chamado "amplificação em ponte". Este processo gera até 1.000 cópias idênticas do template em estreita proximidade, formando aglomerados com menos de 1 micrón de diâmetro. Estes aglomerados servem como as unidades de deteção fundamentais durante o processo de sequenciação, proporcionando força de sinal suficiente para o reconhecimento de bases.
Preparação de Biblioteca
O primeiro passo no fluxo de trabalho de NGS da Illumina é a preparação da biblioteca, uma fase crucial que garante que as amostras de DNA ou RNA sejam compatíveis com o sequenciador. Este processo envolve a fragmentação do DNA em pedaços menores, seguida pela adição de adaptadores específicos às extremidades, criando a biblioteca de sequenciamento.
Na sequenciação Illumina, os adaptadores contêm sequências complementares que permitem que os fragmentos de DNA se liguem à célula de fluxo, que é onde o processo de sequenciação ocorre. Uma vez que os fragmentos estão ligados, eles passam por amplificação e purificação. Para otimizar recursos, várias bibliotecas podem ser misturadas e sequenciadas na mesma corrida, um processo chamado análise multiplex. Índices duplos únicos (UDI) são adicionados a cada biblioteca durante a ligação de junções, servindo como códigos de barras para distinguir as diferentes bibliotecas durante a análise de dados.
O UDI é particularmente útil na análise multiplex para reduzir incompatibilidades de amostras devido ao salto de etiquetas, especialmente em instrumentos com células de fluxo padronizadas, como o sistema NovaSeq 6000. Além disso, a inclusão de códigos de barras moleculares a cada molécula na biblioteca aumenta a sensibilidade da deteção de variantes e ajuda a eliminar duplicados de PCR e variantes de baixa frequência.
Sequenciação
Durante a etapa de sequenciação do fluxo de trabalho de NGS, a biblioteca preparada é aumentada para uma célula de fluxo e colocada dentro do sequenciador. O processo de geração de clusters amplifica clusters de fragmentos de ADN, produzindo milhões de cópias de ADN de cadeia simples. A maioria dos instrumentos de sequenciação da Illumina pode realizar a geração de clusters automaticamente.
A sequenciação por síntese (SBS) é o método utilizado durante o processo de sequenciação propriamente dito. Nucleotídeos quimicamente modificados ligam-se à fita molde de DNA através da complementaridade natural. Cada nucleotídeo possui um marcador fluorescente e um terminador reversível, que impede a incorporação da próxima base. O sinal fluorescente indica o tipo de nucleotídeo adicionado, e o terminador é então clivado, permitindo que a próxima base se ligue.
Após ler a fita de DNA direta, a leitura é eliminada e o processo é repetido para ler a fita inversa, tornando-se um método de sequenciação de duas extremidades.
Análise de Dados
No final do sequenciamento, o software do instrumento realiza a deteção de bases, identificando os nucleótidos presentes (conhecido como análise primária) e prevendo a precisão dessa deteção de bases. Os dados de sequenciamento gerados podem então ser importados para ferramentas de análise padrão para processamento adicional ou podem ser criados pipelines de análise personalizados (conhecido como análise secundária). Os investigadores frequentemente utilizam aplicações de análise de dados intuitivas (análise terciária) para interpretar e extrair insights significativos dos dados de NGS. Análise de dados é uma fase crítica, pois permite aos investigadores identificar variações genéticas, mutações e rearranjos estruturais dentro do genoma, levando a descobertas importantes em áreas como a genómica das doenças, a medicina personalizada e a agricultura.
Referência:
- Choudhuri, Supratim. Bioinformática para iniciantes: genes, genomas, evolução molecular, bases de dados e ferramentas analíticasElsevier, 2014.