SNP, uma abreviatura para Polimorfismo de Nucleótido Único, denota uma forma de polimorfismo genético resultante de uma mutação na sequência de DNA do genoma, provocada por uma alteração de um único nucleótido, que pode envolver a substituição, transversão, inserção ou deleção de uma única base. Em princípio, os SNPs podem manifestar-se como bi-alélicos, tri-alélicos ou tetra-alélicos, no entanto, nas aplicações práticas, os dois últimos são extraordinariamente raros e considerados inconsequentes. Geralmente, ao referir-se a SNPs, o foco tende a estar nos polimorfismos bi-alélicos. Estas variações podem manifestar-se como transições, exemplificadas pela conversão de uma citosina (C) em timina (T), ou pelo seu par complementar, nomeadamente, a conversão de uma guanina (G) em adenina (A). Alternativamente, também podem manifestar-se como transversões, como citosina para adenina (CA), guanina para timina (GT), citosina para guanina (CG) ou adenina para timina (AT). É pertinente notar que as transições apresentam consistentemente taxas de ocorrência marcadamente mais elevadas em comparação com outras categorias, com os SNPs do tipo transição a representarem aproximadamente dois terços do total.

Os SNPs comuns têm o potencial de manifestar-se tanto em regiões codificantes como em regiões não codificantes dentro do genoma. Embora a sua ocorrência em regiões codificantes seja relativamente infrequente, a sua capacidade de influenciar a funcionalidade dos genes, instigando, consequentemente, alterações em características biológicas, torna-os de importância primordial no âmbito da investigação de doenças genéticas. Como marcadores genéticos de terceira geração, os SNPs estão distribuídos de forma intrincada por toda a paisagem genómica de animais e humanos. Eles exibem uma correlação pronunciada com genes funcionais, apresentam taxas de mutação mínimas e exemplificam uma robusta estabilidade genética. Além disso, são adequados para análise de alto rendimento e automação simplificada. É importante notar que certos loci de SNP podem não correlacionar-se diretamente com a expressão de genes associados a doenças. No entanto, devido à sua proximidade com genes patogénicos específicos, assumem papéis cruciais como marcadores genéticos importantes nesses contextos.
Os chips genéticos oferecem uma série de vantagens, incluindo um elevado rendimento, precisão impecável e operação amigável, tornando-os excepcionalmente adequados para aplicações onde os loci-alvo específicos estão pré-estabelecidos. Especialmente quando a quantidade de loci-alvo ultrapassa um determinado limite, os chips genéticos demonstram uma redução notável nos custos gerais, juntamente com uma maior eficiência.
A tecnologia de chip genético baseia-se no princípio da hibridização complementar de bases. Envolve o design de sequências de sondas para locos SNP conhecidos e a marcação de sondas de DNA com isótopos ou marcadores fluorescentes. Estas sondas de DNA marcadas são hibridizadas com o DNA alvo para obter informações biológicas. Os chips genéticos utilizam a tecnologia de microarranjos para integrar milhões de sondas num chip de silício ou membrana de nylon do tamanho de uma lâmina de microscópio. Isso permite a análise simultânea de 5.000 a 1.000.000 de genótipos para um indivíduo.
Nosso serviços de genotipagem de SNP baseados em microarranjos compreendem arrays SNP da Affymetrix e arrays SNP da Illumina. Os arrays de genotipagem da Affymetrix no instrumento GeneTitan (placas de array Axiom) e no sistema GeneChip Scanner 3000 7G (arrays de cartucho) podem ser utilizados para uma variedade de casos – para poucos e muitos amostras, desde aplicações direcionadas até aplicações em todo o genoma, selecionando os arrays de genotipagem pré-projetados específicos. A genotipagem de alta densidade em arrays Illumina Infinium ou GoldenGate® permite poderosos estudos de associação em todo o genoma (GWAS) e pode detectar com precisão mutações pontuais e variantes no número de cópias. Atualmente, a Affymetrix oferece arrays de genotipagem para espécies de gado e aquicultura (búfalo, gado, frango, porco, salmão e truta), culturas (algodão, milho, soja, morango e trigo) e organismos modelo biomédicos (humano, cão, rato e Arabidopsis thaliana), enquanto a Illumina comercializa BeadArrays de genotipagem para espécies humanas e não humanas (gado, cão, milho, porco e ovelha). O array SNP tem sido considerado a técnica preferida em algumas circunstâncias devido à sua alta densidade, precisão do ensaio, análise de dados simples e fácil troca de dados entre programas de pesquisa. No entanto, esses arrays ou chips SNP disponíveis comercialmente não podem ser facilmente modificados para se adequar a designs experimentais individuais. Além disso, pesquisas relevantes não podem ser realizadas para espécies que não possuem arrays/chips SNP disponíveis comercialmente.
Os fundamentos técnicos dos chips de genes conferem as seguintes vantagens:
Aumento da Taxa de Através: Os chips genéticos permitem a análise simultânea de uma vasta gama de loci genéticos, com capacidades que se estendem a até 1.000.000 loci.
Padronização Rigorosa e Reproduzibilidade: Cada execução experimental proporciona informações genéticas precisas em posições predefinidas, eliminando a aleatoriedade inerente e garantindo resultados consistentes.
Precisão Exemplar: O processo de produção de chips é pontuado por rigorosas avaliações de qualidade, com cada local de deteção sujeito a uma análise recorrente, sustentando assim resultados de notável precisão.
Eficiência: Experimentos que utilizam chips de genes são acelerados, com resultados alcançáveis em apenas 2 dias, contribuindo para a celeridade da pesquisa.
Custo-Efetividade: Os chips genéticos apresentam uma solução custo-efetiva, particularmente adequada para empreendimentos de perfilagem genética em larga escala e de alto rendimento.
Personalização: Os chips genéticos podem ser adaptados de acordo com loci-alvo específicos, sendo que os chips de microarray oferecem uma flexibilidade aprimorada para personalização quando comparados com os equivalentes sintetizados in situ.
tecnologias de NGS (Sequenciação de Nova Geração) são ferramentas poderosas para genotipagem de SNPs, porque podem descobrir e genotipar de forma eficiente e precisa milhares de SNPs para investigar genómica quantitativa, funcional e evolutiva em humanos, animais e plantas.
O NGS é uma tecnologia de sequenciação de DNA que evoluiu a partir da PCR e de chips de genes. Em comparação com a sequenciação Sanger, a sequenciação NGS introduz a terminação reversível das extremidades, permitindo que a síntese e a sequenciação ocorram simultaneamente.
Na NGS, moléculas de DNA individuais devem ser amplificadas em clusters consistindo em composições de DNA idênticas. Esses clusters são então replicados de forma síncrona para aumentar a intensidade do sinal de fluorescência, facilitando a leitura da sequência de DNA. À medida que os comprimentos de leitura aumentam, a coesão da replicação dos clusters diminui, levando a uma queda na qualidade da sequenciação de bases. Portanto, a NGS normalmente tem comprimentos de leitura mais curtos, geralmente não excedendo 500 pares de bases. Após a sequenciação, a informação dos segmentos de DNA fragmentados deve ser montada, e o processo de montagem de sequência tem uma taxa de erro na faixa de 0,1% a 15%, reduzindo a precisão.
O encurtamento dos comprimentos de leitura em NGS permite a avaliação simultânea de centenas de milhares a até milhões de sequências genéticas dentro de uma única corrida de sequenciação. Este avanço supera efetivamente as limitações associadas ao baixo rendimento que eram características dos métodos de sequenciação de primeira geração. Uma única corrida de NGS pode realizar de forma eficiente experimentos de genotipagem multi-locus, especialmente ao lidar com conjuntos de amostras extensos, proporcionando economias de tempo e reduções de custos notáveis. Consequentemente, esta tecnologia tem sido amplamente adotada no domínio da sequenciação genética de alto rendimento.
Existem vários métodos para genotipagem de Polimorfismos de Nucleotídeo Único (SNP) baseados em Sequenciação de Nova Geração.
Sequenciação do exoma completo (WES): O WES é um método que utiliza NGS para sequenciar apenas as regiões exónicas do genoma humano, que codificam proteínas. Embora seja principalmente utilizado para estudar a relação entre mutações genéticas e doenças, também pode ser usado para genotipagem de SNPs, uma vez que os exões contêm muitos loci de SNP.
Sequenciação do genoma completo (WGS): O WGS envolve o sequenciamento de todas as regiões de todo o genoma, incluindo regiões codificantes e não codificantes. Este método pode ser utilizado para detetar e genotipar todos os SNPs no genoma, fornecendo informações genéticas abrangentes.
Sequenciação DirecionadaA abordagem de sequenciação direcionada envolve a sequenciação específica de genes ou loci de SNP de interesse particular, permitindo a aquisição de dados de SNP altamente focados. Esta metodologia pode ser adaptada para englobar o direcionamento seletivo de SNPs associados a doenças específicas, possibilitando um exame meticuloso das variações genéticas pertinentes à patologia em investigação.
Sequenciação de RNA (RNA-Seq)A RNA-Seq, embora seja principalmente utilizada para a investigação de perfis de expressão génica, oferece uma utilidade versátil que abrange a deteção de Polimorfismos de Nucleótido Único (SNPs). Esta abordagem multifacetada, baseada na análise de transcritos génicos, facilita a distinção da expressão de SNPs e variações ao nível do RNA, proporcionando assim uma compreensão abrangente da diversidade genética e das dinâmicas dentro deste contexto.
MultiplexaçãoAs tecnologias de NGS permitem frequentemente o sequenciamento simultâneo de múltiplas amostras, levando a uma maior eficiência e redução de custos. Esta metodologia revela-se altamente vantajosa no contexto de esforços de genotipagem de polimorfismos de nucleotídeo único (SNP) em grande escala, incluindo Estudos de Associação em Todo o Genoma (GWAS).
Genotipagem por Sequenciação (GBS): O GBS é uma abordagem de alto rendimento baseada na tecnologia de sequenciação de segunda geração. Esta metodologia facilita a sequenciação simultânea de amostras de DNA de múltiplos indivíduos e a determinação dos seus respetivos genótipos. O protocolo GBS abrange a preparação de bibliotecas, a sequenciação direcionada de regiões genómicas específicas obtida através da digestão de DNA utilizando enzimas de restrição, e a utilização de sequenciadores de alto rendimento para produzir conjuntos de dados extensos ricos em informações sobre polimorfismos de nucleotídeo único (SNP).
dd-RAD (Sequenciação de DNA Associada a Locais de Restrição por Digestão Dupla)O dd-RAD representa uma técnica adicional de genotipagem de SNPs baseada na tecnologia de sequenciação de segunda geração. Este método envolve a utilização de duas enzimas de restrição distintas para clivar o DNA, seguido pela sequenciação dos produtos clivados para a deteção e genotipagem dos loci de SNP.
2b-RAD2b-RAD é uma estratégia de sequenciação de representação do genoma reduzido ou sequenciação associada a locais de restrição, utilizada para descobrir e genotipar variantes genéticas de forma económica, aplicável tanto a organismos modelo com genomas conhecidos como a organismos não modelo com genomas desconhecidos. Esta técnica é definida como a construção de bibliotecas através da digestão de DNA com enzimas de restrição e a análise da biblioteca subsequente com plataformas de sequenciação Illumina.
A PCR oferece alta sensibilidade, baixo custo para cenários com um número limitado de loci a serem testados e tempos de deteção mais curtos, normalmente concluídos em 2 a 4 horas. É operacionalmente simples. No entanto, tem limitações, como a deteção de um único locus, baixo rendimento (geralmente entre alguns a algumas centenas de loci) e a incapacidade de detectar outras mutações que possam existir no DNA. Falsos negativos e falsos positivos são possíveis, tornando-a adequada para cenários com um pequeno número de loci a testar e requisitos de menor rendimento.
Reação de Detecção de Ligase (LDR) para GenotipagemEste método utiliza principalmente a tecnologia de reação de deteção de ligase (LDR). A ligase de DNA Taq é utilizada para facilitar a reação, que ocorre apenas quando duas sondas nucleotídicas curtas, uma de cada cadeia, são totalmente complementares à sequência de DNA alvo sem quaisquer lacunas. A deteção é realizada através da digitalização fluorescente dos comprimentos dos fragmentos, permitindo a identificação do locus SNP.
Genotipagem de SNPs SNaPshot MultiplexA genotipagem de SNP SNaPshot é um método que utiliza simultaneamente múltiplas PCRs para realizar o tipagem genética de vários loci SNP conhecidos. Utiliza enzimas de sequenciamento de DNA, quatro ddNTPs marcados com fluorescência, primers de extensão de comprimentos variados adjacentes ao local polimórfico e templates de produto de PCR. A extensão do primer termina após uma única base e, após a eletroforese em gel num sequenciador ABI 3730, as cores dos picos indicam a base incorporada, determinando o genótipo da amostra e o locus SNP correspondente ao produto de extensão com base na mobilidade do pico.
Método da Sonda TaqmanEste método envolve a adição de duas sondas com diferentes etiquetas fluorescentes ao sistema de reação de PCR. Cada sonda complementa totalmente um dos dois alelos. Normalmente, devido à proximidade do grupo fluorescente na extremidade 5' e do grupo quencher na extremidade 3' nas sondas, a fluorescência é suprimida. À medida que a PCR avança, a sonda totalmente complementar ao molde é gradualmente clivada pela atividade exonuclease 5'→3' da Taq DNA polimerase, levando à separação do grupo fluorescente na extremidade 5' do grupo quencher na extremidade 3', desativando a supressão da fluorescência. Por outro lado, a sonda que representa o outro alelo, que não corresponde perfeitamente ao molde, não é clivada de forma eficiente, e nenhuma fluorescência é detectada. A deteção do locus SNP é alcançada medindo as alterações nos valores de fluorescência utilizando a instrumentação correspondente.
PCR-ARMS (Sistema de Mutação Refratária à Amplificação): ARMS é um método de amplificação por PCR projetado para SNPs específicos. Através do design de primers, amplifica seletivamente fragmentos de DNA que contêm ou não o SNP específico.
As técnicas baseadas em PCR oferecem uma variedade de opções para genotipagem de SNPs, cada uma distinguida pelas suas características únicas e adaptabilidade a contextos de pesquisa específicos.
Genotipagem de SNPs MassARRAY: A Espectrometria de Massa por Desorção/Ionização Assistida por Matriz com Tempo de Voo (MALDI-TOF MS) serve como a tecnologia fundamental para este método. Inicialmente, a PCR é utilizada para amplificar segmentos de genes contendo SNPs. Subsequentemente, é realizada uma extensão de base única utilizando primers específicos para a sequência. Após isso, o analito da amostra é co-cristalizado com a matriz do chip e excitado por um pulso de laser de nanosegundos (10-9s) dentro de um tubo de vácuo. Este processo resulta na desorção de moléculas de ácido nucleico, convertendo-as em íons de carga única. Devido à relação inversa entre a massa do íon e o tempo de voo do íon em um campo elétrico, o peso molecular preciso do analito da amostra é determinado medindo o tempo de voo das moléculas de ácido nucleico dentro do tubo de vácuo. Como resultado, a informação sobre os locais de SNP pode ser detectada de forma confiável. Este método é bem adequado para análise de SNP de média a alta capacidade, particularmente ao lidar com mais de dez locais de SNP.
A CD Genomics está comprometida em fornecer genotipagem de SNP a uma escala genómica e de forma acessível. Os nossos cientistas experientes podem oferecer suporte profissional para o seu projeto, de modo a atender aos seus objetivos de pesquisa e orçamento.
Aqui está uma visão clara lado a lado das técnicas de genotipagem e RAD-seq:
| Método | Genoma completo | Fragmento de Origem | Seleção de Tamanho | Rendimento | Melhor Caso de Uso |
|---|---|---|---|---|---|
| RAD-seq (clássico) | ✅ Sim | Enzima única + fragmentação aleatória | Corte físico | Médio | Espécies não modelo sem genoma de referência |
| ddRAD-seq | ✅ Sim | Duas enzimas + fragmentos selecionados por tamanho | Base gel, gama precisa | Alto | Descoberta equilibrada de SNP com cobertura uniforme |
| 2b-RAD | ✅ Sim | Enzima tipo IIB → etiquetas uniformes de 33–36 bp | Nenhuma seleção de tamanho necessária. | Muito Alto | Mapeamento de SNP de alta densidade, mesmo em DNA degradado |
| Genotipagem PCR-LDR | ❌ Apenas direcionado | Deteção de PCR + ligase | N/A | Baixo | Validação de SNPs conhecidos para um ou poucos loci |
| Genotipagem MassARRAY | ❌ Apenas direcionado | PCR + extensão de base única + MALDI-TOF MS | Primers baseados em PCR | Médio–Alto | Validação multiplex de ~10–100 SNPs |
Escolha um método com base em: