Fichas Informativas de Sequenciação com Representação Reduzida: Métodos, Vantagens, Aplicações e Estratégias
O que é Sequenciamento de Representação Reduzida, RRS?
A sequenciação de representação reduzida (RRS) é uma abordagem para gerar dados de sequenciação de alto rendimento em todo o genoma e obter um grande número de sequências de marcadores de polimorfismo genético para representar completamente a informação do genoma da espécie. A RRS não só simplifica o método de sequenciação, dado que apenas os fragmentos digeridos são sequenciados, como também simplifica o genoma sequenciado. Portanto, é amplamente utilizada no desenvolvimento de marcadores moleculares, análise genética populacional, construção de mapas genéticos, mapeamento de QTL, análise de associação em todo o genoma e em outros campos de investigação populacional e melhoramento molecular.
Introdução aos métodos utilizados para RRS
Existem vários métodos diferentes de RRS, incluindo GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, etc. Os princípios destes métodos são basicamente os mesmos, as diferenças residem na utilização de enzimas de restrição simples ou duplas, quebras aleatórias necessárias, código de barras exigido, kit especial necessário, design do adaptador e outros detalhes. A introdução detalhada destes métodos é a seguinte:
Figura 1. Processo experimental de cada método
Vantagens do RRS
- Apenas os fragmentos digeridos são sequenciados, o que reduz significativamente a complexidade do genoma.
- Não limitado pelo genoma de referência, também aplicável a espécies sem referência.
- Custo-efetivo, alta estabilidade, especialmente adequado para a análise de um grande número de amostras.
- Ampla gama de aplicações: genética populacional, mapeamento genético, mapeamento de QTL, análise de associação em todo o genoma, melhoramento molecular, etc.
Comparação de diferentes métodos utilizados pela RRS
As diferenças detalhadas nos métodos utilizados pelos RRS determinam as suas diferenças na aplicação. Na tabela seguinte, diferentes métodos de RRS são comparados: (ver tabela 1)
Aplicação do RRS
- Desenvolvimento de marcadores molecularesidentificação de marcadores SNPs/InDel individuais, integração de marcadores SNPs populacionais; cálculo da distância de ligação genética de marcadores polimórficos, construção de mapas genéticos de alta densidade e realização de análise de associação para características específicas, realização de mapeamento fino de genes a jusante.
- Construção de mapas genéticos e mapeamento de QTLdiferenciação de grupos de ligação, classificação de marcadores massivos, triagem de locais de segregação enviesada; mapeamento de QTL com base em dados fenotípicos.
- Evolução genética populacionalanálise a nível genético populacional baseada em dados de SNPs, incluindo análise da evolução populacional, análise da estrutura populacional, fluxo gênico, teste de pedigree, análise de PCA, etc.
- Assistir na montagem de de novo mapa genómico detalhadomontagem do genoma em rascunho, anotação de genes, etc.
- Análise de associação genómica em todo o genoma (GWAS)Sequenciação e análise de associação de genoma completo para uma determinada população de espécies, e triagem de locais regulatórios relacionados com o genoma para características específicas.
Estratégia de seleção nos métodos RRS
- Objetivo do estudo:
Com base em diferentes propósitos experimentais, o número de marcadores necessários é completamente diferente. Para estudos que necessitam de realizar investigação sobre varredura funcional de intervalos e mineração funcional de genes em todo o genoma, como GWAS e análise de pressão de seleção, são necessários dezenas de milhares de moléculas de alta densidade. No entanto, a densidade de marcadores moleculares para estudos sobre relações filogenéticas, análise de ligação, estrutura populacional geográfica, fluxo gênico e testes de pedigree não precisa ser tão alta, geralmente apenas algumas centenas a alguns milhares de marcadores moleculares são suficientes para completar. Para estudos de mapeamento de genes, diferentes materiais de pesquisa e populações de mapeamento também afetarão o número de marcadores necessários. Por exemplo, o número de marcadores exigidos para análise de associação em todo o genoma utilizando populações naturais está relacionado à distância de decaimento de LD da espécie; quanto mais rápida, mais marcadores são necessários.
O número de marcadores classificados por: RAD≥GBS/SLAF>2b-RADAssim, o número de marcadores necessários para o estudo pode ser avaliado primeiro, e depois a tecnologia de sequenciação do genoma simplificada apropriada pode ser selecionada.
- Com ou sem genoma de referência:
Se a espécie em investigação não tiver um genoma de referência ou se a qualidade da montagem do genoma de referência for baixa, a tecnologia RAD pode ser utilizada com mais frequência, uma vez que a tecnologia RAD pode obter fragmentos de até 400~500bp através de montagem parcial, o que é favorável ao desenvolvimento de marcadores moleculares SSR e ao subsequente design de primers; GBS/SLAF também pode usar métodos de agrupamento para construir sequências consensuais para detectar SNPs; o 2b-RAD é suscetível a interferências por sequências repetitivas devido aos seus fragmentos curtos, e não é favorável ao design de primers para verificar os SNPs obtidos por sequenciação. Portanto, o 2b-RAD geralmente requer um genoma de referência.
- Seleção de enzimas de restrição:
A escolha da enzima é determinada pela necessidade de densidade de marcadores. A enzima selecionada deve ser adequada para a espécie em estudo (por exemplo, considerar o número de enzimas nas regiões repetitivas da espécie); algumas enzimas são adequadas para certas espécies, mas não necessariamente adequadas para outras espécies; os fragmentos de digestão enzimática geralmente têm extremidades adesivas, e diferentes extremidades adesivas podem exigir diferentes designs de adaptadores.
- Preparação de amostras de ADN:
Considerando a eficiência de digestão das enzimas, amostras de DNA de alta qualidade são críticas para todo o processo; além disso, diferentes métodos também requerem volumes de amostra de DNA.
Tabela 1. comparação de diferentes métodos utilizados pela RRS
| RAD Original | 2bRAD | GBS | ddRAD | ddGBS | SALF | |
|---|---|---|---|---|---|---|
| enzima | solteiro | único do tipo IIB | solteiro | duplo | duplo | duplo |
| enzima (depende da espécie e da densidade do marcador) | EcoRⅠ、ShfⅠ,etc. | BsaXⅠ、AlfⅠ,etc. | ApekI,MseⅠ,etc. | EcoRⅠ、MseⅠ,etc. | EcoRⅠ、MseI,etc. | MseⅠ、OláⅢ,etc. |
| Número de loci por 1Mb de tamanho do genoma* | 30–500 | 50–1.000 | 5–40 | 0,3–200 | 0,3–200 | 50-80 |
| seleção de tamanho | Interrupção ultrassónica | Não | seleção específica por PCR | Corte de gel eletroforético | Corte de gel eletroforético | Corte de gel eletroforético |
| Comprimento de locos | ≤1kb pode ser obtido; caso contrário, ≤300bp | 33–36pb | <300bp | 300-500pb | <300bp | 450-500 pb |
| Intervalo de captura do genoma | 10% | 1% | 1-3% | 1-3% | 1-3% | 1-3% |
| Identificação de duplicados de PCR | Com sequenciação de extremidades pareadas | Não | Com códigos de barras degenerados | Com códigos de barras degenerados | Com códigos de barras degenerados | Com códigos de barras duplamente degenerados |
| Variação no número de etiquetas | não | sim | sim | sim | sim | sim |
| Número de SNPs | alto | baixo | moderado | moderado | moderado | moderado |
| Tipo de marcador | SNP, Indel, SSR | SNP, Indel | SNP, Indel | SNP, Indel | SNP, Indel | SNP, Indel |
| Custo | alto | baixo | moderado | baixo | baixo | moderado |
| genoma de referência necessário | melhor | pior | moderado | moderado | moderado | moderado |
| Genoma complexo e grande | melhor | pior | moderado | moderado | bom | bom |
| quantidade de amostra | >1 µg | >1 µg | >200ng | >50ng | >50ng | >200ng |
| conteúdo de amostra | >50ng/µl | >250ng/µl | >10µg/µl | 100ng/µl | 100ng/µl | >10µg/µl |
| Equipamento especializado necessário | Sonicator | Nenhum | Nenhum | Preparação Pippin | Pippin Prep | Pippin Prep |
| estratégia de sequenciação (depende do objetivo do estudo e da população) | <1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para indivíduos de análise genética populacional. | 0,4-15X | >100 mil etiquetas/amostra; 10X/etiqueta; depende do tamanho do genoma e da densidade de marcadores necessária. | <1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos. | <1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional. | <1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos. |
| vantagens | um grande número de marcadores, longos fragmentos podem ser obtidos para o design de primers | fragmentos uniformes, operação fácil | operação fácil | distribuição uniforme de marcadores, número controlável de marcadores | distribuição uniforme de marcadores, número controlável de marcadores | distribuição uniforme de marcadores, número controlável de marcadores |
| desvantagens | operação de experimento complexo | loci mais curtos, não adequados para genomas complexos e heterozigóticos | menos loci do que RAD, alta taxa de dados em falta | menos loci do que RAD | menos loci do que RAD | interferência da degradação do ADN, desperdício de dados |
| aplicações | Pesquisa sobre marcadores de alta densidade e desenvolvimento de marcadores moleculares. | genoma simples | amostras grandes e múltiplos genomas complexos com sequências repetitivas altas | amostras grandes e múltiplos genomas complexos com alta sequência repetitiva | amostras grandes e múltiplos genomas complexos com sequências repetitivas altas | amostras grandes e múltiplos genomas complexos com sequências repetitivas altas |