Fichas Informativas de Sequenciação com Representação Reduzida: Métodos, Vantagens, Aplicações e Estratégias

O que é Sequenciamento de Representação Reduzida, RRS?

A sequenciação de representação reduzida (RRS) é uma abordagem para gerar dados de sequenciação de alto rendimento em todo o genoma e obter um grande número de sequências de marcadores de polimorfismo genético para representar completamente a informação do genoma da espécie. A RRS não só simplifica o método de sequenciação, dado que apenas os fragmentos digeridos são sequenciados, como também simplifica o genoma sequenciado. Portanto, é amplamente utilizada no desenvolvimento de marcadores moleculares, análise genética populacional, construção de mapas genéticos, mapeamento de QTL, análise de associação em todo o genoma e em outros campos de investigação populacional e melhoramento molecular.

Introdução aos métodos utilizados para RRS

Existem vários métodos diferentes de RRS, incluindo GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, etc. Os princípios destes métodos são basicamente os mesmos, as diferenças residem na utilização de enzimas de restrição simples ou duplas, quebras aleatórias necessárias, código de barras exigido, kit especial necessário, design do adaptador e outros detalhes. A introdução detalhada destes métodos é a seguinte:

RADEste método realiza a digestão única do DNA do genoma completo, em seguida, interrompe aleatoriamente os fragmentos digeridos. Assim, o read1 obtido pela sequenciação é alinhado na posição, enquanto o read2 é desigual, permitindo que contigs mais longos sejam agrupados e emendados de novo, o que é benéfico para o desenvolvimento de marcadores moleculares SSR.
GBSEste método realiza a digestão única de DNA genómico sem interrupção aleatória ultrassónica. Em vez disso, a PCR é utilizada para a seleção do tamanho dos fragmentos, e diferentes amostras são adicionadas com diferentes códigos de barras, permitindo agrupar até 96 amostras. Isso simplifica as etapas de construção de uma biblioteca, tornando o custo inferior ao do RAD.
2bRADEste método utiliza a enzima de restrição tipo IIB para digestão. A enzima de restrição tipo IIB pode cortar segmentos de ADN genómico a montante e a jusante do local de restrição para obter fragmentos de comprimento fixo com um tamanho menor de apenas 33-36 bp.
ddGBSEste método é uma melhoria do GBS. O DNA genómico é digerido com duas enzimas de restrição, o que permite obter fragmentos digeridos mais uniformemente distribuídos no genoma.
ddRADEste método é basicamente o mesmo que o ddGBS, a diferença reside no número de pooling selecionado durante a construção da biblioteca. O processo do ddRAD é mais semelhante ao GBS clássico. Este método utiliza duas enzimas de restrição para cortar o DNA genómico, obtendo fragmentos mais uniformes em todo o genoma, e utiliza eletroforese para selecionar o tamanho dos fragmentos.
SLAFEste método é uma versão otimizada do ddRAD, as enzimas e os tamanhos dos fragmentos de restrição são otimizados com dados de treino para garantir uma distribuição uniforme e evitar repetições. Os fragmentos também são selecionados dentro de um intervalo restrito, para otimizar a reação de PCR. O protocolo é semelhante ao ddRAD, por exemplo, com uma primeira digestão com MseI, inativação por calor e uma segunda digestão com AluI. Os fragmentos resultantes são amplificados por PCR, os adaptadores adicionados e os fragmentos purificados.

Experimental process of each method 1

Experimental process of each method 2Figura 1. Processo experimental de cada método

Vantagens do RRS

  • Apenas os fragmentos digeridos são sequenciados, o que reduz significativamente a complexidade do genoma.
  • Não limitado pelo genoma de referência, também aplicável a espécies sem referência.
  • Custo-efetivo, alta estabilidade, especialmente adequado para a análise de um grande número de amostras.
  • Ampla gama de aplicações: genética populacional, mapeamento genético, mapeamento de QTL, análise de associação em todo o genoma, melhoramento molecular, etc.

Comparação de diferentes métodos utilizados pela RRS

As diferenças detalhadas nos métodos utilizados pelos RRS determinam as suas diferenças na aplicação. Na tabela seguinte, diferentes métodos de RRS são comparados: (ver tabela 1)

Aplicação do RRS

  • Desenvolvimento de marcadores molecularesidentificação de marcadores SNPs/InDel individuais, integração de marcadores SNPs populacionais; cálculo da distância de ligação genética de marcadores polimórficos, construção de mapas genéticos de alta densidade e realização de análise de associação para características específicas, realização de mapeamento fino de genes a jusante.
  • Construção de mapas genéticos e mapeamento de QTLdiferenciação de grupos de ligação, classificação de marcadores massivos, triagem de locais de segregação enviesada; mapeamento de QTL com base em dados fenotípicos.
  • Evolução genética populacionalanálise a nível genético populacional baseada em dados de SNPs, incluindo análise da evolução populacional, análise da estrutura populacional, fluxo gênico, teste de pedigree, análise de PCA, etc.
  • Assistir na montagem de de novo mapa genómico detalhadomontagem do genoma em rascunho, anotação de genes, etc.
  • Análise de associação genómica em todo o genoma (GWAS)Sequenciação e análise de associação de genoma completo para uma determinada população de espécies, e triagem de locais regulatórios relacionados com o genoma para características específicas.

Estratégia de seleção nos métodos RRS

  • Objetivo do estudo:

    Com base em diferentes propósitos experimentais, o número de marcadores necessários é completamente diferente. Para estudos que necessitam de realizar investigação sobre varredura funcional de intervalos e mineração funcional de genes em todo o genoma, como GWAS e análise de pressão de seleção, são necessários dezenas de milhares de moléculas de alta densidade. No entanto, a densidade de marcadores moleculares para estudos sobre relações filogenéticas, análise de ligação, estrutura populacional geográfica, fluxo gênico e testes de pedigree não precisa ser tão alta, geralmente apenas algumas centenas a alguns milhares de marcadores moleculares são suficientes para completar. Para estudos de mapeamento de genes, diferentes materiais de pesquisa e populações de mapeamento também afetarão o número de marcadores necessários. Por exemplo, o número de marcadores exigidos para análise de associação em todo o genoma utilizando populações naturais está relacionado à distância de decaimento de LD da espécie; quanto mais rápida, mais marcadores são necessários.

    O número de marcadores classificados por: RAD≥GBS/SLAF>2b-RADAssim, o número de marcadores necessários para o estudo pode ser avaliado primeiro, e depois a tecnologia de sequenciação do genoma simplificada apropriada pode ser selecionada.

  • Com ou sem genoma de referência:

    Se a espécie em investigação não tiver um genoma de referência ou se a qualidade da montagem do genoma de referência for baixa, a tecnologia RAD pode ser utilizada com mais frequência, uma vez que a tecnologia RAD pode obter fragmentos de até 400~500bp através de montagem parcial, o que é favorável ao desenvolvimento de marcadores moleculares SSR e ao subsequente design de primers; GBS/SLAF também pode usar métodos de agrupamento para construir sequências consensuais para detectar SNPs; o 2b-RAD é suscetível a interferências por sequências repetitivas devido aos seus fragmentos curtos, e não é favorável ao design de primers para verificar os SNPs obtidos por sequenciação. Portanto, o 2b-RAD geralmente requer um genoma de referência.

  • Seleção de enzimas de restrição:

    A escolha da enzima é determinada pela necessidade de densidade de marcadores. A enzima selecionada deve ser adequada para a espécie em estudo (por exemplo, considerar o número de enzimas nas regiões repetitivas da espécie); algumas enzimas são adequadas para certas espécies, mas não necessariamente adequadas para outras espécies; os fragmentos de digestão enzimática geralmente têm extremidades adesivas, e diferentes extremidades adesivas podem exigir diferentes designs de adaptadores.

  • Preparação de amostras de ADN:

    Considerando a eficiência de digestão das enzimas, amostras de DNA de alta qualidade são críticas para todo o processo; além disso, diferentes métodos também requerem volumes de amostra de DNA.

Tabela 1. comparação de diferentes métodos utilizados pela RRS

RAD Original 2bRAD GBS ddRAD ddGBS SALF
enzima solteiro único do tipo IIB solteiro duplo duplo duplo
enzima (depende da espécie e da densidade do marcador) EcoRⅠ、Shf,etc. BsaXⅠ、Alf,etc. ApekI,Mse,etc. EcoRⅠ、Mse,etc. EcoRⅠ、MseI,etc. MseⅠ、Olá,etc.
Número de loci por 1Mb de tamanho do genoma* 30–500 50–1.000 5–40 0,3–200 0,3–200 50-80
seleção de tamanho Interrupção ultrassónica Não seleção específica por PCR Corte de gel eletroforético Corte de gel eletroforético Corte de gel eletroforético
Comprimento de locos ≤1kb pode ser obtido; caso contrário, ≤300bp 33–36pb <300bp 300-500pb <300bp 450-500 pb
Intervalo de captura do genoma 10% 1% 1-3% 1-3% 1-3% 1-3%
Identificação de duplicados de PCR Com sequenciação de extremidades pareadas Não Com códigos de barras degenerados   Com códigos de barras degenerados   Com códigos de barras degenerados   Com códigos de barras duplamente degenerados  
Variação no número de etiquetas não sim sim sim sim sim
Número de SNPs alto baixo moderado moderado moderado moderado
Tipo de marcador SNP, Indel, SSR SNP, Indel SNP, Indel SNP, Indel SNP, Indel SNP, Indel
Custo alto baixo moderado baixo baixo moderado
genoma de referência necessário melhor pior moderado moderado moderado moderado
Genoma complexo e grande melhor pior moderado moderado bom bom
quantidade de amostra >1 µg >1 µg >200ng >50ng >50ng >200ng
conteúdo de amostra >50ng/µl >250ng/µl >10µg/µl 100ng/µl 100ng/µl >10µg/µl
Equipamento especializado necessário Sonicator Nenhum Nenhum Preparação Pippin Pippin Prep Pippin Prep
estratégia de sequenciação (depende do objetivo do estudo e da população) <1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para indivíduos de análise genética populacional. 0,4-15X >100 mil etiquetas/amostra; 10X/etiqueta; depende do tamanho do genoma e da densidade de marcadores necessária. <1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos. <1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional. <1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos.
vantagens um grande número de marcadores, longos fragmentos podem ser obtidos para o design de primers fragmentos uniformes, operação fácil operação fácil distribuição uniforme de marcadores, número controlável de marcadores distribuição uniforme de marcadores, número controlável de marcadores distribuição uniforme de marcadores, número controlável de marcadores
desvantagens operação de experimento complexo  loci mais curtos, não adequados para genomas complexos e heterozigóticos menos loci do que RAD, alta taxa de dados em falta menos loci do que RAD menos loci do que RAD interferência da degradação do ADN, desperdício de dados
aplicações Pesquisa sobre marcadores de alta densidade e desenvolvimento de marcadores moleculares. genoma simples amostras grandes e múltiplos genomas complexos com sequências repetitivas altas amostras grandes e múltiplos genomas complexos com alta sequência repetitiva amostras grandes e múltiplos genomas complexos com sequências repetitivas altas amostras grandes e múltiplos genomas complexos com sequências repetitivas altas
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo