Fichas Informativas de Sequenciação com Representação Reduzida: Métodos, Vantagens, Aplicações e Estratégias

O que é Sequenciamento de Representação Reduzida, RRS?

A sequenciação de representação reduzida (RRS) é uma abordagem para gerar dados de sequenciação de alto rendimento em todo o genoma e obter um grande número de sequências de marcadores de polimorfismo genético para representar completamente a informação do genoma da espécie. A RRS não só simplifica o método de sequenciação, dado que apenas os fragmentos digeridos são sequenciados, como também simplifica o genoma sequenciado. Portanto, é amplamente utilizada no desenvolvimento de marcadores moleculares, análise genética populacional, construção de mapas genéticos, mapeamento de QTL, análise de associação em todo o genoma e em outros campos de investigação populacional e melhoramento molecular.

Introdução aos métodos utilizados para RRS

Existem vários métodos diferentes de RRS, incluindo GBS, ddGBS, RAD, 2bRAD, ddRAD, SALF, etc. Os princípios destes métodos são basicamente os mesmos, as diferenças residem na utilização de enzimas de restrição simples ou duplas, quebras aleatórias necessárias, código de barras exigido, kit especial necessário, design do adaptador e outros detalhes. A introdução detalhada destes métodos é a seguinte:

RADEste método realiza a digestão única do DNA do genoma completo, em seguida, interrompe aleatoriamente os fragmentos digeridos. Assim, o read1 obtido pela sequenciação é alinhado na posição, enquanto o read2 é desigual, permitindo que contigs mais longos sejam agrupados e emendados de novo, o que é benéfico para o desenvolvimento de marcadores moleculares SSR.

GBSEste método realiza a digestão única de DNA genómico sem interrupção aleatória ultrassónica. Em vez disso, a PCR é utilizada para a seleção do tamanho dos fragmentos, e diferentes amostras são adicionadas com diferentes códigos de barras, permitindo agrupar até 96 amostras. Isso simplifica as etapas de construção de uma biblioteca, tornando o custo inferior ao do RAD.

2bRADEste método utiliza a enzima de restrição tipo IIB para digestão. A enzima de restrição tipo IIB pode cortar segmentos de ADN genómico a montante e a jusante do local de restrição para obter fragmentos de comprimento fixo com um tamanho menor de apenas 33-36 bp.

ddGBSEste método é uma melhoria do GBS. O DNA genómico é digerido com duas enzimas de restrição, o que permite obter fragmentos digeridos mais uniformemente distribuídos no genoma.

ddRADEste método é basicamente o mesmo que o ddGBS, a diferença reside no número de pooling selecionado durante a construção da biblioteca. O processo do ddRAD é mais semelhante ao GBS clássico. Este método utiliza duas enzimas de restrição para cortar o DNA genómico, obtendo fragmentos mais uniformes em todo o genoma, e utiliza eletroforese para selecionar o tamanho dos fragmentos.

SLAFEste método é uma versão otimizada do ddRAD, as enzimas e os tamanhos dos fragmentos de restrição são otimizados com dados de treino para garantir uma distribuição uniforme e evitar repetições. Os fragmentos também são selecionados dentro de um intervalo restrito, para otimizar a reação de PCR. O protocolo é semelhante ao ddRAD, por exemplo, com uma primeira digestão com MseI, inativação por calor e uma segunda digestão com AluI. Os fragmentos resultantes são amplificados por PCR, os adaptadores adicionados e os fragmentos purificados.

Experimental process of each method 1

Experimental process of each method 2 Figura 1. Processo experimental de cada método

Vantagens do RRS

Apenas os fragmentos digeridos são sequenciados, o que reduz significativamente a complexidade do genoma.
Não limitado pelo genoma de referência, também aplicável a espécies sem referência.
Custo-efetivo, alta estabilidade, especialmente adequado para a análise de um grande número de amostras.
Ampla gama de aplicações: genética populacional, mapeamento genético, mapeamento de QTL, análise de associação em todo o genoma, melhoramento molecular, etc.

Comparação de diferentes métodos utilizados pela RRS

As diferenças detalhadas nos métodos utilizados pelos RRS determinam as suas diferenças na aplicação. Na tabela seguinte, diferentes métodos de RRS são comparados: (ver tabela 1)

Aplicação do RRS

Desenvolvimento de marcadores molecularesidentificação de marcadores SNPs/InDel individuais, integração de marcadores SNPs populacionais; cálculo da distância de ligação genética de marcadores polimórficos, construção de mapas genéticos de alta densidade e realização de análise de associação para características específicas, realização de mapeamento fino de genes a jusante.
Construção de mapas genéticos e mapeamento de QTLdiferenciação de grupos de ligação, classificação de marcadores massivos, triagem de locais de segregação enviesada; mapeamento de QTL com base em dados fenotípicos.
Evolução genética populacionalanálise a nível genético populacional baseada em dados de SNPs, incluindo análise da evolução populacional, análise da estrutura populacional, fluxo gênico, teste de pedigree, análise de PCA, etc.
Assistir na montagem de de novo mapa genómico detalhadomontagem do genoma em rascunho, anotação de genes, etc.
Análise de associação genómica em todo o genoma (GWAS)Sequenciação e análise de associação de genoma completo para uma determinada população de espécies, e triagem de locais regulatórios relacionados com o genoma para características específicas.

Estratégia de seleção nos métodos RRS

Objetivo do estudo:
Com base em diferentes propósitos experimentais, o número de marcadores necessários é completamente diferente. Para estudos que necessitam de realizar investigação sobre varredura funcional de intervalos e mineração funcional de genes em todo o genoma, como GWAS e análise de pressão de seleção, são necessários dezenas de milhares de moléculas de alta densidade. No entanto, a densidade de marcadores moleculares para estudos sobre relações filogenéticas, análise de ligação, estrutura populacional geográfica, fluxo gênico e testes de pedigree não precisa ser tão alta, geralmente apenas algumas centenas a alguns milhares de marcadores moleculares são suficientes para completar. Para estudos de mapeamento de genes, diferentes materiais de pesquisa e populações de mapeamento também afetarão o número de marcadores necessários. Por exemplo, o número de marcadores exigidos para análise de associação em todo o genoma utilizando populações naturais está relacionado à distância de decaimento de LD da espécie; quanto mais rápida, mais marcadores são necessários.
O número de marcadores classificados por: RAD≥GBS/SLAF>2b-RADAssim, o número de marcadores necessários para o estudo pode ser avaliado primeiro, e depois a tecnologia de sequenciação do genoma simplificada apropriada pode ser selecionada.
Com ou sem genoma de referência:
Se a espécie em investigação não tiver um genoma de referência ou se a qualidade da montagem do genoma de referência for baixa, a tecnologia RAD pode ser utilizada com mais frequência, uma vez que a tecnologia RAD pode obter fragmentos de até 400~500bp através de montagem parcial, o que é favorável ao desenvolvimento de marcadores moleculares SSR e ao subsequente design de primers; GBS/SLAF também pode usar métodos de agrupamento para construir sequências consensuais para detectar SNPs; o 2b-RAD é suscetível a interferências por sequências repetitivas devido aos seus fragmentos curtos, e não é favorável ao design de primers para verificar os SNPs obtidos por sequenciação. Portanto, o 2b-RAD geralmente requer um genoma de referência.
Seleção de enzimas de restrição:
A escolha da enzima é determinada pela necessidade de densidade de marcadores. A enzima selecionada deve ser adequada para a espécie em estudo (por exemplo, considerar o número de enzimas nas regiões repetitivas da espécie); algumas enzimas são adequadas para certas espécies, mas não necessariamente adequadas para outras espécies; os fragmentos de digestão enzimática geralmente têm extremidades adesivas, e diferentes extremidades adesivas podem exigir diferentes designs de adaptadores.
Preparação de amostras de ADN:
Considerando a eficiência de digestão das enzimas, amostras de DNA de alta qualidade são críticas para todo o processo; além disso, diferentes métodos também requerem volumes de amostra de DNA.

Tabela 1. comparação de diferentes métodos utilizados pela RRS

	RAD Original	2bRAD	GBS	ddRAD	ddGBS	SALF
enzima	solteiro	único do tipo IIB	solteiro	duplo	duplo	duplo
enzima (depende da espécie e da densidade do marcador)	EcoRⅠ、ShfⅠ,etc.	BsaXⅠ、AlfⅠ,etc.	ApekI,MseⅠ,etc.	EcoRⅠ、MseⅠ,etc.	EcoRⅠ、MseI,etc.	MseⅠ、OláⅢ,etc.
Número de loci por 1Mb de tamanho do genoma*	30–500	50–1.000	5–40	0,3–200	0,3–200	50-80
seleção de tamanho	Interrupção ultrassónica	Não	seleção específica por PCR	Corte de gel eletroforético	Corte de gel eletroforético	Corte de gel eletroforético
Comprimento de locos	≤1kb pode ser obtido; caso contrário, ≤300bp	33–36pb	<300bp	300-500pb	<300bp	450-500 pb
Intervalo de captura do genoma	10%	1%	1-3%	1-3%	1-3%	1-3%
Identificação de duplicados de PCR	Com sequenciação de extremidades pareadas	Não	Com códigos de barras degenerados	Com códigos de barras degenerados	Com códigos de barras degenerados	Com códigos de barras duplamente degenerados
Variação no número de etiquetas	não	sim	sim	sim	sim	sim
Número de SNPs	alto	baixo	moderado	moderado	moderado	moderado
Tipo de marcador	SNP, Indel, SSR	SNP, Indel	SNP, Indel	SNP, Indel	SNP, Indel	SNP, Indel
Custo	alto	baixo	moderado	baixo	baixo	moderado
genoma de referência necessário	melhor	pior	moderado	moderado	moderado	moderado
Genoma complexo e grande	melhor	pior	moderado	moderado	bom	bom
quantidade de amostra	>1 µg	>1 µg	>200ng	>50ng	>50ng	>200ng
conteúdo de amostra	>50ng/µl	>250ng/µl	>10µg/µl	100ng/µl	100ng/µl	>10µg/µl
Equipamento especializado necessário	Sonicator	Nenhum	Nenhum	Preparação Pippin	Pippin Prep	Pippin Prep
estratégia de sequenciação (depende do objetivo do estudo e da população)	＜1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para indivíduos de análise genética populacional.	0,4-15X	>100 mil etiquetas/amostra; 10X/etiqueta; depende do tamanho do genoma e da densidade de marcadores necessária.	＜1X para genoma com referência completa; 10-20X para descoberta de locos de denovo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de denovo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos.	＜1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; maior para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional.	＜1X para genoma com referência completa; 10-20X para descoberta de locos de novo ou genotipagem em diploides; 5X para múltiplas amostras combinadas de novo; mais alto para poliploides. 10X para mapeamento de ligação em linhas parentais; 0.8-1.0X para indivíduos de F1, F2; 0.6X para indivíduos de RIL, DH; 1.5X para análise genética populacional de indivíduos.
vantagens	um grande número de marcadores, longos fragmentos podem ser obtidos para o design de primers	fragmentos uniformes, operação fácil	operação fácil	distribuição uniforme de marcadores, número controlável de marcadores	distribuição uniforme de marcadores, número controlável de marcadores	distribuição uniforme de marcadores, número controlável de marcadores
desvantagens	operação de experimento complexo	loci mais curtos, não adequados para genomas complexos e heterozigóticos	menos loci do que RAD, alta taxa de dados em falta	menos loci do que RAD	menos loci do que RAD	interferência da degradação do ADN, desperdício de dados
aplicações	Pesquisa sobre marcadores de alta densidade e desenvolvimento de marcadores moleculares.	genoma simples	amostras grandes e múltiplos genomas complexos com sequências repetitivas altas	amostras grandes e múltiplos genomas complexos com alta sequência repetitiva	amostras grandes e múltiplos genomas complexos com sequências repetitivas altas	amostras grandes e múltiplos genomas complexos com sequências repetitivas altas

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.

Serviços Relacionados