O Fluxo de Trabalho da Sequenciação RAD
A Sequenciação do Genoma de Representação Reduzida (RRGS) refere-se à sequenciação direcionada de porções específicas do genoma. Esta tecnologia de ponta utiliza endonucleases de restrição para sequenciar enzimaticamente o DNA genómico, permitindo a sequenciação em alta capacidade dos segmentos sequenciados enzimaticamente.
O método de construção da biblioteca classifica a RRGS em três categorias principais: Bibliotecas de Representação Reduzida (RRL), DNA Associado a Locais de Restrição (RAD) e Genotipagem por Sequenciação (GBS). Notavelmente, o RAD e o GBS destacam-se como os métodos mais amplamente adotados, com variantes como 2b-RAD, dd-RAD e SLAF a refinarem e avançarem estas técnicas em vários aspetos.
No domínio da RRGS, a sequenciação RAD desempenha um papel fundamental. O seguinte elucida os métodos e passos envolvidos na sequenciação RAD.
Extração e Controlo de Qualidade das Amostras de DNA
Para resultados ótimos, é aconselhável utilizar um kit de extração de DNA para extrair DNA de ambos os progenitores e populações, seguindo o procedimento padrão. Nos casos em que o DNA foi extraído utilizando o método tradicional SDS ou CTAB, recomenda-se um passo adicional de extração para eliminar proteínas e RNA.
- Tipo de Amostra: As amostras de DNA devem passar por eletroforese em agarose para garantir mínima ou nenhuma degradação. As amostras devem estar livres de contaminação, com a análise NanoDrop a confirmar uma concentração de DNA dentro da faixa de razão OD260/OD280 de 1.8 a 2.0.
- Requisitos da Amostra: Cada preparação de amostra necessita de 1 μg da amostra. Para múltiplas preparações, o requisito total de amostra é calculado como o número de preparações multiplicado por 1 μg.
- Concentração da Amostra: A concentração individual da amostra deve ser igual ou superior a 25 ng/μl, com a concentração recomendada a situar-se na faixa de 100 a 200 ng/μl.
- Tamanho de Amostra Recomendado: Ao lidar com indivíduos descendentes, é aconselhável ter um tamanho de amostra de pelo menos 100 indivíduos.
Aderir a estas diretrizes contribuirá para a extração de amostras de DNA de alta qualidade, essenciais para análises subsequentes.
Construção da Biblioteca e Sequenciação
Para simplificar o processo de sequenciação do genoma para espécies que carecem de genomas de referência, o passo inicial envolve a seleção criteriosa de uma endonuclease de restrição adequada para digerir o genoma alvo. Esta escolha pode ser informada pela literatura existente ou referenciando informações genómicas de espécies intimamente relacionadas com genomas sequenciados. Simultaneamente, a endonuclease selecionada passa por pré-testes enzimáticos no genoma, com a escolha subsequente da endonuclease mais adequada para novos experimentos com base nos resultados dos pré-testes. O seguinte descreve os passos para a construção da biblioteca e sequenciação:
- Preparação e Secagem das Amostras, Codificação e Juntas: Garantir a preparação e secagem adequadas das amostras, incluindo a incorporação de códigos de barras e juntas.
- Digestão do DNA: Utilizar uma endonuclease de restrição selecionada ou uma combinação de endonucleases para digerir o DNA genómico.
- Adição de Adaptadores aos Fragmentos de DNA Digeridos:
Anexar adaptadores em ambas as extremidades dos fragmentos de DNA digeridos, onde o RAD de uma única enzima contém uma sequência de código de barras em uma extremidade e nenhuma barra na outra, e o RAD de dupla enzima apresenta sequências de código de barras em ambas as extremidades.
- Pooled Amostras e Purificação: Combinar amostras e purificar o DNA agrupado.
- Seleção de Fragmentos: Para RAD único, interromper aleatoriamente os fragmentos utilizando ondas ultrassónicas para seleção; para RAD duplo, cortar eletroforeticamente e recuperar fragmentos de tamanho alvo diretamente.
- Amplificação PCR e Enriquecimento de Fragmentos: Realizar amplificação PCR e enriquecimento, com o RAD de uma única enzima a utilizar juntas universais e enriquecimento PCR, e o RAD de dupla enzima a usar o terceiro passo de amplificação PCR com primers de juntas e enriquecimento.
- Purificação do Produto PCR e Sequenciação da Biblioteca após Controlo de Qualidade: Purificar os produtos PCR e submeter a biblioteca à sequenciação após medidas de controlo de qualidade.
Vale a pena notar que os fragmentos sequenciados obtidos de RAD de digestão única e dupla diferem. Os fragmentos de RAD de digestão única são não orientados, alinhando-se apenas do lado com o local de clivagem. Em contraste, os fragmentos de RAD de digestão dupla são orientados, alinhando as leituras em ambos os lados.
Agrupamento de Tags
(1) Controlo de Qualidade dos Dados
Após a aquisição das sequências sequenciadas iniciais (Leituras Sequenciadas), um meticuloso processo de controlo de qualidade foi realizado. Isso envolveu a filtragem de sequências de splice, polyN, polyA e outras sequências indesejadas, resultando em um conjunto de dados refinado denominado 'cleandata.'
(2) Classificação de Amostras e Agrupamento de Tags RAD com Códigos de Barras
Após o controlo de qualidade, as amostras foram classificadas utilizando códigos de barras. Leituras duplicadas resultantes da amplificação PCR foram sistematicamente eliminadas. Subsequentemente, o módulo ustacks do software Stack facilitou a montagem de clusters. O agrupamento de tags, essencial para organizar e agrupar sequências semelhantes, foi então executado com base nas similaridades de sequência dentro do conjunto de dados.
Identificação de Variantes
Após a exclusão de RAD-tags com alta profundidade de comprimento de leitura (>500), os RAD-tags biparentais passaram por uma análise abrangente através da comparação BLAST. Este processo levou à identificação de SNPs e InDels genuínos (≥2 bp) a partir dos resultados da comparação. Subsequentemente, estas variantes foram escrutinadas dentro de populações segregantes, com apenas SNPs a demonstrar polimorfismos consistentes em ambos os conjuntos de dados parentais e populacionais sendo retidos.
No caso de RADs cleaved de enzima única, sequências do lado oposto de cada RAD-tag foram meticulosamente unidas para gerar contigs. Estas sequências de contig também foram utilizadas para a identificação de SNPs e InDels. Além disso, se a sequência de um contig contivesse um Repetido de Sequência Simples (SSR), servia como um recurso valioso para o desenvolvimento de marcadores PCR.
Construção do Mapa Genético
As proporções de segregação de todos os marcadores dentro de populações segregantes foram minuciosamente examinadas utilizando o teste do qui-quadrado. Apenas marcadores que exibissem proporções de segregação alinhadas com o padrão de herança de um único locus, e com dados de deleção inferiores a 40%, foram considerados para inclusão no processo de construção do mapa genético. Por exemplo, na população F2 que adere à proporção 1:2:1 (pai puro 1: heterozigoto: pai puro 2) e na população RIL com uma proporção de 1:1 (pai puro 1: pai puro 2), foram selecionados marcadores que atendiam a estes critérios.
Para abordar marcadores segregantes tendenciosos, apenas aqueles com uma frequência alélica mínima superior a um valor crítico na população foram retidos, extraindo insights da literatura pertinente à espécie alvo. O software Joinmap provou ser instrumental na facilitação da subsequente construção do mapa genético.
Localização de Genes/QTL
(1) Localização de Genes de Características de Qualidade
Embora a sequenciação RAD seja menos comumente utilizada para a localização de genes de características de qualidade, é aconselhável incluir dados fenotípicos tanto da população F2 quanto das linhas familiares F2:3. Esta abordagem permite a identificação de genótipos heterozigotos associados à característica alvo dentro da monocultura F2. Os dados fenotípicos da F2 podem ser tratados como um marcador, com os dados genotípicos dos marcadores restantes inseridos no Joinmap para mapeamento. No entanto, para resultados ótimos na localização de genes de características de qualidade, a estratégia de Análise de Segregantes em Lote (BSA) é recomendada.
(2) Localização de QTL
A sequenciação RAD encontra uma aplicação mais ampla na localização de QTL, necessitando de dados fenotípicos robustos da população e de uma população de linhas endogâmicas recombinantes com um mínimo de 6 gerações F. Uma coleta abrangente de dados de dois pontos ao longo de pelo menos dois anos para cada linha familiar na população é essencial. Isso envolve ensaios em blocos aleatórios com três réplicas por ponto por ano. Resultados imprecisos de localização de QTL podem surgir com menos réplicas. Idealmente, a característica alvo deve exibir alta herdabilidade, e seu fenótipo deve ser minimamente influenciado por condições ambientais. A escolha de software apropriado para localização de QTL deve alinhar-se com as características da população alvo e o número de marcadores disponíveis para o processo de localização de QTL.