Estratégias para Mapeamento Fino de SNP: Análise de Segregantes Agrupados

Visão Geral Rápida

01 Princípios Fundamentais da Análise de Segregação em Lote (BSA)? 02 Análise de Segregantes em Lote Sequenciamento 03 Fluxo de Trabalho de Análise de Segregantes em Lote 04 Estudo de Caso: Mapeamento Rápido de QTL da Altura da Planta de Milho 05 Considerações e Desafios 06 Como a CD Genomics Pode Ajudá-lo

Uma população F2 em grande escala pode ser utilizada para realizar Análise de Segregação em Lote (BSA) para mapeamento inicial. Subsequentemente, dentro dos intervalos de mapeamento identificados, marcadores de polimorfismo de nucleotídeo único (SNP) podem ser utilizados para construir mapas de ligação locais detalhados e realizar mapeamento de locus de traços quantitativos (QTL). Esta abordagem melhora a precisão na localização de loci de traços-alvo. Além disso, a integração de dados de sequenciamento de transcriptoma para análise conjunta facilita a identificação acelerada de genes candidatos. Esta metodologia é antecipada para dominar como a estratégia principal para mapeamento fino no futuro previsível.

Princípios Fundamentais da Análise de Segregação em Lote (BSA)

BSA, também conhecido como análise de pool misto ou análise de pool de população segregante, é uma abordagem metodológica que envolve a seleção de indivíduos com fenótipos extremos ou representativos de uma população para criar pools mistos para análise. Ao examinar as diferenças nas frequências de alelos ou marcadores moleculares entre estes pools mistos, loci associados a características específicas podem ser mapeados no genoma.

Em comparação com os métodos tradicionais de pesquisa genética, uma vantagem notável da BSA é que elimina a necessidade de genotipar todos os indivíduos dentro de uma população. Em vez disso, foca na análise de amostras agrupadas de indivíduos selecionados com base nas suas características fenotípicas. Esta abordagem reduz significativamente a carga de trabalho e os custos associados ao estudo. Por exemplo, numa população de 500 indivíduos, o genotipagem de apenas dois grupos parentais e dois grupos de descendentes pode ser suficiente para completar uma análise BSA (e mesmo apenas os grupos de descendentes sozinhos podem facilitar a análise BSA na ausência de grupos parentais). Além disso, desde que o desenho experimental seja sólido, a fiabilidade estatística da análise BSA é comparável a métodos que envolvem o estudo de todas as amostras individuais.

Além disso, a BSA não depende exclusivamente de tecnologias de sequenciação. Pode ser utilizada com marcadores moleculares, microarranjos e métodos de sequenciação de alto rendimento em várias camadas biológicas, incluindo DNA, RNA e proteínas. No entanto, até agora, metodologias abrangentes de BSA a nível de proteínas não foram totalmente estabelecidas. Consequentemente, as análises de BSA estão predominantemente concentradas nas camadas de DNA e RNA.

Análise de Segregantes em Lote por Sequenciação

Uniformidade das Piscinas

Para a BSA, garantir a uniformidade dentro do pool é crucial. Esta uniformidade implica que o DNA sequenciado deve ser proveniente de forma equitativa de cada indivíduo. Portanto, recomenda-se primeiro extrair ácidos nucleicos de cada indivíduo e, em seguida, combinar esses extratos para formar o pool, em vez de misturar as amostras antes da extração de ácidos nucleicos.

Tamanho do Pool e Profundidade de Sequenciamento

O tamanho do pool e a profundidade de sequenciação são ambos fatores críticos que influenciam a precisão do mapeamento de lócus. Um aumento no tamanho do pool ou na profundidade de sequenciação geralmente melhora a precisão da localização. No entanto, além de um certo limiar, aumentos adicionais no tamanho do pool e na profundidade de sequenciação resultam em retornos decrescentes em relação à melhoria da precisão de localização. Para populações F2 convencionais, é tipicamente necessário incluir mais de 30 indivíduos por pool, com uma profundidade de sequenciação de 20× para as sequências parentais e 1× por indivíduo para os pools de descendentes.

Extremos de Traços

Dada uma dimensão populacional fixa, o tamanho do pool deve ser adequadamente limitado para garantir que o pool represente com precisão traços extremos específicos. Se os traços selecionados não forem suficientemente extremos, isso pode levar a uma localização malsucedida. Para melhorar a precisão da localização aumentando o tamanho do pool, é necessário aumentar simultaneamente o tamanho total da população. É imperativo evitar a mistura de indivíduos de diferentes populações com fenótipos semelhantes para a análise BSA.

Fluxo de Trabalho de Análise de Segregantes em Lote

Construção da População: As populações F1, F2 e BC1F1 estão estabelecidas.

Mapeamento de Locais de Características Quantitativas (QTL)Os QTLs são mapeados na população F2. A validação dos resultados do mapeamento de QTL é realizada utilizando linhas progenitoras F2:3.

Segregação de QTLOs marcadores moleculares são utilizados para selecionar QTLs-alvo que são heterozigóticos. Plantas individuais BC1F1 são identificadas onde outros QTLs são homozigóticos (é necessário um número suficiente de indivíduos BC1F1). A autopolinização subsequente produz linhas de progénie BC1F1:2.

Seleção de Fenótipos ExtremosDois grupos de fenótipos extremos são selecionados da população BC1F1:2.

Agrupamento de Fenótipos ExtremosO DNA é extraído dos grupos fenotípicos extremos selecionados e agrupado para formar dois grupos extremos.

Sequenciação e Chamada de VariantesA sequenciação é realizada nas duas amostras agrupadas. As variantes são identificadas alinhando os dados de sequenciação contra um genoma de referência.

Análise de AssociaçãoA análise do índice SNP é realizada (Takagi H, et al., 2013; Mansfeld BN, et al., 2018).

Para informações adicionais sobre o fluxo de trabalho, consulte o "Fluxo de Trabalho da Tecnologia BSA-seq"

Pode estar interessado em

Estudo de Caso: Mapeamento Rápido de QTL de Altura da Planta de Milho

Um milho estudo populacional foi realizado para identificar QTLs associados à altura das plantas. Utilizando quatro gerações de materiais de milho, foi criada uma população F2 segregante a partir de duas linhas endogâmicas, HZS e 1462, que apresentam diferenças significativas de altura. A altura individual das plantas na população F2 variou de 199 cm a 307 cm, indicando um traço altamente segregante, sugerindo a envolvência de múltiplos QTLs no controle da altura das plantas.

Metodologia

Construção da População:

A população segregante F2 foi desenvolvida a partir das duas linhas endogâmicas HZS e 1462.

Mapeamento de QTL:

Um total de 1.028 marcadores polimórficos foram utilizados para identificar QTLs de efeito maior. Quatro QTLs foram mapeados nos cromossomas 1, 3, 6 e 7, com a variação fenotípica explicada (PVE) variando entre 7% e 17%. Os resultados do mapeamento de QTL foram validados utilizando linhas progenitoras F2:3.

Mapeamento Fino de qPH7:

O QTL localizado no cromossoma 7, designado como qPH7, foi submetido a mapeamento fino utilizando uma estratégia de QTL-seq. A partir de 813 plantas BC1F1 individuais (heterozigóticas para qPH7 e homozigóticas para os outros três loci de QTL), foram selecionadas 15 plantas, e foram geradas linhas de progénie BC1F1:2. A altura das plantas foi avaliada, resultando em 3.120 plantas BC1F1:2 individuais. Estas foram divididas em dois grupos fenotípicos extremos: baixo valor (580 plantas) e alto valor (567 plantas). O DNA destes grupos foi agrupado em pools de baixo e alto valor, respetivamente.

Sequenciação de Genoma Completo:

Sequenciação do genoma completo foi realizado nas amostras agrupadas (cobertura > 280×), detectando 197.021 SNPs de alta qualidade. A genotipagem de marcadores confirmou a localização do pico entre 135.1 e 135.2 Mb. A análise utilizando os algoritmos smoothLOD e ED4 revelou um único pico no cromossoma 7, localizado em 135.3 Mb.

Identificação de Genes Candidatos

Para identificar ainda mais os genes candidatos, análise de RNA-seq foi realizado. A análise de expressão diferencial mostrou que Zm00001d020874 exibiu expressão diferencial significativa entre o meristema apical do broto (SAM) e os tecidos do internódio juvenil das linhagens parentais. Com base em homólogos funcionais em Arabidopsis e no sinal de mapeamento smoothLOD, Zm00001d020874 é considerado um gene candidato para qPH7. Experimentos subsequentes, incluindo knockout de genes CRISPR e ensaios de interação proteica, apoiam o papel de Zm00001d020874 como um gene que controla a altura da planta.

Conclusão

O estudo demonstra uma abordagem eficaz para mapear rapidamente QTLs associados à altura das plantas de milho e identificar genes candidatos através de uma combinação de análises de QTL-seq e RNA-seq. As descobertas contribuem para uma melhor compreensão do controlo genético da altura das plantas e fornecem uma base para uma validação funcional adicional.

Considerações e Desafios

Desafios Técnicos na Mapeação de Híbridos Mutante-Tipo Selvagem

Durante o processo de mapeamento de intervalos utilizando mutantes e híbridos de tipo selvagem, podem surgir certos desafios técnicos. Consequentemente, esta abordagem deve ser utilizada com cautela ou evitada sempre que possível devido a estas complexidades.

Considerações na BSA e Mapeamento de Genes Candidatos

Ao aplicar BSA ou outras técnicas de precisão para localizar genes candidatos, é essencial notar que a ausência de polimorfismo entre as linhas parentais numa região específica não indica necessariamente um falso positivo no intervalo mapeado. Os mecanismos regulatórios moleculares subjacentes à variação fenotípica entre espécies são intrincados e multifacetados. Tal variação pode ser atribuída a vários fatores, incluindo SNPs, InDels, mutações em exões ou variações em regiões promotoras.

É um desafio comum em estudos de mapeamento e clonagem de genes encontrar cenários onde os polimorfismos esperados não são evidentes. No entanto, existem casos em que a metilação do DNA atua como um mecanismo regulador crítico. Por exemplo, durante o processo de vernalização, temperaturas baixas induzem alterações nos estados de metilação do DNA, que por sua vez regulam a expressão do gene FLOWERING LOCUS C (FLC), afetando, em última análise, o processo de floração nas plantas (Sheldon et al., 2000; Berry et al., 2015).

Como a CD Genomics Pode Ajudá-lo

A CD Genomics, como um fornecedor líder de análise genética populacional e serviços de genotipagemestá comprometida em fornecer soluções excecionais e rentáveis através de uma gama de métodos técnicos altamente especializados. No domínio da análise genética populacional, a empresa destaca-se na utilização de técnicas avançadas, como o sequenciamento simplificado do genoma, reessequenciação do genoma, Sequenciação BSA, Target-seqeucariota sequenciação do transcriptomaEstes métodos são meticulosamente concebidos para satisfazer as necessidades de análise genética precisas e eficientes de uma clientela diversificada.

No campo da genotipagem, a CD Genomics demonstra uma substancial experiência e proficiência técnica. A empresa foca no desenvolvimento de painéis de marcadores SNP de genoma completo para fornecer aos clientes informações genéticas precisas e extensas. Além disso, a CD Genomics oferece serviços de genotipagem de SNP de alto rendimento para acomodar requisitos de processamento de amostras em grande escala. A empresa também é proficiente em utilizar Marcadores SSR, incluindo técnicas de eletroforese em gel PAGE e eletroforese em gel de agarose, para análise de genotipagem. Esta experiência é particularmente valiosa no âmbito da identificação de variedades de culturas, apoiando a melhoramento genético agrícola e a proteção da propriedade intelectual.

Referência:

Zhang H, Wang X, Pan Q, Li P, Liu Y, Lu X, Zhong W, Li M, Han L, Li J, Wang P, Li D, Liu Y, Li Q, Yang F, Zhang YM, Wang G, Li L. QTG-Seq Acelera o Mapeamento Fino de QTL através da Partição de QTL e Sequenciação do Genoma Completo de Amostras de Segregantes Agrupados. Planta Mol. 2019 Mar 4;12(3):426-437.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.

Serviços Relacionados