O que é BSA
A BSA, análise de segregação em massa, é uma técnica de mapeamento de QTL para identificar locos genómicos que afetam um traço de interesse. A técnica envolve a formação de dois grupos cruzando indivíduos com fenótipos extremamente opostos ou um mutante de interesse é cruzado com o tipo selvagem, em seguida, são criados dois lotes selecionando indivíduos das extremidades da distribuição fenotípica, seguidos de sequenciação em pool, e as frequências alélicas são estimadas para os dois lotes; diferenças seriam exibidas entre os dois lotes se as regiões do genoma contivessem locos causais.

O que é BSA-seq
À medida que as técnicas de agrupamento populacional avançaram e o custo de Sequenciação de Nova Geração (NGS) diminuiu significativamente, a integração de reessequenciação do genoma completo A Análise de Segregação em Lote (BSA) tornou-se uma abordagem proeminente. A fusão da BSA com o sequenciamento de nova geração (NGS), referida como BSA-seq, acelerou a identificação de marcadores estreitamente ligados a características-chave, melhorando assim a descoberta de genes e aumentando a resolução do mapeamento de Locais de Características Quantitativas (QTL). Notavelmente, a BSA-seq oferece economias de tempo substanciais na construção de populações experimentais, particularmente ao identificar QTLs, tornando-a um meio rápido e eficiente para identificar genes funcionais e loci associados a características quantitativas. Em resumo, a BSA-seq, enraizada na fusão de agrupamento populacional e tecnologias de sequenciamento de segunda geração, é capaz de discernir locais de polimorfismo de nucleotídeo único (SNP) associados a características fenotípicas. Tem encontrado ampla aplicação na localização precisa de QTLs e na identificação de genes-alvo funcionais.
Princípios da Tecnologia BSA-seq
A técnica BSA-seq abordou muitas das limitações associadas à criação de Linhas Isogénicas Próximas (NILs) em culturas. O seu princípio envolve a hibridação de um par de linhas parentais que exibem características contrastantes de interesse. Subsequentemente, a partir de qualquer população de progénie segregante (tipicamente a geração F2), são selecionadas de 20 a 50 plantas individuais que apresentam fenótipos extremos para a característica alvo. O DNA destes indivíduos é então extraído e agrupado em equimolaridade, resultando na criação de dois pools genéticos distintos. Estes dois pools genéticos devem diferir em relação à característica de interesse, enquanto todos os outros loci genómicos permanecem aleatorizados. Marcadores polimórficos identificados a partir da comparação destes dois pools podem estar associados a um gene funcional ou a um QTL de interesse.
Vantagens e Características do BSA-seq
- Período experimental curto
- Resultados de mapeamento precisos
- Custo-efetivo
Fluxograma do Experimento BSA
Nature Biotechnology, 2011., Akira Abe et al.
Especificações de Serviço
Requisitos de Amostra
|
|
Clique |
Estratégia de Sequenciamento
|
| Análise Bioinformática Fornecemos múltiplas análises de bioinformática personalizadas:
|
Análise de Dados BSA-seq
Para identificar loci de genes funcionais, é essencial uma comparação ao nível de SNP entre as duas populações agrupadas e sequenciadas. O método mais comumente utilizado para este propósito é a abordagem do índice de SNP. O seu princípio subjacente envolve a análise estatística das bases em cada posição de nucleotídeo utilizando as leituras de sequenciamento. Um progenitor de referência ou um genoma de referência existente é tipicamente selecionado como referência. As contagens de leituras no pool de descendentes que correspondem ou diferem da referência em uma posição específica de nucleotídeo são contabilizadas, e a razão de leituras diferentes em relação ao total de leituras naquela posição é calculada, resultando no índice de SNP. O índice de SNP é determinado dentro de uma janela deslizante, geralmente utilizando um tamanho de janela de 1 Mb com um incremento de 10 kb para cada deslizamento. Além disso, Δ(índice de SNP) é utilizado para medir a diferença nos índices de SNP entre os dois pools de genes, capturando efetivamente variações em loci individuais. Os resultados são tipicamente visualizados em um gráfico de Manhattan, como ilustrado abaixo, onde o eixo horizontal representa posições cromossómicas, o eixo vertical do gráfico de índice de SNP indica as razões de leitura calculadas para cada posição de SNP, e o eixo vertical do gráfico de Δ(índice de SNP) representa a diferença nos índices de SNP entre as duas amostras agrupadas. Quanto maior o valor absoluto de Δ(índice de SNP), mais significativamente associado um locus está ao traço extremo.
Exemplo de Resultados de Cálculo do Índice SNP e Δ(Ipndex SNP)
Entregáveis
- Os dados de sequenciação originais
- Resultados experimentais
- Relatório de análise de dados
Referência
- Michelmore RW, Paran I, Kesseli RV. Identificação de marcadores ligados a genes de resistência a doenças através da análise de segregantes em grupo: um método rápido para detectar marcadores em regiões genómicas específicas utilizando populações segregantes. Proc Natl Acad Sci U S A. 1991;88(21):9828-9832. doi:10.1073/pnas.88.21.9828
- Zhang K, Li Y, Zhu W, et al. Mapeamento Fino e Análise do Transcriptoma do Gene de Folha Virescente v-2 em Pepino (Cucumis sativus L.). Front Plant Sci. 2020;11:570817. Publicado a 25 de setembro de 2020. doi:10.3389/fpls.2020.570817
- Lee SB, Kim JE, Kim HT, Lee GM, Kim BS, Lee JM. O mapeamento genético do locus c1 através de BSA-seq baseado em GBS revelou o Regulador de Resposta Pseudo 2 como um gene candidato que controla a cor do fruto do pimento. Teor. Apl. Genet.. 2020;133(6):1897-1910. doi:10.1007/s00122-020-03565-5
- Guo Z, Cai L, Chen Z, et al. Identificação de genes candidatos que controlam a tolerância ao frio do arroz na região fria na fase de espigamento através de BSA-Seq e RNA-Seq. R Soc Open Sci. 2020;7(11):201081. Publicado a 18 de novembro de 2020. doi:10.1098/rsos.201081
- Zhao Z, Sheng X, Yu H, Wang J, Shen Y, Gu H. Identificação de Genes Candidatos Envolvidos na Aridez do Couve-flor. Int J Mol Sci. 2020;21(6):1999. Publicado a 15 de março de 2020. doi:10.3390/ijms21061999
- Aguado E, García A, Iglesias-Moya J, et al. Mapeamento de um Locus de Andromonoecia Parcial em Citrullus lanatus Usando Abordagens BSA-Seq e GWAS. Frontiers in Plant Science. 2020;11:1243. Publicado em 19 de agosto de 2020. doi:10.3389/fpls.2020.01243
Os resultados parciais estão mostrados abaixo:

Q1: Que tipo de linhagens parentais são adequadas para a construção de populações?
A1: Recomenda-se selecionar linhas parentais com loci heterozigóticos mínimos e diferenças de traços singulares. Além disso, as diferenças entre as linhas parentais não devem ser demasiado extensas, uma vez que uma diferenciação excessiva pode levar a falsos positivos pronunciados, dificultando a identificação das verdadeiras regiões-alvo. Ao selecionar linhas parentais para o traço alvo, podem ser utilizados vários métodos, como mutagénese por EMS, indivíduos naturais e mutagénese por UV, todos os quais podem ser utilizados na Análise de Segregação em Lote (BSA).
Q2: O que justifica a preferência pela seleção de linhagens individuais em vez de populações mistas, populações naturais ou populações arbóreas?
A2: Populações mistas, populações naturais e populações de árvores são frequentemente caracterizadas por um grau significativo de heterozigosidade, resultando numa diversidade genética substancial. Mesmo dentro de regiões limitadas de ADN, a coexistência de múltiplos genótipos alélicos é uma ocorrência comum. Esta prevalência de genótipos diversos dentro de pools de ADN leva a uma diminuição da fiabilidade na deteção de polimorfismos de nucleótido único (SNPs) e no cálculo preciso das frequências de genótipos.
Em linhagens híbridas, um segmento de DNA geralmente contém apenas dois alelos, um de cada progenitor, tornando o alinhamento de leituras a uma sequência de referência e a deteção de variantes relativamente simples. Em populações altamente heterozigóticas, a combinação de DNA de várias fontes aumenta a diversidade de leituras, levando a taxas de erro mais elevadas no alinhamento do genoma de referência e na deteção de SNPs.
Na análise BSA-seq baseada nas linhagens híbridas, a maioria dos genótipos mutantes apresenta alta frequência (≥0,5), tornando-os relativamente fáceis de detectar. Em contraste, populações naturais frequentemente exibem numerosos SNPs de baixa frequência, e quando agrupados, torna-se difícil distinguir os verdadeiros SNPs de baixa frequência daqueles resultantes de erros de sequenciação ou alinhamento, introduzindo complexidades na análise dos dados.
Q3: É viável extrair DNA parental de amostras de sementes e DNA da progénie de amostras de folhas?
A3: A seleção de partes específicas da planta para extração de DNA depende de dois fatores fundamentais: a constituição da casca da semente e do endosperma, e o grau de homozigosidade. A origem predominantemente atribuída ao progenitor materno dentro da casca da semente pode exercer uma influência. Da mesma forma, o grau de homozigosidade na prole é uma consideração crucial. Em casos onde a homozigosidade é substancial e a disparidade entre o DNA parental e o da prole é mínima, a influência torna-se reduzida.
Q4: Qual é o procedimento recomendado para agrupar o DNA da prole?
A4: É aconselhável extrair o DNA de forma individual de cada amostra de descendente e, em seguida, combiná-los em quantidades equimolares. Esta abordagem serve para minimizar o ruído de fundo e mitigar potenciais erros sistemáticos.
Q5: Quais critérios devem ser cumpridos pelas populações de descendentes?
A5: Em princípio, qualquer descendência híbrida que demonstre segregação de características para a característica alvo pode ser adequada para Análise de Segregantes em Lote (BSA). As populações comumente utilizadas incluem gerações F2, populações de retrocruzamento e linhas recombinantes endogâmicas. Para características qualitativas, a descendência pode exibir uma proporção de 1:1 ou 3:1, dependendo da característica específica em investigação. No contexto de características quantitativas, é vantajoso que a descendência apresente características que se conformem a uma distribuição normal. Em casos de desvio acentuado da normalidade, torna-se imperativo avaliar a possível influência de genes letais recessivos.
Q6: É possível garantir o tamanho da região candidata e o número de genes candidatos?
A6: As dimensões da região candidata e a quantidade de genes candidatos dependem de vários elementos, incluindo o tamanho da população, o nível de divergência genética entre os materiais parentais, as características do traço alvo, a profundidade de sequenciação e o ambiente genómico específico da espécie estudada. Estes parâmetros podem ser estimados através da perspetiva de experiências específicas do projeto e da literatura pertinente.
Q7: Em casos onde o intervalo mapeado apresenta um tamanho excessivo, que medidas podem ser empregues para ajuste?
A7: Para refinar o intervalo de mapeamento, pode-se fazer ajustes no intervalo de confiança ou optar pela seleção de marcadores SNP e InDel específicos dentro do intervalo de mapeamento BSA, criando posteriormente um mapa local. Esta estratégia revela-se eficaz na minimização da extensão da região de mapeamento.
Q8: Após a seleção do gene candidato, como é validado o gene-alvo?
A8: Os métodos de validação comuns incluem:
Validação de SNP:
Converter SNPs candidatos em marcadores CAPS ou dCAPS para validação.
Analise os locais de reconhecimento das enzimas de restrição para SNPs candidatos, selecione SNPs que causam alterações nos locais de reconhecimento das enzimas, amplifique os fragmentos correspondentes que contêm SNPs utilizando primers específicos e, em seguida, realize a digestão enzimática e a eletroforese em gel para converter SNPs em marcadores CAPS. Analise a polimorfismo dos marcadores CAPS para validação.
Amplifique as regiões SNP candidatas por PCR e valide os produtos de amplificação utilizando sequenciação Sanger.
Valide a expressão do gene candidato em diferentes fenótipos utilizando RT-PCR.
Realizar uma análise de expressão gênica diferencial com base em transcriptomas para examinar diferenças significativas na expressão gênica.
Análise de RNAi: Utilize a tecnologia de RNAi para silenciar ou eliminar especificamente a expressão de genes específicos.
Q9: Quais são os requisitos para as linhas parentais durante a construção da população?
A9: As linhas parentais devem ser o mais puras possível, e essa pureza pode ser alcançada através da autopolinização. As duas linhas parentais devem apresentar diferenças significativas na característica alvo, mas outras características devem ser o mais consistentes possível para minimizar a interferência nas análises de mapeamento subsequentes.
Q10: Qual é a justificação para recomendar a homozigose nas linhas parentais para o traço alvo na sequenciação BSA?
A10: O conceito fundamental do mapeamento de características BSA-seq baseia-se na identificação de SNPs de ambas as fontes parentais e no subsequente cálculo do índice SNP em todo o genoma dentro de pools de descendentes. Se as linhas parentais não forem homozigóticas, isso pode resultar numa taxa de deteção reduzida de SNPs nos descendentes e num índice SNP diminuído. Consequentemente, para alcançar um mapeamento bem-sucedido, tornaria-se necessário baixar o limiar para a seleção do índice SNP, o que poderia levar a um aumento na ocorrência de falsos positivos. No cálculo do índice SNP, a prática predominante envolve usar a linha parental como referência e filtrar para locos homozigóticos, onde o índice SNP é posteriormente calculado no pool de descendentes nesses locos específicos.
Q11: Qual é o número ideal de amostras de descendência a ser recolhido?
A11: A recolha de amostras de descendência deve seguir as seguintes diretrizes: Para características qualitativas, é aconselhável recolher o maior número possível de indivíduos recessivos, com um mínimo de 20 indivíduos, normalmente variando entre 30 e 50. Da mesma forma, deve ser recolhido um número igual de indivíduos dominantes. Relativamente a características quantitativas, geralmente recomenda-se escolher os 5%-10% melhores indivíduos que apresentem os valores de traço mais extremos para uma avaliação adicional. Além disso, a criação de um histograma com base nos dados de traço da descendência pode ser valiosa para orientar o processo de seleção.

Q12: Qual é a profundidade de sequenciação necessária para as linhas parentais e de descendência durante a re-sequenciação?
A12: Para garantir a precisão dos marcadores SNP e InDel, o sequenciamento deve manter uma certa profundidade. Recomenda-se que as linhas parentais tenham uma profundidade de sequenciamento não inferior a 20X. A profundidade de sequenciamento para as amostras agrupadas deve ser determinada com base no número de amostras, com uma profundidade média não inferior a 1X por amostra. Por exemplo, se houver 30+30 descendentes, então a profundidade de sequenciamento para cada grupo de descendentes não deve ser inferior a 30X. Se as restrições orçamentais permitirem, pode considerar aumentar ainda mais a profundidade.
Q13: Pode a sequenciação do genoma reduzido ser utilizada para mapeamento de características BSA?
A13: A tecnologia de BSA de genoma reduzido pode capturar apenas 1% a 10% de todo o genoma. Se a espécie estudada tiver um genoma grande e o traço de interesse for controlado por múltiplos genes menores com numerosos loci associados, o sequenciamento de genoma reduzido pode capturar alguns loci, mas perderá a maioria deles, o que pode ser desvantajoso para pesquisas futuras. Para traços qualitativos ou traços quantitativos controlados por genes principais, existe um alto risco associado ao BSA de genoma reduzido. É aconselhável realizar o sequenciamento de genoma reduzido tanto para as linhas parentais quanto para a população, e construir um mapa de ligação de genoma completo para o mapeamento de genes de traços.
Caso Clássico: O Sequenciamento de Próxima Geração a partir da Análise de Segregação Agrupada Acelera a Identificação Simultânea de Dois Genes Qualitativos na Soja
Diário: Fronteiras na Ciência das Plantas
Fator de Impacto: 6,627
Publicado: 31 de maio de 2017
Fundo
Análise de Segregação em Lote (BSA) oferece uma abordagem simples para a identificação rápida de marcadores moleculares intimamente associados a fenótipos. As técnicas de BSA têm sido utilizadas em várias espécies para a localização de genes importantes. Com os avanços nas tecnologias de sequenciação de DNA, os métodos de BSA baseados em Sequenciação de Nova Geração (NGS) têm acelerado significativamente a identificação de genes causadores de doenças. A soja, uma das culturas leguminosas mais amplamente cultivadas a nível global, tem ficado atrás de outras culturas na identificação e isolamento de genes, devido à limitada variação genética, a um genoma complexo e grande, e à baixa eficiência de transformação genética. Apenas alguns genes que governam características específicas, como o hábito de crescimento do caule e o número de sementes por vagem, foram identificados. O desenvolvimento de métodos para identificar rapidamente genes que controlam características agronómicas importantes é de extrema importância para avançar na pesquisa sobre a funcionalidade dos genes da soja.
FIGURA 1. Análise genética da cor do cotilédone em um cruzamento entre ZH30 e JY102.
Fonte de amostra: Pedigree F2 com foco no fenótipo da cor das folhas amarelo/verde.
Tamanho da Amostra: 2 linhagens parentais + 30 descendentes de folhas amarelas + 30 descendentes de folhas verdes
Profundidade de Sequenciamento: Linhas parentais (12X + 9X), descendência (59X + 53X)
Materiais e Métodos
Preparação de Amostras
- Soja
- Folhas jovens
- Extração de DNA
Sequenciação
- Sequenciação de Próxima Geração
- Illumina HiSeqTM plataforma 2500
- Análise do índice SNP
- Análise de janela deslizante
Resultados
Zhonghuang30 é a linha parental com folhas amarelas, e Jiyu102 é a linha parental com folhas verdes. Através do retrocruzamento da geração F1 com Zhonghuang30 (a linha parental de folhas amarelas), não ocorreu segregação, confirmando a dominância da cor amarela na linha parental. Com base nas proporções de segregação na geração F2 e nas genealogias F2:3, foi determinado que a cor das folhas é controlada por dois genes, sendo o verde uma característica recessiva.
Usando o método QTL-seq, a localização preliminar da característica alvo (cor das folhas) foi realizada, e com base no ΔSNP-index, a característica alvo foi inicialmente mapeada para dois intervalos, qCC1 (~2,68Mb) no Chr1 e qCC2 (~2,68Mb) no Chr11. Subsequentemente, foi realizado um mapeamento fino utilizando marcadores de recombinação SSR e Indel em 200 descendentes para restringir as regiões de mapeamento. qCC1 foi mapeado finamente para uma região de 30,7kb, que incluía quatro genes, sendo o gene D1 um homólogo do gene verde em Arabidopsis, conforme relatado em outros estudos. qCC2 foi mapeado finamente para uma região de 67,7kb, que incluía nove genes, e de forma semelhante, um desses genes, D2, é um homólogo relatado do gene verde em Arabidopsis.
A exploração funcional e validação foram realizadas para estes dois genes candidatos. Foi encontrado que o gene D1 tinha uma base T em falta entre as linhas parentais, levando a uma mutação de desvio de quadro e a uma terminação prematura na linha parental verde, JY102. Além disso, o gene D2 tinha uma repetição de sequência de 322bp entre as linhas parentais, resultando na terminação prematura deste gene na linha parental verde, JY102.
Referência
- Song J, Li Z, Liu Z, et al. O sequenciamento de próxima geração a partir da análise de segregantes agrupados acelera a identificação simultânea de dois genes qualitativos na soja. Fronteiras em Ciência das Plantas2017, 31;8:919.
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
Coleção de dados genéticos em estudos baseados em etnias entre Aymaras, Quechuas e Mestizos: os desafios do estudo sobre a Genética do Alzheimer na População Peruana (GAPP)
Revista: Alzheimer e Demência
Ano: 2022
Avaliação de Biomarcadores Plasmáticos para a Classificação A/T/N da Doença de Alzheimer entre Adultos de Etnia Hispânica Caribenha
Revista: JAMA Network Open
Ano: 2023
Aumento da Produção de Esporos Fúngicos Patogénicos e Aerossóis Após a Exposição de uma Micobiota do Solo a Poluentes Hidrocarbonetos Aromáticos Clorados
Revista: Microbiology Spectrum
Ano: 2023
Uma Variante de Splice no Gene SLC16A8 Leva a um Défice de Transporte de Lactato em Células Epiteliais Pigmentares da Retina Derivadas de Células iPS Humanas
Revista: Células
Ano: 2021
Ver mais artigos publicados pelos nossos clientes.