Sequenciação do Genoma Completo de Baixa Cobertura

O que é sequenciação de genoma de baixa cobertura?

Os genótipos detectados usando métodos de resequenciamento de alta profundidade são, sem dúvida, os mais abrangentes, mas atualmente são demasiado dispendiosos para serem aplicados na reprodução de plantas e animais, especialmente para espécies com genomas complexos e grandes. A sequenciação de genoma de baixa cobertura (lcWGS) está a emergir como uma alternativa eficaz ao sacrificar a profundidade de sequenciação em favor de uma maior cobertura do genoma e de um maior tamanho de amostra, com a ajuda de estratégias estatísticas probabilísticas.

A estratégia LcWGS combina as vantagens do RAD-seq, evitando as desvantagens. Pode estudar o genoma completo a nível populacional (considerando tanto a profundidade quanto a amplitude do genoma), enquanto retém a informação dos indivíduos, e o custo é comparável a ambos. Portanto, obter genótipos em todo o genoma através da LcWGS combinada com algoritmos é uma prática popular nos últimos anos.

Características da tecnologia de sequenciação de genoma de baixa cobertura

LcWGS WGS Array RAD-seq
Profundidade de sequenciação baixa alta - alta
Número de variantes mais mais menos menos
Deteção de novas variantes sim sim não não
Precisão moderada alta alta alta
Genoma de referência sim sim sim sim/não
Custo baixo alto baixo baixo

Que problemas pode resolver a LcWGS?

A sequenciação de genoma de baixa cobertura (lcWGS) realiza primeiro resequenciamento de genoma completo de baixa profundidade e deteção de variantes para todos os indivíduos numa população, e depois usa algoritmos para inferir e preencher (Imputação) os genótipos em falta com base no desequilíbrio de ligação (LD) entre variantes, e finalmente obtém marcadores genéticos de alta densidade a nível de genoma completo para amostras em grande escala.

Nos últimos anos, a LcWGS para grandes amostras foi teoricamente demonstrada para obter marcadores SNP de alta densidade em todo o genoma a um custo muito baixo, o que, por sua vez, aumenta a precisão da localização de QTL e explora melhor os mecanismos genéticos de várias doenças. A LcWGS também foi utilizada para análise de associação e estudos de genética populacional. A vantagem de populacionar dados de baixa densidade até ao nível de sequenciação de genoma completo para previsão de valor de reprodução revelou-se altamente dependente da distribuição de frequência de mutações causais. A superioridade dos dados populacionados sob um modelo neutro foi pequena, e a precisão da avaliação genética usando dados populacionados poderia ser melhorada em 30% quando todas as frequências alélicas mínimas de mutações causais eram baixas.

Fluxo de trabalho da análise LcWGS

O processo de pré-processamento da LcWGS é semelhante ao WGS, mas uma diferença importante é a necessidade de usar probabilidades genotípicas para explicar a probabilidade de incerteza genotípica, como a análise a montante usando o espectro de frequência de sítio (SFS). O processo de análise de dados da lcWGS, que usa probabilidades genotípicas para explicar a incerteza genotípica. Desde o espectro de frequência alélica (SFS) até estatísticas de diversidade e FST, é o processo de análise do software ANGSD. Outras ferramentas (por exemplo, ATLAS) podem inferir essas estatísticas diretamente a partir de GLs sem uso prévio de SFS.

Fluxo de trabalho da lcWGS.Fluxo de trabalho da lcWGS. (Lou et al., 2021)

Como desenhar experiências para sequenciação de genoma de baixa cobertura?

Não existe um único conjunto de desenhos experimentais para resequenciamento de baixa profundidade que seja adequado para todos os objetivos de estudo. Em vez disso, o design ótimo depende dos objetivos do estudo, do sistema e do orçamento. Dado um orçamento, os principais compromissos para resequenciamento de baixa profundidade são o tamanho da amostra e a profundidade de sequenciação. Por exemplo, a estimativa de frequência alélica, a análise da estrutura populacional e a diferenciação genética entre populações podem ser sequenciadas com mais amostras para obter resultados precisos; espectros de frequência alélica (SFS), inferência demográfica usando δaδi, Tajima'D, ou valores absolutos de LD requerem consideração de profundidades de sequenciação mais elevadas. Portanto, os pesquisadores devem considerar cuidadosamente qual tipo de análise é mais importante para os objetivos do estudo e encontrar o equilíbrio apropriado. Sintetizando os resultados dos nossos e de estudos anteriores, fornecemos algumas diretrizes gerais para o desenho de experiências de resequenciamento de baixa profundidade.

Quais são as vantagens da sequenciação de genoma de baixa cobertura?

A sequenciação de genoma de baixa cobertura refere-se à sequenciação de um genoma a uma profundidade relativamente baixa, resultando tipicamente em cobertura incompleta de todo o genoma. Embora a sequenciação de baixa cobertura tenha algumas vantagens, também apresenta certas limitações.

Vantagens da sequenciação de genoma de baixa cobertura:

  • Custo-efetiva: A sequenciação de baixa cobertura requer menos recursos de sequenciação, tornando-a mais custo-efetiva em comparação com a sequenciação de alta profundidade. Isso permite que os pesquisadores sequenciem um maior número de amostras dentro de um orçamento dado.
  • Efetiva para estudos populacionais: Em estudos populacionais, onde os pesquisadores visam analisar variações genéticas em um grande número de indivíduos, a sequenciação de baixa cobertura pode fornecer uma representação razoável da variação genética a uma fração do custo da sequenciação profunda. Permite a identificação eficiente de variantes genéticas comuns e a exploração de padrões a nível populacional.
  • Identificação de variantes genéticas comuns: A sequenciação de baixa cobertura pode identificar efetivamente variantes genéticas comuns que ocorrem com maior frequência na população. Isso é particularmente útil em estudos de associação genômica (GWAS), onde os pesquisadores investigam a relação entre variações genéticas e características ou doenças.

Quais são as limitações e desafios da sequenciação de genoma de baixa cobertura?

Apesar das muitas vantagens da LcWGS, ainda existem deficiências nas seguintes áreas:

  • Processo complexo e falta de interface de software amigável e documentação: A LcWGS envolve várias etapas, incluindo preparação de biblioteca, sequenciação e análise de dados. O processo pode ser tecnicamente desafiador, exigindo experiência em genômica e bioinformática. Além disso, a disponibilidade de interfaces de software amigáveis e documentação abrangente para análise LcWGS pode ser limitada, tornando-a menos acessível a pesquisadores que não estão bem versados nessas técnicas.
  • Demandas computacionais para fixação de fase e preenchimento: Para determinar com precisão a fase de variantes genéticas (ou seja, a disposição de variantes em cada cromossomo), são necessários recursos computacionais adicionais e algoritmos. A fixação de fase e o preenchimento envolvem processos computacionalmente intensivos para resolver a ambiguidade de haplótipos e reduzir o número de possíveis combinações de haplótipos, tornando-o exigente em termos de tempo e poder computacional.
  • Interpretação inconsistente de genótipos devido a limitações de software: O software utilizado para análise LcWGS pode ter certas limitações, como vieses algorítmicos ou erros na chamada de genótipos. Isso pode levar a inconsistências na interpretação de genótipos, afetando a precisão e a confiabilidade dos resultados.
  • Não adequado para análises de chamadas de genótipos conhecidos e suscetível a efeitos de lote: A LcWGS pode não ser ideal para análises de chamadas de genótipos conhecidos, como genotipagem direcionada ou estudos de validação. A cobertura e profundidade limitadas podem resultar em chamadas de genótipos perdidas ou imprecisas, impactando a confiabilidade de tais análises. Além disso, a LcWGS pode ser suscetível a efeitos de lote, onde variações técnicas introduzidas durante o processamento ou sequenciação de amostras podem influenciar os resultados, tornando desafiador comparar amostras entre diferentes lotes ou estudos.
  • Incapacidade de determinar a fase com precisão sem um painel de referência: A fase precisa de variantes genéticas requer um painel de referência de haplótipos de uma população diversa. Sem um painel de referência adequado, a LcWGS pode ter dificuldades em determinar com precisão os haplótipos, limitando sua capacidade de fornecer informações detalhadas sobre a disposição de variantes em cada cromossomo.
  • Inadequação para tamanhos de amostra pequenos e genomas complexos: A LcWGS pode não ser bem adequada para tamanhos de amostra pequenos, pois a cobertura e profundidade limitadas podem levar a uma sensibilidade reduzida na deteção de variantes genéticas, particularmente variantes raras ou de baixa frequência. Além disso, genomas complexos com regiões repetitivas ou variações estruturais podem apresentar desafios para a chamada e montagem precisa de variantes usando dados LcWGS.

Referência:

  1. Lou, Runyang Nicolas, et al. "Um guia para iniciantes sobre sequenciação de genoma completo de baixa cobertura para genômica populacional." Molecular Ecology 30.23 (2021): 5966-5993.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo