Os genótipos detectados usando métodos de resequenciamento de alta profundidade são, sem dúvida, os mais abrangentes, mas atualmente são demasiado dispendiosos para serem aplicados na reprodução de plantas e animais, especialmente para espécies com genomas complexos e grandes. A sequenciação de genoma de baixa cobertura (lcWGS) está a emergir como uma alternativa eficaz ao sacrificar a profundidade de sequenciação em favor de uma maior cobertura do genoma e de um maior tamanho de amostra, com a ajuda de estratégias estatísticas probabilísticas.
A estratégia LcWGS combina as vantagens do RAD-seq, evitando as desvantagens. Pode estudar o genoma completo a nível populacional (considerando tanto a profundidade quanto a amplitude do genoma), enquanto retém a informação dos indivíduos, e o custo é comparável a ambos. Portanto, obter genótipos em todo o genoma através da LcWGS combinada com algoritmos é uma prática popular nos últimos anos.
Características da tecnologia de sequenciação de genoma de baixa cobertura
| LcWGS | WGS | Array | RAD-seq | |
| Profundidade de sequenciação | baixa | alta | - | alta |
| Número de variantes | mais | mais | menos | menos |
| Deteção de novas variantes | sim | sim | não | não |
| Precisão | moderada | alta | alta | alta |
| Genoma de referência | sim | sim | sim | sim/não |
| Custo | baixo | alto | baixo | baixo |
A sequenciação de genoma de baixa cobertura (lcWGS) realiza primeiro resequenciamento de genoma completo de baixa profundidade e deteção de variantes para todos os indivíduos numa população, e depois usa algoritmos para inferir e preencher (Imputação) os genótipos em falta com base no desequilíbrio de ligação (LD) entre variantes, e finalmente obtém marcadores genéticos de alta densidade a nível de genoma completo para amostras em grande escala.
Nos últimos anos, a LcWGS para grandes amostras foi teoricamente demonstrada para obter marcadores SNP de alta densidade em todo o genoma a um custo muito baixo, o que, por sua vez, aumenta a precisão da localização de QTL e explora melhor os mecanismos genéticos de várias doenças. A LcWGS também foi utilizada para análise de associação e estudos de genética populacional. A vantagem de populacionar dados de baixa densidade até ao nível de sequenciação de genoma completo para previsão de valor de reprodução revelou-se altamente dependente da distribuição de frequência de mutações causais. A superioridade dos dados populacionados sob um modelo neutro foi pequena, e a precisão da avaliação genética usando dados populacionados poderia ser melhorada em 30% quando todas as frequências alélicas mínimas de mutações causais eram baixas.
O processo de pré-processamento da LcWGS é semelhante ao WGS, mas uma diferença importante é a necessidade de usar probabilidades genotípicas para explicar a probabilidade de incerteza genotípica, como a análise a montante usando o espectro de frequência de sítio (SFS). O processo de análise de dados da lcWGS, que usa probabilidades genotípicas para explicar a incerteza genotípica. Desde o espectro de frequência alélica (SFS) até estatísticas de diversidade e FST, é o processo de análise do software ANGSD. Outras ferramentas (por exemplo, ATLAS) podem inferir essas estatísticas diretamente a partir de GLs sem uso prévio de SFS.
Fluxo de trabalho da lcWGS. (Lou et al., 2021)
Não existe um único conjunto de desenhos experimentais para resequenciamento de baixa profundidade que seja adequado para todos os objetivos de estudo. Em vez disso, o design ótimo depende dos objetivos do estudo, do sistema e do orçamento. Dado um orçamento, os principais compromissos para resequenciamento de baixa profundidade são o tamanho da amostra e a profundidade de sequenciação. Por exemplo, a estimativa de frequência alélica, a análise da estrutura populacional e a diferenciação genética entre populações podem ser sequenciadas com mais amostras para obter resultados precisos; espectros de frequência alélica (SFS), inferência demográfica usando δaδi, Tajima'D, ou valores absolutos de LD requerem consideração de profundidades de sequenciação mais elevadas. Portanto, os pesquisadores devem considerar cuidadosamente qual tipo de análise é mais importante para os objetivos do estudo e encontrar o equilíbrio apropriado. Sintetizando os resultados dos nossos e de estudos anteriores, fornecemos algumas diretrizes gerais para o desenho de experiências de resequenciamento de baixa profundidade.
A sequenciação de genoma de baixa cobertura refere-se à sequenciação de um genoma a uma profundidade relativamente baixa, resultando tipicamente em cobertura incompleta de todo o genoma. Embora a sequenciação de baixa cobertura tenha algumas vantagens, também apresenta certas limitações.
Vantagens da sequenciação de genoma de baixa cobertura:
Apesar das muitas vantagens da LcWGS, ainda existem deficiências nas seguintes áreas:
Referência: