Sequenciação de Baixa Cobertura Identifica Eficazmente Novas Variantes em Populações Sub-representadas

26 de março de 2021 | Christie Rizk

Low-Coverage Sequencing Effectively IDs Novel Variants in Underrepresented Populations

NOVA IORQUE – Um grupo internacional de investigadores demonstrou que o sequenciamento de baixa cobertura pode identificar efetivamente variantes novas nos genomas de indivíduos de populações que estão atualmente sub-representadas em bases de dados genómicas, e pode ajudar a superar os desafios apresentados por arrays de genotipagem comuns.

Num estudo publicado na quinta-feira no American Journal of Human Genetics, os investigadores notaram que a maioria dos estudos genéticos utiliza arrays de genotipagem e painéis de referência sequenciados que melhor capturam a variação mais comum em populações de ascendência europeia. Para comparar abordagens de geração de dados que fossem mais adequadas para populações sub-representadas, os investigadores sequenciaram os genomas completos de 91 indivíduos como parte do estudo Neuropsychiatric Genetics of African Population-Psychosis (NeuroGAP-Psychosis), com participantes da Etiópia, Quénia, África do Sul e Uganda. 

Eles sequenciaram esses genomas com alta cobertura e, em seguida, usaram uma abordagem de amostragem reduzida para avaliar a qualidade dos arrays de estudos de associação genômica (GWAS) em comparação com o sequenciamento de baixa cobertura, calculando a concordância das variantes imputadas dessas tecnologias com aquelas dos dados de sequenciamento profundo do genoma. Ao fazer isso, os pesquisadores descobriram que o sequenciamento de baixa cobertura a uma profundidade de 4x ou mais capturou variantes de todas as frequências de forma mais precisa do que todos os arrays de GWAS comumente utilizados que investigaram, e a um custo comparável. Além disso, observaram que as menores profundidades de sequenciamento de 0,5x a 1x apresentaram desempenho comparável aos arrays de GWAS de baixa densidade comumente utilizados.

Os investigadores também descobriram que o sequenciamento de baixa cobertura era sensível a variações novas: o sequenciamento 4x detetou 45 por cento dos singletões e 95 por cento das variantes comuns que tinham sido previamente identificadas em genomas completos africanos de alta cobertura. 

"O nosso trabalho indica que é altura de passar de microarrays para sequenciação de genoma completo de baixa cobertura em estudos de doenças complexas. Isto é especialmente verdade para populações sub-representadas em estudos genéticos por duas grandes razões," disse a primeira autora e investigadora do Broad Institute, Alicia Martin. 

"Em primeiro lugar, podemos colmatar a lacuna entre estudos de variantes raras dispendiosos, normalmente realizados em famílias, e estudos de variantes comuns mais baratos para compreender de forma mais completa a arquitetura genética das doenças comuns," disse Martin. "Em segundo lugar, ao contrário dos microarrays, o sequenciamento de baixa cobertura oferece a oportunidade de construir recursos genómicos duradouros que facilitarão estudos futuros em populações que atualmente carecem de bons conjuntos de dados de referência."

A partir das suas várias análises, os investigadores descobriram que o sequenciamento 4x superou todos os arrays GWAS que avaliaram, incluindo arrays densos como o array H3Africa, que foi concebido para captar a variação africana. O sequenciamento 4x também era comparável em preço a arrays de alta densidade que analisavam milhões de SNPs e indels ao longo do espectro de frequência alélica. 

Descobriram ainda que a sequenciação 1x estava entre as opções mais acessíveis, custando menos e apresentando um desempenho semelhante ou melhor do que os arrays de baixa densidade comumente utilizados, como o Illumina GSA. Também observaram que o GSA é composto por variantes que são mais comuns em populações europeias e, portanto, não é a tecnologia mais apropriada para estudos de participantes com ancestrais principalmente não europeus.

Além do custo, o sequenciamento de baixa cobertura tinha várias vantagens distintas em comparação com os arrays de GWAS, particularmente uma identificação mais precisa da variação genética ao longo do espectro de frequência alélica em populações sub-representadas. Nos dados do NeuroGAP-Psicoses, os investigadores descobriram que 38 por cento das variantes comuns não podiam ser imputadas a partir dos dados da Fase III do 1000 Genomas, provavelmente devido à falta de diversidade do leste e sul de África nesse painel. 

Entre variantes raras, o fato de que a sequenciação 4x detectou quase metade de todos os singletões foi especialmente atraente para estudos de doenças. Trabalhos anteriores em genética psiquiátrica mostraram que, enquanto variantes comuns explicam a maior parte da herdabilidade dos SNP para a esquizofrenia, por exemplo, estudos de exoma também estão a revelar assinaturas genéticas parcialmente convergentes que são informativas para distúrbios psiquiátricos severos, disseram. Tecnologias de sequenciação que possam preencher a lacuna entre variantes raras e comuns, portanto, serão críticas para elucidar completamente as suas arquiteturas genéticas, refinando variantes causais, detectando variações enriquecidas e identificando variantes raras com grandes efeitos. 

Avanços metodológicos pós-GWAS com dados de sequenciação de baixa cobertura podem facilitar estas análises, notaram os investigadores.

"Estaremos a utilizar sequenciação de baixa cobertura em grandes estudos em curso, incluindo o estudo NeuroGAP-Psychosis com 40.000 participantes de estudo da Etiópia, Quénia, África do Sul e Uganda, bem como o projeto abrangente Populations Underrepresented in Mental illness Association Studies (PUMAS) que incluirá 120.000 populações latino-americanas e africanas sequenciadas," acrescentou Martin.

Mais informações em: https://www.genomeweb.com/sequencing/low-coverage-sequencing-effectively-ids-novel-variants-underrepresented-populations#.YGKSBa8zY2w

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo