Sequenciação do Exoma Completo em Estudos de Genética de Populações e Evolução

Com o rápido desenvolvimento da tecnologia de sequenciação de alto rendimento, Sequenciamento do exoma completo O WES tornou-se uma ferramenta fundamental para elucidar a estrutura genética populacional e os mecanismos evolutivos. Ao direcionar e capturar aproximadamente 1% das regiões codificantes de proteínas no genoma, o WES pode identificar de forma eficiente variações genéticas associadas à evolução adaptativa e à suscetibilidade a doenças, tornando-o particularmente adequado para estudos comparativos em larga escala entre espécies.

Este artigo tem como objetivo rever sistematicamente os mais recentes avanços do WES na genética populacional e na pesquisa evolutiva e, considerando as suas vantagens e limitações tecnológicas, explorar o seu potencial na evolução adaptativa das espécies, na anotação de funções genéticas e em aplicações interdisciplinares, de forma a fornecer referências metodológicas e quadros teóricos para pesquisas futuras.

I. Princípios Técnicos e Vantagens Principais

O WES identifica eficientemente variações genéticas associadas a doenças ou adaptações, direcionando-se a aproximadamente 1% das regiões codificadoras de proteínas (exões) no genoma. Comparado com o sequenciamento do genoma completo (WGS), o WES é menos dispendioso e fornece dados mais focados, tornando-o particularmente adequado para análises de amostras em grande escala. Por exemplo, uma única execução de WES pode detectar mais de 100.000 variações de exões, cobrindo mais de 95% das mutações patogénicas conhecidas.

II. Principais Aplicações em Genética de Populações

WES Revela Novas Variações e Diferenças Populacionais

Heutinck PA et al. analisaram 111 pacientes iranianos com IRD não sindrómica utilizando sequenciação do exoma completo. (WES)Descobriram que 59% (66 casos) tinham uma causa genética clara, envolvendo 31 genes e 53 variantes patogénicas (principalmente mutações de translocação, que representam 36%). Os genes patogénicos de alta frequência incluíram CERKL (12%), EYS (11%) e RPE65 (9%). Identificaram 14 variantes novas (26%, distribuídas por 12 genes) e descobriram dois casos de deleções hemizigóticas do gene RP2 (herança recessiva ligada ao X) confirmadas por análise de número de cópias, expandindo a compreensão da diversidade genética das IRD.

A WES revelou que 94% (62 casos) desta população apresentavam herança autossómica recessiva (altas taxas de consanguinidade levando a variantes predominantemente homozigóticas), com 2 casos de herança ligada ao X e 2 casos de herança autossómica dominante. Cinco pacientes foram reclassificados de "RP não sindrómica" para IRD sindrómica (como a síndrome de Bardet-Biedl), e 3 foram reclassificados para distrofia macular. VUS (variantes de significado indeterminado) foram encontrados em 35 casos (32%), e a causa foi indeterminada em 10 casos (9%). A análise populacional mostrou que a variante CERKL era a mais comum entre os turcos, RPE65 entre os curdos, e variantes de EYS entre os persas, destacando a diversidade genética. O estudo enfatiza o impacto das altas taxas de consanguinidade na estrutura genética e a necessidade de melhorar as capacidades de teste genético local.

Figure 1.Comparing the most frequent causal genes in the three largest ethnic groups.Comparando os genes causais mais frequentes nos três maiores grupos étnicos (Heutinck PA et al., 2025)

Análise de Associação em Nível Populacional de Genes Relacionados com Doenças

Bernstein N et al., através da análise de sequenciamento do exoma de sangue total de 200.000 indivíduos com idades entre 40 e 73 anos no UK Biobank, revelaram pela primeira vez em grande escala o padrão de seleção positiva de mutações somáticas no sangue envelhecido. A equipa identificou 52.700 mutações somáticas na região codificadora, constatando que o seu número e frequência alélica aumentavam com a idade, e que aproximadamente um oitavo das mutações não sinónimas foram selecionadas positivamente (dN/dS=1,13). Com base nisso, a equipa de investigação ultrapassou as limitações dos tradicionais 74 genes CH, identificando 17 novos genes condutores de seleção positiva (como BAX, CHEK2 e MYD88) utilizando métodos como dNdScv. As mutações nestes genes aumentaram a prevalência de grandes clonas (VAF>0,1) de CH em 18%, e a sua frequência e tamanho clonal também aumentaram com a idade, consistente com o padrão clássico dos genes CH.

Os 17 novos genes descobertos não só expandem o espectro dos condutores da proliferação de células hematopoiéticas (CH), mas também revelam a sua forte associação com vários fenótipos clínicos: as mutações MYD88/IGLL5 aumentam significativamente o risco de leucemia linfocítica crónica (LLC), as mutações ZBTB33 levam a contagens anormais de células na medula óssea, e a maioria dos CH impulsionados por genes recém-descobertos está intimamente associada a um aumento do risco de infeções e mortalidade por todas as causas, com resultados adversos a piorar com o aumento clonal. Esta descoberta fornece uma nova perspetiva sobre a compreensão do papel da hematopoiese clonal no envelhecimento, no cancro e nas doenças hematológicas, e também aponta para direcções potenciais para intervenções direcionadas na expansão clonal anormal e no atraso dos fenótipos de envelhecimento relacionados.

Identificação de Genes Associados ao Estrabismo

Duan W et al. analisaram 10 linhagens de exotropia associadas ao estrabismo em Yunnan, China (47 indivíduos, incluindo 32 pacientes) utilizando sequenciação do exoma completo combinada com Sequenciação de Sanger, revelando o mecanismo genético pela primeira vez. O estudo identificou sete potenciais genes patogénicos (COL4A2, SYNE1, LOXHD1, AUTS2, GTDC2, HERC2 e CDH3) e encontrou 11 variantes missense que co-segregaram com membros da linhagem — todas elas eram prejudiciais, de baixa frequência (<5% na população geral) e correspondentes à herança autossómica dominante, com uma idade média de início de 3,35 ± 1,51 anos (mais cedo do que os casos esporádicos). Entre eles, COL4A2 (variantes em 3 linhagens) e SYNE1 (variantes em 2 linhagens) estavam diretamente associados à doença, e cinco genes (COL4A2, SYNE1, AUTS2, HERC2 e CDH3) sobrepunham-se à lista de genes de estrabismo da Ontologia Fenotípica Humana (HPO).

Estes genes enquadram-se em duas categorias funcionais: relacionados com o sistema nervoso (COL4A2, SYNE1, etc., envolvidos no desenvolvimento neural e na ancoragem sináptica) e relacionados com os músculos (CDH3, GTDC2, etc., envolvidos no desenvolvimento dos músculos extraoculares). O sequenciamento subsequente de captura de alvos validou estes genes em 220 casos esporádicos: o AUTS2 revelou 15 variantes (12 SNPs + 3 Indels), e o GTDC2 revelou 4 variantes SNP. O estudo confirma a heterogeneidade genética da exotropia, fornecendo genes candidatos para diagnóstico precoce e tratamento de precisão, mas são necessárias amostras maiores e validação funcional (por exemplo, a nível de mRNA/proteína) para confirmar o mecanismo.

Figure 2.Workflow for genetic variant detection and validation in concomitant exotropia pedigrees.Fluxo de trabalho para deteção e validação de variantes genéticas em pedigrees de exotropia concomitante (Duan W et al., 2025)

III. Estudos de Caso em Biologia Evolutiva

Evolução Adaptativa dos Primatas

Hyakawa T et al. analisaram a estrutura genética e as características evolutivas de 42 chimpanzés utilizando sequenciação do exoma completo (combinada com captura de isótopos humanos) (amostras não invasivas de fezes selvagens + amostras de sangue de populações cativas). A reconstrução da árvore de máxima verossimilhança dos genes mitocondriais mostrou uma distribuição monofilética significativa entre as subespécies de chimpanzés (ocidental, central e oriental), mas nenhum grupo monofilético foi formado em algumas populações locais. A análise multivariada autosómica (MDS, agrupamento hierárquico e análise de mistura) distinguiu efetivamente as subespécies (ocidental vs. central/oriental) e as populações locais (por exemplo, a separação dos chimpanzés ocidentais de Bosu das populações cativas), e identificou amostras híbridas (por exemplo, a híbrida ocidental-central Chloe), confirmando que as sequências de exões podem rastrear a origem geográfica e a diferenciação populacional.

O estudo também encontrou uma correlação negativa significativa entre a heterozigosidade de exões e a razão de substituição não sinónima/sinónima em todo o genoma (N/S), indicando uma carga mutacional (acumulação de mutações ligeiramente prejudiciais em pequenas populações). Dos 23.534 genes codificadores identificados, 60% continham pseudogenes segregados (alelos que funcionam tanto como genes funcionais como pseudogenes). Entre estes, os pseudogenes partilhados entre subespécies de genes de receptores quimiossensores (receptor olfactivo OR7D4, receptor do sabor amargo TAS2R42) (por exemplo, o pseudogene de inserção OR7D4 partilhado entre Bosu e Mahalai) eram candidatos potenciais para seleção equilibrada ou relacionados com adaptações olfativas/gustativas. Este método validou a viabilidade da amostragem não invasiva com tampão de lise, fornecendo uma ferramenta económica para a genética de conservação em chimpanzés selvagens e pode ser estendido a outros organismos não modelo.

Figure 3.Exome nucleotide variations clustered at the subspecies and local population levels.Variações nucleotídicas do exoma agrupadas a níveis de subespécies e populações locais (Hyakawa T et al., 2025)

WES Revela Genes de Diferenciação da Cor da Pelagem

Yan, X et al. analisaram 46 indivíduos de cinco espécies de macacos-rhesus na Ilha de Sulawesi utilizando sequenciamento de exoma completo (combinado com um kit de captura de exões humanos), identificando aproximadamente 550 genes altamente expressos de forma diferencial (regiões ricas em SNP nos 5% superiores dos valores de Fst). Estes genes estão envolvidos em processos biológicos chave, como pigmentação, adesão celular, transdução de sinal (por exemplo, Rho GTPase, via TGF-beta) e resposta ao stress. A diferenciação de genes relacionados com a pigmentação foi particularmente proeminente: mutações missense em TYR (tirosinase) (por exemplo, D132N) e LRIT3 (S394P, Y363D) são partilhadas apenas em espécies de pelagem escura (M. nigra, M. nigrescens), potencialmente impulsionando as diferenças de cor da pelagem ao regular a etapa limitante da síntese de melanina ou a sinalização do FGFR1; variações missense em genes como MC1R e ASIP podem afetar a função do receptor e a deposição de melanina, destacando a contribuição da diferenciação genética para características específicas das espécies.

O estudo também identificou um grande número de SNPs fixos (Fst=1) como marcadores genéticos específicos de espécies. Quatro comparações revelaram um total de 8380 SNPs fixos (41,18%-45% localizados em exões), envolvendo 705-861 genes (como TGM4 e ZFHX3), que podem ser utilizados para a diferenciação de espécies e monitorização do risco de hibridação. A análise de Fst mostrou uma diferenciação desigual entre as espécies (o maior Fst médio=0,179 foi observado na comparação NgNc), indicando que adaptações locais (como a seleção positiva para a cor da pelagem) e a deriva genética impulsionam conjuntamente a rápida diferenciação. Estas descobertas fornecem evidências genómicas cruciais para compreender a especiação de primatas, a evolução adaptativa da cor da pelagem e a conservação dos macacos-rhesus em perigo (como a manutenção da integridade genética).

Figure 4.The distribution of the top 5% SNPs Fst values across all four pairwise species comparisons.A distribuição dos valores Fst dos SNPs dos 5% superiores em todas as quatro comparações de espécies pareadas (Yan, X et al., 2025)

IV. Vantagens e Desafios Técnicos

  • Vantagens:
    • Alto Custo-Efetividade: O custo de sequenciação de uma única amostra é apenas 1/10 do WGS, adequado para estudos de coorte envolvendo milhares de participantes.
    • Deteção de Variantes Altamente Eficiente: A taxa de deteção de variantes de baixa frequência (<1%) é mais de 30% superior à dos chips SNP.
  • Desafios:
    • Viés de Cobertura: A eficiência da captura de exões é afetada por sequências genómicas repetitivas, e algumas variantes de baixa frequência podem ser perdidas.
    • Limitações na Interpretação Funcional: Cobrir apenas regiões codificantes torna difícil avaliar o papel de variantes regulatórias ou RNAs não codificantes.

V. Direções Futuras de Desenvolvimento

  • Integração Multi-ômica: Combinando epigenómico e transcriptómico dados para analisar o impacto funcional das variantes. Por exemplo, validar os mecanismos regulatórios epigenéticos das variantes de exon através da análise de metilação.
  • Assistência de Inteligência Artificial: Utilização de aprendizagem profunda para prever a patogenicidade de variantes, acelerando a triagem de genes relacionados com doenças.
  • Comparação entre Espécies: Extensão a organismos não-modelo (como primatas selvagens) para revelar mecanismos adaptativos conservados evolutivamente.

Conclusão

O WES fornece uma ferramenta eficiente para genética populacional e pesquisa evolutiva, mas a sua aplicação requer validação de múltiplas dimensões, incluindo epigenética e experimentos funcionais. Com a diminuição dos custos de sequenciação e a otimização de algoritmos, o WES desempenhará um papel mais central em áreas como os mecanismos de doenças humanas e a evolução adaptativa das espécies.

As pessoas também perguntam

Para que é utilizado o teste de sequenciação do exoma completo?
O teste de sequenciação do exoma completo é utilizado principalmente em diagnósticos clínicos para identificar mutações genéticas que causam doenças hereditárias raras, e em investigação para estudar a genómica do cancro, doenças complexas e genética populacional.
O WGS ou o WES é mais caro?
O WGS custa atualmente duas a três vezes mais do que o WES, mas a maior parte do custo do WGS (>90%) está diretamente relacionada ao sequenciamento, enquanto o custo do WES se deve principalmente ao kit de captura.
Quais doenças podem ser detectadas pelo sequenciamento do exoma completo?
O WES é valioso para pacientes pediátricos com condições como múltiplas anomalias congénitas, distúrbios do neurodesenvolvimento e epilepsia, onde se suspeita de etiologia genética.
Quanto tempo leva a obter resultados da sequenciação do exoma completo?
O tempo de resposta é de cerca de 5 dias, mas pode variar com base em fatores como a data de recolha, a qualidade/quantidade da amostra e a completude das informações do paciente fornecidas.

Referências

  1. Heutinck PAT, Iglesias AI, Farhud DD, van Tienhoven M, Khoshraftar A, Zarif-Yeganeh M, Kia SK, Ghanbari M, Smoor MA, Klaver CCW, Hoefsloot LH, Thiadens AAHJ, Verhoeven VJM. Sequenciação do exoma completo para diagnóstico em distrofias retinianas presumivelmente hereditárias autossómicas recessivas numa população iraniana. Sci Rep2025 Jul 3;15(1):23745.
  2. Bernstein N, Spencer Chapman M, Nyamondo K, Chen Z, Williams N, Mitchell E, Campbell PJ, Cohen RL, Nangalia J. A análise de mutações somáticas em sangue total de 200.618 indivíduos identifica uma seleção positiva generalizada e novos motores da hematopoiese clonal.. Nat GenetJun 2024;56(6):1147-1155.
  3. Ele F, Pasam R, Shi F, Kant S, Keeble-Gagnere G, Kay P, Forrest K, Fritz A, Hucl P, Wiebe K, Knox R, Cuthbert R, Pozniak C, Akhunova A, Morrell PL, Davies JP, Webb SR, Spangenberg G, Hayes B, Daetwyler H, Tibbits J, Hayden M, Akhunov E. O sequenciamento do exoma destaca o papel da introgressão de parentes selvagens na formação da paisagem adaptativa do genoma do trigo.. Nat GenetMaio de 2019;51(5):896-904.
  4. Duan W, Zhou T, Huang X, He D, Hu M. O sequenciamento do exoma completo revela a base genética da exotropia concomitante hereditária em dez famílias chinesas.. BMC Genómica Médica. 2025 Jan 7;18(1):4.
  5. Hayakawa T, Kishida T, Go Y, Inoue E, Kawaguchi E, Aizu T, Ishizaki H, Toyoda A, Fujiyama A, Matsuzawa T, Hashimoto C, Furuichi T, Agata K. Evolução em escala genómica em populações locais de chimpanzés selvagens. Sci Rep2025 Jan 2;15(1):548.
  6. Yan X, Arakawa N, Widayati KA, Purba LHPS, Fahri F, Suryobroto B, Terai Y, Imai H. A análise do exoma revela a divergência entre espécies no gene TYR e identifica marcadores genéticos de espécies em cinco espécies endémicas de Macaca na Ilha de Sulawesi.. BMC Ecol Evol2025 Jul 3;25(1):66.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo