Com o rápido desenvolvimento da tecnologia de sequenciação de alto rendimento, Sequenciamento do exoma completo O WES tornou-se uma ferramenta fundamental para elucidar a estrutura genética populacional e os mecanismos evolutivos. Ao direcionar e capturar aproximadamente 1% das regiões codificantes de proteínas no genoma, o WES pode identificar de forma eficiente variações genéticas associadas à evolução adaptativa e à suscetibilidade a doenças, tornando-o particularmente adequado para estudos comparativos em larga escala entre espécies.
Este artigo tem como objetivo rever sistematicamente os mais recentes avanços do WES na genética populacional e na pesquisa evolutiva e, considerando as suas vantagens e limitações tecnológicas, explorar o seu potencial na evolução adaptativa das espécies, na anotação de funções genéticas e em aplicações interdisciplinares, de forma a fornecer referências metodológicas e quadros teóricos para pesquisas futuras.
O WES identifica eficientemente variações genéticas associadas a doenças ou adaptações, direcionando-se a aproximadamente 1% das regiões codificadoras de proteínas (exões) no genoma. Comparado com o sequenciamento do genoma completo (WGS), o WES é menos dispendioso e fornece dados mais focados, tornando-o particularmente adequado para análises de amostras em grande escala. Por exemplo, uma única execução de WES pode detectar mais de 100.000 variações de exões, cobrindo mais de 95% das mutações patogénicas conhecidas.
Heutinck PA et al. analisaram 111 pacientes iranianos com IRD não sindrómica utilizando sequenciação do exoma completo. (WES)Descobriram que 59% (66 casos) tinham uma causa genética clara, envolvendo 31 genes e 53 variantes patogénicas (principalmente mutações de translocação, que representam 36%). Os genes patogénicos de alta frequência incluíram CERKL (12%), EYS (11%) e RPE65 (9%). Identificaram 14 variantes novas (26%, distribuídas por 12 genes) e descobriram dois casos de deleções hemizigóticas do gene RP2 (herança recessiva ligada ao X) confirmadas por análise de número de cópias, expandindo a compreensão da diversidade genética das IRD.
A WES revelou que 94% (62 casos) desta população apresentavam herança autossómica recessiva (altas taxas de consanguinidade levando a variantes predominantemente homozigóticas), com 2 casos de herança ligada ao X e 2 casos de herança autossómica dominante. Cinco pacientes foram reclassificados de "RP não sindrómica" para IRD sindrómica (como a síndrome de Bardet-Biedl), e 3 foram reclassificados para distrofia macular. VUS (variantes de significado indeterminado) foram encontrados em 35 casos (32%), e a causa foi indeterminada em 10 casos (9%). A análise populacional mostrou que a variante CERKL era a mais comum entre os turcos, RPE65 entre os curdos, e variantes de EYS entre os persas, destacando a diversidade genética. O estudo enfatiza o impacto das altas taxas de consanguinidade na estrutura genética e a necessidade de melhorar as capacidades de teste genético local.
Comparando os genes causais mais frequentes nos três maiores grupos étnicos (Heutinck PA et al., 2025)
Bernstein N et al., através da análise de sequenciamento do exoma de sangue total de 200.000 indivíduos com idades entre 40 e 73 anos no UK Biobank, revelaram pela primeira vez em grande escala o padrão de seleção positiva de mutações somáticas no sangue envelhecido. A equipa identificou 52.700 mutações somáticas na região codificadora, constatando que o seu número e frequência alélica aumentavam com a idade, e que aproximadamente um oitavo das mutações não sinónimas foram selecionadas positivamente (dN/dS=1,13). Com base nisso, a equipa de investigação ultrapassou as limitações dos tradicionais 74 genes CH, identificando 17 novos genes condutores de seleção positiva (como BAX, CHEK2 e MYD88) utilizando métodos como dNdScv. As mutações nestes genes aumentaram a prevalência de grandes clonas (VAF>0,1) de CH em 18%, e a sua frequência e tamanho clonal também aumentaram com a idade, consistente com o padrão clássico dos genes CH.
Os 17 novos genes descobertos não só expandem o espectro dos condutores da proliferação de células hematopoiéticas (CH), mas também revelam a sua forte associação com vários fenótipos clínicos: as mutações MYD88/IGLL5 aumentam significativamente o risco de leucemia linfocítica crónica (LLC), as mutações ZBTB33 levam a contagens anormais de células na medula óssea, e a maioria dos CH impulsionados por genes recém-descobertos está intimamente associada a um aumento do risco de infeções e mortalidade por todas as causas, com resultados adversos a piorar com o aumento clonal. Esta descoberta fornece uma nova perspetiva sobre a compreensão do papel da hematopoiese clonal no envelhecimento, no cancro e nas doenças hematológicas, e também aponta para direcções potenciais para intervenções direcionadas na expansão clonal anormal e no atraso dos fenótipos de envelhecimento relacionados.
Duan W et al. analisaram 10 linhagens de exotropia associadas ao estrabismo em Yunnan, China (47 indivíduos, incluindo 32 pacientes) utilizando sequenciação do exoma completo combinada com Sequenciação de Sanger, revelando o mecanismo genético pela primeira vez. O estudo identificou sete potenciais genes patogénicos (COL4A2, SYNE1, LOXHD1, AUTS2, GTDC2, HERC2 e CDH3) e encontrou 11 variantes missense que co-segregaram com membros da linhagem — todas elas eram prejudiciais, de baixa frequência (<5% na população geral) e correspondentes à herança autossómica dominante, com uma idade média de início de 3,35 ± 1,51 anos (mais cedo do que os casos esporádicos). Entre eles, COL4A2 (variantes em 3 linhagens) e SYNE1 (variantes em 2 linhagens) estavam diretamente associados à doença, e cinco genes (COL4A2, SYNE1, AUTS2, HERC2 e CDH3) sobrepunham-se à lista de genes de estrabismo da Ontologia Fenotípica Humana (HPO).
Estes genes enquadram-se em duas categorias funcionais: relacionados com o sistema nervoso (COL4A2, SYNE1, etc., envolvidos no desenvolvimento neural e na ancoragem sináptica) e relacionados com os músculos (CDH3, GTDC2, etc., envolvidos no desenvolvimento dos músculos extraoculares). O sequenciamento subsequente de captura de alvos validou estes genes em 220 casos esporádicos: o AUTS2 revelou 15 variantes (12 SNPs + 3 Indels), e o GTDC2 revelou 4 variantes SNP. O estudo confirma a heterogeneidade genética da exotropia, fornecendo genes candidatos para diagnóstico precoce e tratamento de precisão, mas são necessárias amostras maiores e validação funcional (por exemplo, a nível de mRNA/proteína) para confirmar o mecanismo.
Fluxo de trabalho para deteção e validação de variantes genéticas em pedigrees de exotropia concomitante (Duan W et al., 2025)
Hyakawa T et al. analisaram a estrutura genética e as características evolutivas de 42 chimpanzés utilizando sequenciação do exoma completo (combinada com captura de isótopos humanos) (amostras não invasivas de fezes selvagens + amostras de sangue de populações cativas). A reconstrução da árvore de máxima verossimilhança dos genes mitocondriais mostrou uma distribuição monofilética significativa entre as subespécies de chimpanzés (ocidental, central e oriental), mas nenhum grupo monofilético foi formado em algumas populações locais. A análise multivariada autosómica (MDS, agrupamento hierárquico e análise de mistura) distinguiu efetivamente as subespécies (ocidental vs. central/oriental) e as populações locais (por exemplo, a separação dos chimpanzés ocidentais de Bosu das populações cativas), e identificou amostras híbridas (por exemplo, a híbrida ocidental-central Chloe), confirmando que as sequências de exões podem rastrear a origem geográfica e a diferenciação populacional.
O estudo também encontrou uma correlação negativa significativa entre a heterozigosidade de exões e a razão de substituição não sinónima/sinónima em todo o genoma (N/S), indicando uma carga mutacional (acumulação de mutações ligeiramente prejudiciais em pequenas populações). Dos 23.534 genes codificadores identificados, 60% continham pseudogenes segregados (alelos que funcionam tanto como genes funcionais como pseudogenes). Entre estes, os pseudogenes partilhados entre subespécies de genes de receptores quimiossensores (receptor olfactivo OR7D4, receptor do sabor amargo TAS2R42) (por exemplo, o pseudogene de inserção OR7D4 partilhado entre Bosu e Mahalai) eram candidatos potenciais para seleção equilibrada ou relacionados com adaptações olfativas/gustativas. Este método validou a viabilidade da amostragem não invasiva com tampão de lise, fornecendo uma ferramenta económica para a genética de conservação em chimpanzés selvagens e pode ser estendido a outros organismos não modelo.
Variações nucleotídicas do exoma agrupadas a níveis de subespécies e populações locais (Hyakawa T et al., 2025)
Yan, X et al. analisaram 46 indivíduos de cinco espécies de macacos-rhesus na Ilha de Sulawesi utilizando sequenciamento de exoma completo (combinado com um kit de captura de exões humanos), identificando aproximadamente 550 genes altamente expressos de forma diferencial (regiões ricas em SNP nos 5% superiores dos valores de Fst). Estes genes estão envolvidos em processos biológicos chave, como pigmentação, adesão celular, transdução de sinal (por exemplo, Rho GTPase, via TGF-beta) e resposta ao stress. A diferenciação de genes relacionados com a pigmentação foi particularmente proeminente: mutações missense em TYR (tirosinase) (por exemplo, D132N) e LRIT3 (S394P, Y363D) são partilhadas apenas em espécies de pelagem escura (M. nigra, M. nigrescens), potencialmente impulsionando as diferenças de cor da pelagem ao regular a etapa limitante da síntese de melanina ou a sinalização do FGFR1; variações missense em genes como MC1R e ASIP podem afetar a função do receptor e a deposição de melanina, destacando a contribuição da diferenciação genética para características específicas das espécies.
O estudo também identificou um grande número de SNPs fixos (Fst=1) como marcadores genéticos específicos de espécies. Quatro comparações revelaram um total de 8380 SNPs fixos (41,18%-45% localizados em exões), envolvendo 705-861 genes (como TGM4 e ZFHX3), que podem ser utilizados para a diferenciação de espécies e monitorização do risco de hibridação. A análise de Fst mostrou uma diferenciação desigual entre as espécies (o maior Fst médio=0,179 foi observado na comparação NgNc), indicando que adaptações locais (como a seleção positiva para a cor da pelagem) e a deriva genética impulsionam conjuntamente a rápida diferenciação. Estas descobertas fornecem evidências genómicas cruciais para compreender a especiação de primatas, a evolução adaptativa da cor da pelagem e a conservação dos macacos-rhesus em perigo (como a manutenção da integridade genética).
A distribuição dos valores Fst dos SNPs dos 5% superiores em todas as quatro comparações de espécies pareadas (Yan, X et al., 2025)
O WES fornece uma ferramenta eficiente para genética populacional e pesquisa evolutiva, mas a sua aplicação requer validação de múltiplas dimensões, incluindo epigenética e experimentos funcionais. Com a diminuição dos custos de sequenciação e a otimização de algoritmos, o WES desempenhará um papel mais central em áreas como os mecanismos de doenças humanas e a evolução adaptativa das espécies.
Para que é utilizado o teste de sequenciação do exoma completo?
O teste de sequenciação do exoma completo é utilizado principalmente em diagnósticos clínicos para identificar mutações genéticas que causam doenças hereditárias raras, e em investigação para estudar a genómica do cancro, doenças complexas e genética populacional.
O WGS ou o WES é mais caro?
O WGS custa atualmente duas a três vezes mais do que o WES, mas a maior parte do custo do WGS (>90%) está diretamente relacionada ao sequenciamento, enquanto o custo do WES se deve principalmente ao kit de captura.
Quais doenças podem ser detectadas pelo sequenciamento do exoma completo?
O WES é valioso para pacientes pediátricos com condições como múltiplas anomalias congénitas, distúrbios do neurodesenvolvimento e epilepsia, onde se suspeita de etiologia genética.
Quanto tempo leva a obter resultados da sequenciação do exoma completo?
O tempo de resposta é de cerca de 5 dias, mas pode variar com base em fatores como a data de recolha, a qualidade/quantidade da amostra e a completude das informações do paciente fornecidas.
Referências