Uma Revisão do Pangenoma Animal
O que é o Pan Genoma?
Durante a longa evolução das espécies, cada indivíduo desenvolveu traços genéticos extremamente específicos como resultado da seleção natural e antropogénica, entre outros fatores. Na visão clássica da variação genética intraespecífica, o genoma de cada indivíduo é descrito como um pequeno conjunto de variantes em relação a um genoma de referência comum. Comum na aplicação é a análise de associações entre variação e traços com base em SNPs em estudos de genética populacional para QTL. GWAS, etc.
Nos últimos anos, análises comparativas de genomas ou fragmentos genómicos de múltiplos indivíduos da mesma espécie mostraram que um único genoma de referência não é suficiente para capturar a diversidade genética de uma espécie: apenas 50%-80% dos dados de resequenciamento de diferentes ecótipos podem, em geral, ser comparados a um genoma de referência.
Estas descobertas sugerem que os genomas dentro de uma espécie podem diferir de maneiras mais significativas (incluindo a diversidade de variantes estruturais), que podem conter um ou mais genes. E um grande número de estudos demonstrou que as variantes estruturais desempenham um papel fundamental em características agronómicas importantes (por exemplo, resistência a estresses bióticos e abióticos, tempo de floração, arquitetura da planta, rendimento, qualidade de sementes ou frutos). Estes resultados implicam que o conteúdo funcional de genes de uma espécie é mais variável do que se pensava anteriormente.
Assim, para uma espécie, pode-se perder muita informação genética significativa se apenas um único genoma de referência for utilizado para o estudo da variação genética de domesticação. Todos esses fatores juntos impulsionaram a construção e o estudo de pangenomas de plantas e animais.
A pangenómica atinge a maioridade: de aplicações em bactérias a plantas e animais. (Golicz et al., 2020)
Diferenças Entre Pangenomas de Plantas e Animais
O alvo dos estudos de pangenoma pode ser diferente em diferentes espécies: os genomas bacterianos são compostos principalmente por genes codificadores e relativamente poucas sequências não genéticas, por isso os estudos de pangenoma bacteriano estão mais focados no conteúdo de genes codificadores de proteínas. Em plantas e animais, por outro lado, devido ao grande número de sequências não genéticas com certas funções no genoma, tanto as sequências como as formas de genes são principalmente estudadas em eucariotos. Ao contrário dos pangenomas de plantas, os pangenomas animais publicados são mais baseados em sequências.
Se estiver interessado em pangenomas de plantas, consulte o nosso artigo. Uma Revisão do Pangenoma de Culturas.
Quantitativamente, as plantas têm um pan-genoma muito maior. Estudos de múltiplos pangenomas humanos encontraram 5 Mb de sequência adicional nos genomas humanos asiáticos e africanos em relação aos genomas de referência humanos, baseados principalmente em amostras de origem europeia. Este estudo do genoma humano completo mostrou que o genoma humano completo tem 10% a mais do que o genoma de referência. Outros pangenomas de animais incluem porcos (72,5 Mb de sequência extra) e ratos (14-75 Mb de sequência não de referência em cada um dos 16 ratos), que estão todos dentro de três vezes o tamanho do pangenoma humano.
Uma visão geral dos métodos de construção, áreas de estudo, benefícios e aplicações do pangenoma. (Gong et al., 2023)
Por que é que o pangenoma das plantas é muito maior do que o pangenoma dos mamíferos?
A resposta a esta questão pode ser encontrada ao considerar os processos mutacionais e genéticos populacionais que geram diversidade de espécies: tal como na variação de nucleotídeos únicos, a variação estrutural aparece inicialmente como mutações; variantes neutras estão sujeitas a deriva genética, enquanto outras variantes são fixadas (seleção positiva) ou perdidas (seleção negativa). Assim, os parâmetros chave para analisar o pan-genoma são a taxa de mutação de variantes estruturais e o tamanho efetivo da população para controlar a deriva genética, bem como a proporção relativa de SVs neutros. Comparado com os animais, as plantas têm mais linhagens endogâmicas, possuem mais características agronómicas, podem reproduzir-se de mais maneiras e, portanto, têm algumas vantagens numéricas que levam à expectativa de terem pan-genomas maiores.
A nível mutacional, o grande número de transposões amplificados recentemente (TEs) pode gerar duplicações e deleções de sequências, proporcionando um amplo substrato para recombinação homóloga não equivalente. TEs ativos também podem mobilizar sequências adjacentes e produzir alterações estruturais. A hibridação com outros táxons pode igualmente adicionar novos táxons; do ponto de vista da variação genética natural, o efeito de tal migração de genes é semelhante ao da mutação. Além disso, uma vez que as espécies de plantas com flores têm uma história de duplicação antiga, a redundância efetiva remanescente pode permitir que mais SV (especialmente deleções) sejam neutras. Um segundo parâmetro chave é o tamanho efetivo da população, uma vez que populações maiores produzem mais mutações e podem acomodar mais variação persistente devido ao efeito do acaso. O maior tamanho efetivo da população em plantas em comparação com mamíferos explica o aumento de mais de 10 vezes na variação persistente de nucleotídeos únicos.
A Aplicação do Pangenoma Animal
Para alguns animais relacionados com a criação de gado agrícola, muitas vezes existem muitas linhagens/subespécies/variantes ao mesmo nível intraespecífico devido à intervenção artificial ou à seleção ambiental natural. As grandes diferenças nos fenótipos e genótipos entre estas populações antes e depois da domesticação podem estar ocultas no genoma de cada linhagem, pelo que é particularmente importante ter um pan-genoma que reflita a comunalidade dentro destas linhagens animais e as diferenças entre raças.
Normalmente, além da construção do pan-genoma, são realizados estudos sobre genes centrais, genes dispensáveis e genes privados para investigar características agronómicas relacionadas com a espécie e genes funcionais. A variação estrutural é o principal foco da pesquisa sobre pan-genomas, e informações sobre variação estrutural, como PAV (variação de presença e ausência), inversões, translocações e variação no número de cópias, são utilizadas para encontrar os loci de variação chave que causam diferentes características entre as estirpes. Além disso, o pan-genoma pode ser combinado com a regulação epistática em 3D. evolução genética populacional, análise de associação em todo o genoma, co-expressão transcricionalmetabolitos diferenciais e construção e armazenamento de bases de dados para mineração de dados aprofundada.
Referências:
- Golicz, Agnieszka A., et al. "A pangenómica atinge a maioridade: de aplicações em bactérias a plantas e animais." Tendências em Genética 36.2 (2020): 132-145.
- Gong, Ying, et al. "Uma revisão do pangenoma: como afeta a nossa compreensão da variação genómica, seleção e reprodução em animais domésticos?." Journal of Animal Science and Biotechnology 14.1 (2023): 1-19.