A análise de associação em todo o genoma (GWAS) é uma ferramenta poderosa para identificar genes associados a características, desempenhando um papel fundamental na identificação de loci genómicos candidatos que influenciam variações fenotípicas. No entanto, o GWAS convencional baseia-se principalmente em informações de variantes de nucleotídeo único (SNPs) para estabelecer associações com fenótipos, negligenciando variantes estruturais (SVs) substanciais com tamanhos de efeito fenotípico consideravelmente maiores. Embora o número total de SVs no genoma seja inferior ao de SNPs, as SVs abrangem uma extensão mais ampla de bases e influenciam um número total significativamente maior de variações de sequência genómica do que os SNPs.
Em contraste com variantes polimórficas de sequência, as variantes estruturais podem ter um impacto mais profundo nos genomas e nas características genéticas de plantas e animais. Notavelmente, análises GWAS baseadas em SV encontraram ampla aplicação em várias espécies, incluindo milho, pepino, uva, trigo e tomate.
Num artigo recente na Nature Genetics intitulado "Análises de super-pangenoma destacam a diversidade genómica e variação estrutural entre espécies de tomate selvagem e cultivado", foi compilado 11 genomas de nível cromossómico, genomas de alta qualidade de variedades de tomate selvagem e cultivado. Este esforço levou à criação do primeiro super-pangenoma do mundo para tomates, facilitando uma análise SV-GWAS inovadora baseada nos perfis de pangenoma. Os resultados deste estudo estão preparados para acelerar significativamente a pesquisa biológica e a reprodução de tomates, uma cultura de importância global.
Um total de 11 variedades de tomate, incluindo 8 variantes de tipo selvagem, 1 espécie de tomate quase selvagem e 2 variedades cultivadas, foram adquiridas para este estudo. Utilizando tecnologias de sequenciamento avançadas como PacBio e Hi-C, os genomas destas 11 variedades de tomate foram meticulosamente montados a nível cromossómico. Subsequentemente, foi construído um super-pangenoma, integrando os perfis genéticos de todos os 11 genomas de tomate. Este genoma consolidado serviu como base para analisar variações estruturais no contexto de variantes estruturais (SV).
Relações filogenéticas e componentes genómicos de tomates selvagens e domesticados. (Li et al., 2023)
A investigação pioneira na montagem de um super pangenoma abrangente para tomates, abrangendo 11 espécies de Solanum. Aproveitando a análise de agrupamento, o estudo revelou 40.457 famílias de genes pan, agregando genes codificadores de proteínas de 11 genomas de nível cromossómico e dois previamente publicados. Do pangenoma de tomate reportado, 3.441 dos 4.874 genes não intrónicos foram incorporados, enquanto foram identificados mais 9.320 genes não redundantes ausentes no pangenoma reportado.
A análise comparativa do genoma expôs 2,0-8,193 bilhões de SNPs e 0,6-1,5 milhões de pequenos InDels (≤50 bp) em 12 genomas de tomate. Além disso, o estudo identificou 103.333 inserções, 119.794 deleções, 41.960 CNVs, 23.516 translocações e 1.320 retrogradas (< 1 Mb de comprimento) dentro dos 12 germoplasmas de tomate. Notavelmente, o estudo detectou com precisão SVs previamente reportados associados à variação fenotípica. Em uma mudança em relação ao mapeamento anterior de pan-SV de tomate, o estudo identificou exclusivamente 180.314 SVs, contribuindo para um total de 224.447 SVs.
A integração destes SVs identificados com um conjunto de dados pan-SV (composto por 112 germoplasmas de tomate) facilitou a exploração das diferenças de SV na evolução do tomate. A subdivisão dos 112 cultivares em quatro grupos revelou que a maioria dos SVs ocorreu em baixas frequências (menos de 0,25) em todos os grupos. Curiosamente, 8.094 SVs exibiram variações significativas de frequência entre grupos selvagens e cultivados. A análise funcional destacou a participação destes genes em processos como o desenvolvimento de tecidos meristemáticos e o transporte de amónio. Além disso, 388 SVs altamente diferenciados foram identificados entre tomates selvagens e cultivados, acrescentando uma camada nuance à nossa compreensão da evolução genética do tomate.
Super-pangenoma e o panorama da variação estrutural entre tomates selvagens e cultivados. (Li et al., 2023)
Na comparação entre variedades de tomate selvagem e cultivadas, esta investigação identificou 388 variações estruturais (SVs) que influenciaram significativamente 278 genes. Notavelmente, uma alteração significativa na frequência de uma deleção de 244 pares de bases ocupou a segunda posição, manifestando-se no primeiro exon do gene Sgal12g015720. Este gene codifica uma proteína pertencente à superfamília do citocromo P450 (CYP), conhecida pelo seu papel fundamental no crescimento, desenvolvimento das plantas e na biossíntese de metabolitos secundários. Sgal12g015720 exibiu níveis de expressão máximos nos caules do tomate selvagem, S. pennellii, enquanto a sua expressão foi quase negligenciável nas duas espécies de tomate cultivadas.
A ocorrência do evento de deleção de 244 pares de bases é hipotetizada como um subproduto da domesticação do tomate, resultando na pseudogenização do gene Sgal12g015720 em tomates cultivados. Este evento possui potencial importância na regulação do tamanho da planta e do rendimento durante o processo de reprodução do tomate. Estudos subsequentes corroboraram esta hipótese através de análises experimentais envolvendo a superexpressão do gene. Os achados sublinham o papel fundamental de Sgal12g015720 na formação do rendimento do tomate, lançando luz sobre a sua aplicação potencial em futuras estratégias de reprodução.
Caracterização de um gene de citocromo P450 de tomate selvagem, Sgal12g015720. (Li et al., 2023)
Este estudo apresenta os genomas de nível cromossómico de nove espécies de tomate selvagem e duas cultivares, amalgamando-os com dois genomas previamente publicados para desvendar a filogenia do tomate. Através desta abordagem abrangente, foi construído um super-pangenoma para tomates. A investigação explorou as variações estruturais dentro do genoma do tomate, lançando luz sobre a diversidade genómica inerente aos parentes selvagens dos tomates. Notavelmente, o estudo levou à identificação de um gene de tomate selvagem com potencial promissor para aumentar o rendimento nos tomates cultivados contemporâneos.
A construção do genoma baseada em mapa serviu como base para a realização de estudos de associação genómica baseados em variação estrutural (SV), revelando numerosos sinais intricadamente ligados a características relacionadas com o sabor e metabolitos de fruta em tomates. Esta exploração holística fornece valiosas percepções sobre os fatores genéticos que influenciam as características do tomate, oferecendo um caminho para aproveitar este conhecimento na busca de rendimentos de culturas melhorados e perfis de sabor aprimorados.
Referência: