Uma Revisão do Pangenoma das Culturas
Com o desenvolvimento contínuo da tecnologia de sequenciamento de genoma, cada vez mais espécies completaram a decifração do código do genoma completo, o que é importante para a pesquisa aprofundada sobre a localização de genes funcionais e a domesticação de uma espécie com base na análise abrangente das informações do genoma. No entanto, durante o longo processo evolutivo das espécies, devido à influência da seleção natural e humana, cada indivíduo desenvolveu características genéticas extremamente únicas, e o genoma de referência de um único indivíduo já não pode cobrir toda a informação genética da espécie. Em outras palavras, se apenas um único genoma de referência for utilizado para o estudo da variação genética, muita informação de código genético intencional pode ser perdida, porque muitas sequências únicas não estão no genoma de referência, e devido ao fato de que o preço do sequenciamento de genes se tornou mais barato, isso proporcionou a possibilidade de estudos de pan-genoma, especialmente em estudos de culturas como arroz, milho, soja, tomate, algodão, colza, Arabidopsis, etc. Gradualmente, tornou-se universal.
O conceito de pan-genoma e super-pan-genoma e seu uso para a melhoria de culturas. (Khan et al., 2020)
História do Pan-genoma
Pan-genoma é um termo geral para todos os genes de uma espécie, que é distinto dos genes dos genomas individuais. Em 2005, Tettelin H et al. propuseram pela primeira vez o conceito de pan-genoma microbiano (pan do grego 'παν' significando tudo), que é um termo geral para todos os genes de uma espécie. Em 2009, Li et al. usaram pela primeira vez o novo método de montagem de genoma completo para unir múltiplos genomas humanos e descobriram as sequências de DNA únicas e genes funcionais dos indivíduos, e propuseram pela primeira vez o conceito de "pan-genoma humano", ou seja, a soma das sequências genéticas das populações humanas. Em 2013, o sequenciamento de pan-genoma foi aplicado à pesquisa de plantas e animais; em 2014, começou a pesquisa de pan-genoma de culturas, como soja, arroz, milho, colza, algodão, etc.
O Principal Conteúdo de Pesquisa dos Estudos de Pan-genoma
O principal conteúdo de pesquisa dos estudos de pan-genoma envolve a análise e caracterização do genoma central e do genoma dispensável de cepas de plantas e animais. O genoma central consiste em genes que estão presentes em todas as cepas, e eles normalmente controlam funções metabólicas básicas nos organismos. Por outro lado, o genoma dispensável ou variável inclui genes que estão presentes em uma ou mais cepas, e eles podem contribuir para características diversas, como resistência a doenças ou resistência ao frio.
A pesquisa de pan-genoma foca em entender a variação estrutural dentro do genoma dispensável. Variações estruturais referem-se a diferenças na disposição, tamanho ou presença/ausência de material genético, como duplicações, deleções, inversões ou inserções. Essas variações estruturais podem ter implicações significativas para a diversidade fenotípica observada nos indivíduos.
Para estudar a variação estrutural dentro do pan-genoma, os pesquisadores frequentemente empregam tecnologias de sequenciamento de longas leituras como PacBio SMRT ou Tecnologia Nanopore. Essas tecnologias oferecem vantagens em termos de montagem de genoma e detecção de variações estruturais. Elas podem fornecer longas leituras, que permitem a montagem de regiões genômicas complexas que são difíceis de resolver usando tecnologias de sequenciamento de curtas leituras. Além disso, facilitam a identificação de variações estruturais com alta resolução, ajudando os pesquisadores a entender seu impacto na diversidade genética e nas características fenotípicas.
Ao investigar o pan-genoma e suas variações estruturais, os pesquisadores visam descobrir a base genética de várias características e entender os mecanismos subjacentes à adaptação, evolução e suscetibilidade a doenças em populações de plantas e animais. Esse conhecimento pode ter aplicações práticas em áreas como melhoria de culturas, programas de melhoramento e medicina personalizada.
Seleção de Materiais do Pan-genoma de Culturas
Número de Materiais
Um dos principais determinantes do tamanho do pan-genoma é a porcentagem de genes não centrais, que pode variar de 8% a 61% nos estudos de pan-genoma de culturas. O tamanho da amostra desempenha um papel vital nesses estudos. Inicialmente, à medida que o número de indivíduos com genes recém-identificados aumenta, o pan-genoma se expande. No entanto, essa expansão é acompanhada por uma diminuição na proporção de genes centrais.
Características dos Materiais
A seleção de materiais tem uma influência profunda na eficiência e integridade dos estudos de pan-genoma. Duas características cruciais merecem atenção: (1) Proximidade de Relacionados: Escolher materiais intimamente relacionados tende a subestimar o tamanho do pan-genoma. Portanto, é importante incluir uma gama diversificada de indivíduos para obter uma compreensão abrangente da paisagem genética da cultura. (2) Combinação de Germoplasma Selvagem e Cultivado: A combinação de germoplasma selvagem e cultivado resulta em um pan-genoma de tamanho maior, com uma proporção significativamente maior de genes não centrais em comparação com o uso apenas de germoplasma cultivado. Incorporar materiais selvagens aumenta a diversidade e a inclusividade do pan-genoma.
Na pesquisa de culturas, a identificação de novos genes tende a diminuir à medida que o número de materiais de estudo sequenciados aumenta. Isso sugere que há um número finito de genomas além do qual a inclusão adicional não leva a uma maior expansão do pan-genoma. Além disso, durante a domesticação das culturas, a falta de diversidade genética afeta negativamente o tamanho do pan-genoma e a proporção de genes não centrais. Aumentar a inclusão de materiais selvagens pode ajudar a mitigar esse problema, elevando a porcentagem de genes centrais no pan-genoma. Culturas com redução limitada na diversidade durante a domesticação tendem a apresentar uma proporção maior de genes não centrais. A proporção de genes não centrais é um indicador da diversidade das espécies e pode ser influenciada por fatores como nível de ploidia, método de reprodução e períodos de gargalo durante a domesticação. Níveis de ploidia mais altos e taxas de hibridação heterozigótica contribuem para aumentar a diversidade e a tolerância a mutações deletérias, resultando em um pan-genoma com uma porcentagem maior de genes não centrais.
Construindo o Pan-genoma
A construção de um pan-genoma gira em torno da identificação das variações na presença ou ausência de genes entre indivíduos. Isso implica segregar sequências semelhantes em alelos distintos, cópias extras ou genes não essenciais. O desafio reside na dificuldade de discernir variações interindividuais devido às semelhanças de sequência. Portanto, reunir informações sobre a localização física e a ordem dos genes no genoma montado torna-se crucial. Existem três métodos principais empregados para construir um pan-genoma: Iterativo, map-to-pan e Montagem De novo.
Os métodos Iterativo e map-to-pan envolvem identificar variações de presença/ausência (PAVs) de genes comparando leituras curtas ao genoma anotado. Por outro lado, o método de montagem De novo é utilizado para inferir ainda mais PAVs de genes comparando os genes montados com os anotados. Como resultado, esse método fornece informações mais precisas sobre o pan-genoma. No entanto, alcançar genomas de alta qualidade de montagem De novo requer uma alta profundidade de sequenciamento, o que implica um custo significativo.
Por outro lado, as técnicas de montagem iterativa e map-to-pan permitem que estudos de pan-genoma sejam realizados em profundidades de sequenciamento relativamente baixas, reduzindo assim os custos e possibilitando uma maior quantidade de amostras individuais para seleção. Além do método de montagem, o número de indivíduos e as relações genéticas entre eles desempenham um papel crucial na garantia da abrangência dos estudos de pan-genoma. Eles também determinam a precisão da estimativa do tamanho do pan-genoma.
Avanços nas tecnologias de sequenciamento, especialmente técnicas de sequenciamento de longas leituras e métodos de montagem, reduziram significativamente o custo de alcançar uma montagem De novo de alta qualidade. Isso, por sua vez, facilitará estudos futuros que empregam métodos de montagem De novo.
Referência:
- Khan, Aamir W., et al. "Super-pan-genoma ao integrar o lado selvagem de uma espécie para a melhoria acelerada de culturas." Tendências em Ciência das Plantas 25.2 (2020): 148-158.