Partículas retrovirais abrigam o genoma viral completo na forma de RNA. Ao entrar numa célula-alvo, este RNA pode sofrer uma transformação conhecida como transcrição reversa, convertendo-se em DNA de cadeia dupla, que é posteriormente integrado no genoma do hospedeiro. Esta sequência de DNA viral integrada é chamada de provírus, englobando elementos essenciais como um promotor, segmentos regulatórios e sequências codificadoras para proteínas estruturais e enzimas.
Tipicamente, os retrovírus infectam células somáticas, mas existe uma probabilidade de que um retrovírus possa infectar células germinativas, entrando assim no pool genético do hospedeiro. Neste ponto, o provírus evolui para um retrovírus endógeno (ERVs). O destino dos ERVs dentro de uma população depende das forças da deriva genética e da seleção natural. Em essência, os ERVs representam loci genéticos originários de retrovírus exógenos que se assimilaram no genoma do hospedeiro através do processo de endogenização. Estas entidades mantêm o título de ERVs independentemente da sua capacidade de continuar a expressar partículas virais infecciosas. Ao longo de milhões de anos, muitas sequências de ERV perderam a capacidade de produzir partículas virais devido a mutações acumuladas.
Env exaptação e a relação entre funções virais antigas e funções genómicas atuais. (Johnson Welkin E, 2019)
Os retrovírus endógenos partilham um comum estrutura do genoma, facilitados pelos processos de transcrição reversa e integração. Estes processos resultam na formação de sequências provirais que variam de 5.000 a 10.000 pares de bases de comprimento dentro do genoma do hospedeiro, tipicamente caracterizadas pela presença de sequências de repetição terminal longa (LTRs) em ambas as extremidades. Estas sequências LTR servem como elementos essenciais, abrangendo promotores para a expressão proviral, componentes regulatórios e domínios estruturais cis-atuantes cruciais para a integração.
O conteúdo genético dos retrovírus compreende tipicamente:
A sequência de repetição terminal do LTR é tipicamente dividida em três segmentos, ordenados do extremo 5' para o extremo 3': U3, R, U5.
Na extremidade 5', a junção entre U3 e R marca o início da transcrição, enquanto na extremidade 3', a junção entre R e U5 denota a terminação da transcrição.
O segmento U3 está tipicamente na faixa de 190 a 1.200 pares de bases e contém uma variedade de elementos estruturais, incluindo promotores, potenciadores e outros motivos regulatórios. Estes elementos têm a capacidade de interagir com fatores regulatórios da célula hospedeira, exercendo assim controle sobre a expressão génica do protovírus.
Reconstruindo e analisando genes de retrovírus endógenos antigos. (Johnson Welkin E, 2019)
Os retrovírus endógenos (ERVs) são remanescentes genómicos de retrovírus extintos, oferecendo uma janela única para a co-evolução dos retrovírus e dos genomas dos seus hospedeiros. Eles são ferramentas inestimáveis para desvendar o impacto dos retrovírus na evolução dos hospedeiros.
Por exemplo, HERV-K (HML-2), um ERV presente no genoma humano, o genoma Neandertal e o genoma Denisovano. A sua presença ubíqua sugere uma origem retroviral ancestral dentro da linhagem humana. Em contraste, permanece não fixado no genoma do gorila, residindo em um estado geneticamente segregado com uma sequência relativamente completa. Isso indica atividade contínua em gorilas, com esses retrovírus mantendo o potencial de gerar novas partículas virais infecciosas.
ERVs afiliados a spumavírus, descobertos em animais marinhos, fornecem informações sobre um contexto histórico mais profundo, sugerindo que esses vírus infectaram animais marinhos desde a era Paleozoica. A identificação de ERVs ainda não fixados, como o CrERV-gamma em veados, pode lançar luz sobre os estágios iniciais da endogenização. Notavelmente, em coalas, o retrovírus KoRV exibe tanto sequências endogenizadas e não patogénicas como sequências que ainda não passaram por endogenização, que podem ser potencialmente patogénicas. Analisar estes casos ajuda a compreender o processo de endogenização e a influência do vírus na evolução do genoma do hospedeiro.
Os ERVs também podem servir como relógios moleculares, permitindo a estimativa do tempo de integração e fornecendo informações sobre a emergência e disseminação de retrovírus antigos.
Entre os genes env completos mais antigos descobertos, encontramos aqueles dentro do gene percomorfo de peixes com espinhas nas nadadeiras e o gene HEMO de primatas, que persistiram por centenas de milhões de anos. A sua presença duradoura sugere uma notável conservação e uma seleção natural negativa contínua, insinuando as suas potenciais funções celulares vitais.
Por exemplo, a conservação do gene percomorf pode não resultar da sua capacidade de resistir a invasões virais, mas sim da sua capacidade de induzir fusão de membrana mediada por recetores. Por outro lado, embora não esteja associada à fusão de membrana, o gene HEMO expressa a proteína Env em comprimento total, sujeita a clivagem por proteases citosólicas. Uma parte do produto clivado é secretada para fora da célula, sendo detectável no sangue de mulheres grávidas e no sangue e tecidos da placenta. Apesar destas descobertas intrigantes, o papel fisiológico preciso deste fenómeno continua enigmático.
As proteínas Env codificadas pela maioria dos retrovírus podem ser amplamente categorizadas em dois tipos: tipo gama e tipo beta.
A ênfase atual na domesticação dos genes Env tem-se concentrado principalmente no tipo gama. Esta escolha provavelmente decorre do facto de os genes env do tipo gama serem menos propensos a induzir fusão celular, simplificando o processo de domesticação pelo hospedeiro.
Dentro das sequências de ERV, o gene env, responsável por conferir resistência do hospedeiro contra vírus, é tipicamente acompanhado por genes gag, pro e pol intermitentes. Esta dupla observação implica dois aspectos cruciais: o gene env é altamente conservado e sujeito a uma seleção natural negativa sustentada, enquanto vários outros genes acumularam um número significativo de substituições aleatórias.
Vários métodos para avaliar a seleção natural podem ser utilizados, como a razão dN:dS, que mede a proporção de substituições não sinónimas para sinónimas. Uma razão inferior a 1 indica seleção natural negativa, a igualdade a 1 denota deriva genética aleatória, e superior a 1 indica seleção natural positiva. A seleção natural negativa e positiva podem coexistir dentro de um único gene; certos códons podem estar sob seleção positiva, enquanto outros podem sofrer seleção negativa para manter a estrutura e função essenciais da proteína. Notavelmente, para ambos os ERVs, percomorf e HEMO, a razão dN:dS é inferior a 1, sugerindo que estão, de facto, sujeitos a seleção natural negativa. Em contraste, o fv1 tem estado sob seleção natural positiva sustentada, juntamente com uma pressão de seleção intrabranquial específica para o alvo.
Se o gene Env desempenha um papel vital no desenvolvimento das espécies, deve permanecer altamente conservado e sofrer uma pressão de seleção negativa duradoura. No entanto, se a sua função principal é inibir a invasão retroviral exógena, a pressão seletiva contra os antivírus deve apresentar padrões cíclicos, intensificando-se com o surgimento de vírus exógenos e diminuindo ou alterando-se à medida que os vírus exógenos se extinguem. Os resultados do estudo confirmam esta hipótese, com os sincitinos, ligados ao desenvolvimento da formação placentária, a originarem-se há cerca de 12 a 80 milhões de anos, enquanto certos genes Env focados em resistir à invasão viral são relativamente recentes, com eventos de emergência ocorrendo há mais de 20 milhões de anos.
Os proto-vírus e os ERVs têm a capacidade de influenciar a expressão regulada de genes localizados a poucos quilobases dos seus arredores. Os LTRs dos ERVs podem servir como promotores ou locais de ligação para fatores de transcrição, potencialmente contribuindo RNAs longos não codificantes (lncRNAs) que atuam como sequências regulatórias. Esta aquisição e perda dinâmica de sequências regulatórias de ERV durante a evolução permitem que até mesmo espécies intimamente relacionadas manifestem uma diversidade fenotípica significativa.
Várias características-chave dos ERVs podem contribuir para a evolução das redes regulatórias de genes do hospedeiro.
Referência: