Metagenómica Viral e Sequenciação do Viroma: Detetar e Caracterizar Populações Virais em Amostras Clínicas e Ambientais
Um único grama de fezes humanas contém aproximadamente 10⁹ partículas semelhantes a vírus. Um litro de água do mar contém cerca de 10¹⁰. Os fagos superam as bactérias em dez para um em todos os ecossistemas da Terra, impulsionando a transferência horizontal de genes a uma escala que remodela o metabolismo microbiano diariamente. No entanto, a vasta maioria desses vírus — frequentemente chamados de "matéria escura viral" da microbiologia — nunca foi cultivada, sequenciada ou classificada. Eles não possuem rRNA 16S. Não têm nenhum gene marcador universal. Durante décadas, foram invisíveis por design: todos os métodos de microbioma comumente utilizados, desde a sequenciação de amplicons até a metagenómica shotgun padrão, foram construídos em torno de alvos bacterianos.
A metagenómica viral — viromics — muda isso. Ao enriquecer partículas semelhantes a vírus a partir de uma amostra, extrair tanto DNA como RNA, e sequenciar sem o filtro de tamanho bacteriano que a metagenómica padrão aplica implicitamente, a viromics revela a fração viral de um microbioma a uma profundidade genómica significativa. A diferença técnica entre a metagenómica padrão e a viromics é substancial, mas uma comparação de 2025 entre métodos metagenómicos enriquecidos com VLP e métodos a granel mostrou que apenas cerca de 27% dos genomas virais se sobrepõem entre as duas abordagens. Se você apenas realizar metagenómica padrão em shotgun, está a perder aproximadamente três quartos do viroma.
Este guia abrange o fluxo de trabalho de sequenciação do viroma de ponta a ponta: como enriquecer partículas virais a partir de amostras clínicas e ambientais, por que certas escolhas de amplificação (particularmente MDA) podem distorcer a composição da comunidade, como a cadeia de ferramentas bioinformáticas para identificação de vírus difere do pipeline de MAG bacteriano e onde a viromica está a fornecer informações acionáveis — desde doenças inflamatórias intestinais até triagem de terapia com fagos e vigilância biossanitária baseada em águas residuais.
Figura 1: Visão geral do fluxo de trabalho de sequenciação do viroma — desde a recolha de amostras, passando pelo enriquecimento viral, preparação da biblioteca, sequenciação e análise bioinformática até à compreensão funcional.
Preparação de Amostras: Separar Vírus de Tudo o Resto
O desafio central da viromics é que os vírus são pequenos, raros e quimicamente frágeis. Uma amostra fecal é aproximadamente 99% composta por células bacterianas e do hospedeiro em termos de biomassa. Um swab respiratório pode conter picogramas de ácido nucleico viral num fundo de microgramas de RNA humano. Antes de qualquer biblioteca ser preparada, a fração viral deve ser fisicamente separada e concentrada.
- Enriquecimento de Partículas Virais
Três métodos dominam, e a escolha entre eles determina quais vírus são capturados.
A filtração é o primeiro passo universal. A passagem de uma amostra homogeneizada através de filtros de membrana de polietersulfona sequenciais de 0,8 μm e 0,45 μm ou 0,22 μm remove bactérias, fungos e detritos celulares, permitindo que a maioria das partículas virais passe. Para amostras com alta carga particulada — solo, sedimento, fezes — a pré-clarificação por centrifugação a baixa velocidade é essencial para evitar o entupimento imediato do filtro. A filtração por si só produz uma fração viral bruta adequada para algumas aplicações, mas a maioria dos protocolos segue com uma etapa de concentração.
A ultracentrifugação a 75.000 a 100.000 × g durante uma a duas horas sedimenta partículas virais diretamente. É o padrão ouro: recupera tanto vírus de DNA como de RNA, funciona com diferentes tipos de amostras e produz uma fração viral limpa. A desvantagem é o custo do equipamento e a capacidade de processamento — um rotor suporta talvez seis a doze amostras por corrida. Para estudos com centenas de amostras, isso torna-se um gargalo logístico.
A precipitação com PEG utiliza polietileno glicol 8000 a 10% (p/v) com 1 M de cloreto de sódio, incubado durante a noite a 4°C, seguido de centrifugação a aproximadamente 1.200 × g. O pellet contém partículas virais concentradas, além de alguns detritos bacterianos co-precipitados. A precipitação com PEG custa uma fração do custo da ultracentrifugação e pode ser escalada para qualquer tamanho de lote, tornando-se a escolha pragmática para estudos de grandes coortes. Uma comparação direta em 2025 descobriu que a precipitação com PEG e a ultracentrifugação recuperaram comunidades virais amplamente comparáveis a partir de amostras fecais, com a precipitação com PEG apresentando rendimentos ligeiramente superiores e a ultracentrifugação mostrando uma pureza marginalmente superior.
Na prática, a escolha do método de enriquecimento depende do tipo de amostra e da escala do estudo: ultracentrifugação para viromas de alta pureza com até doze amostras, precipitação de PEG para estudos de grandes coortes onde a capacidade de processamento e o custo são primordiais, e filtração apenas para estudos piloto com recursos limitados. Para amostras de água acima de um litro, a filtração por fluxo tangencial (TFF) com uma membrana de corte de peso molecular de 100 kDa concentra partículas virais sem a necessidade de um passo de pelotamento, tornando-se a abordagem preferida para viromas de água do mar, águas residuais e água doce. A TFF também concentra partículas virais enquanto remove simultaneamente inibidores de PCR dissolvidos, como ácidos húmicos, um benefício duplo que simplifica o processamento posterior de amostras ambientais complexas.
Independentemente do método de concentração, segue-se uma etapa de tratamento com nucleases: DNase I mais RNase A (ou um cocktail comercial de benzonase) digere os ácidos nucleicos livres liberados de bactérias e células hospedeiras lisadas. Esta etapa é essencial — sem ela, a fração "viral" pode conter até 40% de DNA bacteriano, anulando o esforço de enriquecimento. Após o tratamento com nucleases, as próprias enzimas devem ser inativadas ou removidas antes que os capsídeos virais sejam lisados para a extração de ácidos nucleicos.
- Extração de Ácidos Nucleicos: DNA e RNA Juntos
A maioria dos vírus de interesse em um estudo de microbioma possui genomas de DNA — bacteriófagos, adenovírus, anelovírus — mas os vírus de RNA, incluindo rotavírus, norovírus e SARS-CoV-2, são críticos em contextos clínicos e de águas residuais. Uma única extração que recupere ambos os tipos de ácidos nucleicos, seguida de preparação separada de bibliotecas de DNA e RNA, é a estratégia mais informativa.
Kits de extração viral dedicados — o QIAamp Viral RNA Mini Kit, o PureLink Viral RNA/DNA Mini Kit e o AllPrep PowerViral DNA/RNA Kit — superam consistentemente os kits de extração metagenómica padrão (desenhados para células bacterianas) em termos de enriquecimento de leituras virais. Uma comparação em 2025 entre vários métodos de extração confirmou que os kits otimizados para lise de partículas virais e eluição em pequenos volumes recuperam aproximadamente 2 a 5 vezes mais leituras virais por amostra do que as alternativas focadas em bactérias. A lise mecânica é crítica para a recuperação de capsídeos virais estruturalmente robustos. A utilização de esferas de sílica-zirconia de 0,1 mm durante 3 a 5 minutos é uma prática padrão para viromas fecais e de solo. No entanto, para vírus RNA envoltos — incluindo o SARS-CoV-2 e a gripe — a lise química mais suave com tampões à base de tiocianato de guanidina preserva a membrana lipídica labile enquanto ainda libera o genoma de RNA. Para a recuperação de vírus RNA especificamente, o RNA transportador deve ser omitido da extração — ele compete durante a transcrição reversa e suprime o sinal viral.
CD Genomics' Sequenciação Metagenómica Viral o serviço realiza o enriquecimento de partículas virais e a co-extração de DNA/RNA a partir de uma ampla gama de tipos de amostras clínicas e ambientais, com controlo de qualidade em cada etapa, desde a filtração até ao tratamento com nucleases.
Figura 2: Uma comparação em três painéis mostrando métodos de enriquecimento de VLP — ultracentrifugação, precipitação com PEG e apenas filtração — com métricas de rendimento e pureza para cada abordagem.
Preparação da Biblioteca: A Forquilha de Amplificação no Caminho
Os rendimentos de ácidos nucleicos virais a partir do enriquecimento de VLP são frequentemente na faixa de picogramas a nanogramas — abaixo do limiar de entrada para a preparação de bibliotecas padrão baseada em ligadura. A amplificação é necessária, e a escolha do método de amplificação determina se a biblioteca resultante reflete a verdadeira comunidade viral ou um artefato da preferência da polimerase.
- O Problema MDA
A amplificação por deslocamento múltiplo, utilizando a polimerase de DNA φ29, foi o método de amplificação viromica padrão durante mais de uma década. A φ29 amplifica DNA circular de cadeia simples com extrema eficiência — afinal, é a polimerase que os bacteriófagos utilizam para replicar os seus próprios genomas através de um mecanismo de círculo rolante.
O problema é o que isto faz à composição da comunidade. A MDA amplifica preferencialmente o DNA circular de cadeia simples pequeno através do mesmo mecanismo de círculo rolante que o φ29 utiliza para a replicação do seu próprio genoma. Um benchmark de 2024 utilizando misturas virais sintéticas confirmou que o tratamento com MDA enriquece os vírus ssDNA circulares — particularmente Microviridae — por ordens de magnitude em relação à sua verdadeira abundância, enquanto uma abordagem alternativa com a polimerase de DNA T7 preservou a relação original de ssDNA para dsDNA em amostras viromas fecais sintéticas e complexas. Para um estudo interessado na comunidade viral total, a MDA torna os dados incompreensíveis. O único caso defensável de uso da MDA é quando a questão de pesquisa específica diz respeito a vírus ssDNA circulares — Microviridae, Circoviridae, Geminiviridae — e nada mais.
- SISPA e Amplificação Aleatória
A amplificação de um único primer independente de sequência (SISPA), na qual cDNA ou DNA é marcado com uma sequência de primer definida e depois amplificado por PCR, introduz menos viés composicional do que a MDA, ao mesmo tempo que alcança uma amplificação semelhante. Um protocolo de referência de viroma fecal de 2025 descobriu que o PCR-SISPA com 30 ciclos recuperou estruturas de comunidades virais que correlacionaram bem com bibliotecas não amplificadas, enquanto as bibliotecas amplificadas por MDA mostraram correlação quase zero com qualquer outro método.
Para vírus de RNA, a transcrição reversa com hexâmeros aleatórios ou primers degenerados 9N, seguida de troca de molde (a abordagem SMART), fornece cDNA adequado tanto para preparação de bibliotecas de leitura curta quanto de leitura longa. A plataforma SMART-RNA-Metavirome, publicada em 2025, demonstrou que um passo de RT com troca de molde acoplado a priming degenerado 9N alcança aproximadamente 99,9% de cobertura do genoma para o vírus da dengue em baixas concentrações, com o benefício adicional da depleção inerente de rRNA — o mecanismo de troca de molde não captura rRNA com cap.
- Construção de Biblioteca e Profundidade de Sequenciação
Para viromics baseados em Illumina, a preparação de bibliotecas baseada em tagmentação (Illumina DNA Prep) a partir de aproximadamente 125 ng de DNA amplificado é o padrão atual. Protocolos baseados em ligadura (TruSeq Nano) são uma alternativa para genomas virais ricos em AT, onde a tagmentação pode introduzir lacunas de cobertura.
As recomendações de profundidade de sequenciamento estão a mudar. Estudos iniciais do viroma frequentemente sequenciavam entre 1 a 2 milhões de pares de leituras por amostra — suficiente para descrever os táxons virais dominantes, mas inadequado para vírus raros ou de baixa abundância. Um estudo de referência envolvendo 882 amostras de viroma recomendou entre 4 a 10 Gb por amostra para uma caracterização abrangente do viroma, correspondendo a aproximadamente 13 a 33 milhões de pares de leituras a 2×150 bp. A estas profundidades, genomas virais presentes com 0,01% de abundância relativa tornam-se detectáveis. Para estudos de grandes coortes onde o sequenciamento profundo do viroma de cada amostra é economicamente inviável, uma estratégia em etapas — sequenciamento raso de todas as amostras seguido de sequenciamento profundo de um subconjunto — equilibra o poder de descoberta com o orçamento.
Para estudos que integram viromics com metagenómica padrão, a CD Genomics' Sequenciação Metagenómica por Shotgun fornece o perfil bacteriano e arqueano da mesma amostra, enquanto Sequenciação Metagenómica Viral recupera a fração viral — juntos, oferecem a visão complementar que os estudos de comparação de 2025 demonstraram ser essencial para uma caracterização abrangente do microbioma.
Figura 3: Três estratégias de amplificação comparadas — MDA, PCR-SISPA e SMART com troca de molde — mostrando o viés na composição da comunidade em cada método, utilizando gráficos de barras empilhadas da abundância de famílias virais.
Bioinformática para Viromics: Uma Ferramenta Distinta
O pipeline bioinformático para viromics diverge do pipeline metagenómico padrão na etapa de classificação. A classificação metagenómica bacteriana utiliza correspondência de k-mer contra bases de dados de genomas curadas. A classificação viral enfrenta um problema fundamentalmente mais difícil: a maioria dos vírus em qualquer amostra dada não tem um parente próximo em nenhuma base de dados de referência.
- Controlo de Qualidade e Remoção de Anfitriões
Os passos de pré-processamento seguem o padrão da metagenómica: corte de qualidade com fastp e remoção do genoma do hospedeiro com Bowtie 2 contra a referência apropriada — hg38 para amostras clínicas humanas, o genoma da planta hospedeira para viromas da rizosfera ou da filossfera, ou uma base de dados combinada para amostras ambientais. Para amostras clínicas, frações de leituras humanas de 50 a 90% são comuns, e a falha em depletá-las ofusca o sinal viral.
- Classificação Baseada em Leitura
O Kraken 2, com uma base de dados focada em vírus, fornece uma atribuição taxonómica rápida ao nível da leitura, mas a sensibilidade é inteiramente dependente da base de dados. Uma sequência viral de uma família de fagos não caracterizada pode ser classificada apenas até ao nível de "Caudoviricetes" — ou não ser classificada de todo. O DIAMOND BLASTX, que alinha leituras de nucleotídeos traduzidos contra uma base de dados de proteínas, é mais sensível para sequências virais divergentes porque a sequência de proteínas é mais conservada do que a sequência de nucleotídeos. A desvantagem é a velocidade: o DIAMOND é aproximadamente duas ordens de magnitude mais lento que o Kraken 2 no mesmo conjunto de dados.
Para a viromica clínica, onde a questão é "O patógeno X está presente?", a classificação baseada em leituras com ferramentas como SeqScreen ou Centrifuge fornece uma resposta sim/não dentro de horas após o sequenciamento. Para a viromica ecológica, onde a questão é "Qual é a estrutura e diversidade da comunidade viral?", a classificação baseada em leituras é uma primeira abordagem que deve ser seguida pela montagem.
- Identificação de Montagens e Contigs Virais
MEGAHIT e metaSPAdes montam genomas virais a partir de dados metagenómicos, mas a montagem viral apresenta desafios únicos: baixa cobertura, alta variabilidade e a presença de profagos integrados dentro de contigs bacterianos. A co-montagem de leituras de múltiplas amostras relacionadas melhora a recuperação de genomas virais de baixa abundância ao agrupar a cobertura.
As ferramentas de identificação de contigs virais amadureceram rapidamente. O VirSorter2 utiliza um classificador de floresta aleatória treinado em genes marcadores virais e características genómicas para distinguir contigs virais de contigs bacterianos. É a ferramenta mais amplamente adotada e apresenta um bom desempenho para fágos de DNA de cadeia dupla, que dominam a maioria dos viromas. O CheckV avalia a completude do genoma viral, identifica contaminação por hospedeiros nas extremidades dos contigs e estima o nível de qualidade de cada sequência viral — fornecendo métricas de qualidade análogas ao CheckM2 para MAGs bacterianos. O VIBRANT adiciona anotação funcional, identificando genes metabólicos auxiliares (AMGs) transportados por fágos — genes que os fágos utilizam para redirecionar o metabolismo do hospedeiro durante a infecção, como genes do fotossistema em cianofágos ou genes de metabolismo de nucleotídeos em fágos intestinais.
Para um viroma fecal típico, a montagem MEGAHIT seguida pelo VirSorter2 e CheckV identifica aproximadamente 2.000 a 5.000 unidades taxonómicas operacionais virais (vOTUs) por amostra, das quais 10 a 20% são genomas virais completos ou de alta qualidade.
A classificação taxonómica dos contigs virais validados utiliza ferramentas como o vConTACT2 ou o VPF-Class em relação à base de dados IMG/VR, que agora contém mais de 15 milhões de sequências virais, ou o novo framework geNomad que combina abordagens de genes marcadores e de aprendizagem automática para identificação viral simultânea e atribuição taxonómica. O pipeline integrado do geNomad — identificação viral, taxonomia e previsão de hospedeiros numa única ferramenta — reduz a sobrecarga computacional de executar três ferramentas separadas em sequência e foi avaliado para recuperar aproximadamente 20% mais contigs virais do que o VirSorter2 sozinho em viromas de solo e marinhos, embora as duas ferramentas sejam complementares e frequentemente utilizadas em conjunto.
- Análise de Profage e CRISPR
Profagos integrados — genomas de bacteriófagos inseridos nos cromossomos bacterianos — são invisíveis à viromica baseada em VLP porque são retidos no filtro de tamanho bacteriano. A sua deteção requer a análise da montagem metagenómica em massa. Ferramentas como o VIBRANT e o geNomad sinalizam regiões de profagos dentro de contigs bacterianos. O emparelhamento de espaçadores CRISPR com fágos fornece a forma mais forte de ligação hospedeiro-vírus: se um arranjo CRISPR bacteriano contém um espaçador que corresponde a um contig viral, essa bactéria (ou o seu ancestral) foi infetada por esse fago. Os arranjos CRISPR funcionam como uma memória imune adaptativa bacteriana — quando uma bactéria sobrevive a uma infecção por fago, incorpora um pequeno fragmento do genoma do fago no seu próprio lócus CRISPR. O emparelhamento destes espaçadores arquivados com contigs virais montados revela assim quais fágos infetaram historicamente quais hospedeiros bacterianos, fornecendo a evidência mais forte disponível para a ligação hospedeiro-vírus em dados metagenómicos. Esta informação de previsão de hospedeiro é essencial para compreender redes de interação fago-bactéria, mas só está disponível quando os dados metagenómicos em massa e viromicos são analisados em conjunto.
CD Genomics' pipeline de análise de viroma inclui o fluxo de trabalho bioinformático completo do viroma: controlo de qualidade, remoção de leituras do hospedeiro, classificação baseada em Kraken 2 e DIAMOND, montagem MEGAHIT, validação de contigs virais com VirSorter2 e CheckV, e atribuição taxonómica contra o IMG/VR.
Figura 4: Pipeline bioinformático do viroma — controlo de qualidade → remoção do hospedeiro → classificação baseada em leituras (Kraken 2 / DIAMOND) → montagem (MEGAHIT) → identificação de contigs virais (VirSorter2 / CheckV) → anotação funcional (VIBRANT).
Aplicações: Do Intestino ao Ambiente
O viroma intestinal é dominado por bacteriófagos — cerca de 90 a 95% das leituras virais na maioria dos viromas fecais mapeiam para Caudoviricetes (fagos com cauda) e Microviridae. A fração restante inclui vírus eucariotos (anellovírus, adenovírus, enterovírus) e vírus de plantas da dieta. Ao contrário do bacteriómio intestinal adulto, que se estabiliza por volta dos três anos, o viroma intestinal continua a mudar durante a infância e adolescência.
Na doença inflamatória intestinal, múltiplas coortes independentes relataram uma riqueza elevada de Caudovirales na doença de Crohn e na colite ulcerativa em comparação com controlos saudáveis — o oposto do padrão de diversidade bacteriana, onde a doença está associada a uma riqueza reduzida. Uma meta-análise de 2025 que abrangeu 2.066 amostras metagenómicas de 16 coortes descobriu que a diversidade de Shannon viral era consistentemente mais alta na DII em todos os estudos, e que um classificador de floresta aleatória treinado nos 50 vOTUs discriminatórios principais separou casos de controlos com uma área sob a curva de 0,85 a 0,90.
A terapia com fagos — utilizando fagos líticos para tratar infeções bacterianas multirresistentes — tem gerado um renovado interesse na descoberta de fagos ambientais. O sequenciamento metagenómico de amostras de águas residuais, água do mar e solo identifica genomas de fagos completos que não transportam genes conhecidos de resistência a antibióticos ou de toxinas, os quais podem ser posteriormente testados contra isolados bacterianos clínicos. O conjunto de dados de referência do viroma de 882 amostras mencionado acima foi gerado em parte para apoiar a descoberta de fagos para um programa de terapia com fagos para Klebsiella pneumoniae.
Na biossurveillance, a viromica de águas residuais fornece uma capacidade de monitorização a nível populacional e agnóstica em relação a patógenos. Durante e após a pandemia de COVID-19, o sequenciamento metagenómico de concentrados virais de águas residuais detectou não apenas linhagens de SARS-CoV-2, mas também enterovírus, norovírus, rotavírus e vírus da hepatite A — fornecendo um alerta precoce da transmissão comunitária antes de os casos clínicos serem reportados. Uma revisão de 2024 sobre sequenciamento de próxima geração metagenómico no diagnóstico de doenças infeciosas documentou o papel crescente desta abordagem em infecções respiratórias, do fluxo sanguíneo, do sistema nervoso central e gastrointestinais, confirmando que o mNGS detecta vírus clinicamente relevantes que a cultura e a PCR direcionada não conseguem identificar. A mesma abordagem aplicada ao escoamento agrícola e ao efluente da aquicultura monitora o movimento de patógenos virais na interface animal-humano.
Uma referência cruzada à CD Genomics' Serviços de Sequenciação Metagenómica fornece contexto adicional sobre como a viromics se integra com estratégias metagenómicas mais amplas, incluindo os fluxos de trabalho do microbioma intestinal abordados no nosso guia para Sequenciação Metagenómica por Shotgun para Estudos do Microbioma Intestinal.
Figura 5: Disbiose do Viroma Intestinal na DII — riqueza elevada de Caudoviricetes e reconfiguração da rede hospedeiro-vírus na doença inflamatória intestinal, com gráficos de violino da diversidade viral de Shannon e gráficos de barras empilhadas da abundância relativa de famílias virais comparando coortes saudáveis versus DII.
Desafios e Limitações
O problema da matéria escura viral é a única limitação analítica mais significativa. No estudo de referência mais recente sobre viromas ambientais, aproximadamente 60 a 90% dos contigs virais montados não apresentaram correspondência significativa com qualquer sequência no IMG/VR ou RefSeq. Estas sequências representam linhagens virais novas — famílias ou ordens inteiras sem um único representante caracterizado. A classificação baseada na estrutura de proteínas, utilizando ferramentas como as estruturas previstas pelo AlphaFold, mostra uma promessa inicial para colocar estas sequências em uma árvore da vida viral: proteínas virais marcantes, como as proteínas principais do capsídeo, terminases e proteínas de portal, mantêm dobras estruturais ao longo de bilhões de anos de divergência, mesmo quando suas sequências primárias não compartilham semelhança detectável. No entanto, prever estruturas para milhares de contigs virais novos continua a ser computacionalmente exigente e ainda não é rotina em pipeline de análise de viromas.
A completude da base de dados varia dramaticamente consoante o ambiente. O viroma intestinal humano é o melhor caracterizado, com dezenas de milhares de vOTUs catalogados em coortes. Os viromas do solo e marinhos estão muito menos completos, e os viromas de invertebrados, protistas e ambientes extremos permanecem em grande parte inexplorados. Uma sequência viral de uma chaminé hidrotermal em alto-mar tem talvez uma probabilidade de 5 a 10% de corresponder a algo na base de dados.
A quantificação é o segundo desafio não resolvido. Ao contrário do 16S ou da metagenómica padrão, onde os padrões internos agora permitem a quantificação absoluta da abundância em cópias por grama ou cópias por célula, a quantificação absoluta viral é complicada pela relação variável entre a contagem de VLP e o número de cópias do genoma — uma única célula bacteriana infectada pode libertar centenas de partículas de fago, cada uma transportando uma cópia do genoma, em uma explosão lítica. Para estudos que comparam a abundância viral em diferentes condições, a abundância relativa (leituras por milhão ou cópias de genoma por milhão) continua a ser o padrão, com a compreensão de que um aumento relativo em um táxon viral força matematicamente uma diminuição em outros.
O custo do sequenciamento profundo do viroma — 4 a 10 Gb por amostra para uma cobertura abrangente — excede o custo da metagenómica shotgun superficial para bactérias. Estudos com grandes coortes devem fazer escolhas deliberadas entre o número de amostras e a profundidade por amostra. Para a descoberta de biomarcadores, o sequenciamento profundo do viroma de uma coorte de descoberta seguido pela validação direcionada (qPCR ou PCR digital dos principais candidatos vOTUs) em uma coorte de replicação maior é a estratégia prática.
A CD Genomics apoia Sequenciação Metagenómica Viral em profundidades de sequenciação flexíveis, desde inquéritos viromas superficiais com 2 a 3 milhões de leituras por amostra até caracterização viromas profunda com mais de 20 milhões de leituras, com a opção de Serviço de Sequenciação Metagenómica Absoluta para estudos que requerem estimativas quantitativas da carga viral.
Figura 6: Visualização da matéria escura viral — um conjunto de gráficos de pizza mostrando a proporção de contigs virais classificados vs. não classificados em ambientes humanos intestinais, solo, marinhos e extremos, com ícones representativos de morfologia viral 3D para famílias conhecidas e silhuetas de ponto de interrogação para formas virais previstas mas não observadas.
Como a CD Genomics Realiza o Seu Projeto de Sequenciamento do Viroma
Um projeto de sequenciação de viromas na CD Genomics segue um fluxo de trabalho definido e otimizado para a recuperação viral. As amostras são recebidas com documentação de cadeia de custódia e processadas de acordo com protocolos específicos para cada matriz: amostras fecais são homogeneizadas em DNA/RNA Shield, amostras de água são filtradas através de membrana de 0,22 μm, e amostras respiratórias ou de tecido são homogeneizadas em meio de transporte viral. O enriquecimento de partículas virais é realizado por precipitação com PEG ou ultracentrifugação, selecionados de acordo com o tipo de amostra e os objetivos do estudo, seguido por tratamento com nucleases e extração do ácido nucleico viral total utilizando kits otimizados para lise de partículas virais. O ácido nucleico extraído é dividido em fluxos de trabalho paralelos de DNA e RNA — amplificação PCR-SISPA e tagmentação para vírus de DNA, transcrição reversa e amplificação para vírus de RNA — e sequenciado na plataforma Illumina NovaSeq. O pipeline bioinformático inclui corte de qualidade, remoção de leituras do hospedeiro, classificação Kraken 2 e DIAMOND BLASTX, montagem MEGAHIT, identificação de contigs virais com VirSorter2, avaliação de qualidade com CheckV e atribuição taxonómica contra IMG/VR. Os entregáveis incluem arquivos FASTQ brutos, relatórios de controle de qualidade, tabelas de abundância taxonómica viral a nível de espécie e vOTU, genomas virais montados com métricas de qualidade CheckV, anotação funcional de AMGs virais e um relatório abrangente do projeto. O tempo de resposta para um projeto de viroma com 50 amostras é de aproximadamente seis a oito semanas a partir da recepção das amostras.
Para estudos que requerem perfilagem taxonómica e funcional de bactérias juntamente com a análise viral, a CD Genomics' Sequenciação Metagenómica de Shotgun o serviço fornece a visão bacteriana complementar. Para projetos que investigam vírus que se replicam ativamente através da expressão génica, Sequenciação Metatranscriptómica captura a fração de RNA tanto do hospedeiro quanto do vírus. Para estudos em escala de coorte que combinam viromics, metagenómica e metabolómica, o nosso Serviço de Multi-Ómicas fornece um design de estudo integrado em múltiplas plataformas e integração de dados. Quando a pesquisa do viroma identifica candidatos a fagos para desenvolvimento terapêutico, Sequenciação do Genoma Completo Microbiano apoia a caracterização do genoma do hospedeiro bacteriano necessária para confirmar a especificidade fago-hospedeiro.
Referências:
- De Chiara L, Romano V, Cerutti F, et al. Uma comparação de métodos para a recuperação ótima do viroma fecal humano. medRxiv. 2025. doi:10.1101/2025.05.12.25327428 (CC BY 4.0)
- Billaud M, Theodorou I, Lamy-Besnier Q, et al. O tratamento com a polimerase de DNA T7 melhora o sequenciamento quantitativo de vírus de DNA de cadeia dupla e de cadeia simples. Revista da Comunidade de Pares. 2024;4:e63. doi:10.24072/pcjournal.437 (CC BY 4.0)
- Li N, Liu S, Zhang Y, et al. SMART-RNA-Metavirome: uma plataforma prática de metaviroma de RNA compatível com sequenciação de alto débito de leituras curtas e longas. Doenças Infecciosas da Pobreza2025;14:101. doi:10.1186/s40249-025-01371-z (CC BY 4.0)
- Nayfach S, Camargo AP, Schulz F, et al. O CheckV avalia a qualidade e a completude de genomas virais montados a partir de metagenomas. Biotecnologia da Natureza. 2021;39:578-585. doi:10.1038/s41587-020-00774-7 (CC BY 4.0)
- Guo J, Bolduc B, Zayed AA, et al. VirSorter2: uma abordagem de múltiplos classificadores, guiada por especialistas, para detectar diversos vírus de DNA e RNA. Microbioma. 2021;9:37. doi:10.1186/s40168-020-00990-y (CC BY 4.0)
- Ansari MH, Ebrahimi M, Fattahi MR, et al. Análise metagenómica viral de amostras fecais revela uma assinatura viromática entérica na síndrome do intestino irritável. BMC Microbiology. 2020;20:123. doi:10.1186/s12866-020-01817-4.
- Moon K, Cho JC. Conjuntos de dados do viroma e genomas montados de metagenomas virais de ambientes de água doce afetados pela aquicultura. Dados Científicos. 2026;13:284. doi:10.1038/s41597-026-07383-0 (CC BY 4.0)
- Kieft K, Zhou Z, Anantharaman K. VIBRANT: recuperação, anotação e curadoria automatizada de vírus microbianos, e avaliação da função da comunidade viral a partir de sequências genómicas. Microbioma. 2020;8:90. doi:10.1186/s40168-020-00867-0 (CC BY 4.0)
- Zhao Y, Zhang W, Wang X, et al. Aplicação da sequenciação de próxima geração metagenómica no diagnóstico de doenças infeciosas. Fronteiras em Microbiologia Celular e de Infecção. 2024;14:1458316. doi:10.3389/fcimb.2024.1458316 (CC BY 4.0)
Apenas para fins de investigação, não destinado a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
- Sequenciação Metagenómica Viral
- Sequenciação Metagenómica por Shotgun
- Sequenciação Metatranscriptómica
- Sequenciação de Amplicões 16S/18S/ITS
- Sequenciação Metagenómica de Leitura Longa
- Serviço de Sequenciação Metagenómica Absoluta
- Análise de Genes de Resistência a Antibióticos
- Sequenciação do Genoma Completo Microbiano
- Serviço de Multi-Ómicas
- Identificação Microbiana