Por que Leituras Longas para Metagenómica
Se está a realizar metagenómica shotgun de leituras curtas (Illumina), conhece os limites. Leituras curtas (2×150 bp ou 2×300 bp) fragmentam genomas em milhares de contigs. O resultado: genomas assembleados de metagenomas fragmentados (MAGs), resolução taxonómica a nível de género no melhor dos casos, e anotação funcional de genes que muitas vezes se limita ao nível de domínio — porque o contexto completo do gene é perdido.
Leituras longas resolvem estes problemas:
Classificação a nível de espécie e estirpe sem montagem. Cada leitura HiFi da PacBio abrange o suficiente do gene 16S rRNA, ou uma região de marcador específica da espécie, para classificar diretamente ao nível da espécie. Para muitos genomas bacterianos, uma única leitura HiFi pode cobrir um operão inteiro ou um elemento genético móvel — preservando o contexto genómico que as leituras curtas fragmentam.
MAGs de maior qualidade. Os MAGs circulares baseados em HiFi (cMAGs) superam consistentemente os MAGs de leituras curtas em completude, contaminação e N50. As leituras ultra-longas de Nanopore podem ainda melhorar a contiguidade dos MAGs para as comunidades mais complexas.
Clusters de genes completos e contexto de ARG. Os clusters de genes biossintéticos (BGCs) e os genes de resistência a antimicrobianos (ARGs) frequentemente abrangem 10–50 kb — bem dentro de uma única leitura HiFi. Quando se consegue capturar um BGC completo ou um cassete de ARG numa única leitura, sabe-se exatamente a que espécie pertence, quais são os genes vizinhos e se está num plasmídeo ou cromossoma.
Aplicações da Sequenciação Metagenómica de Longa Leitura
Onde as leituras longas acrescentam mais valor em relação à metagenómica de leituras curtas.
Microbiologia ambiental
Perfilar comunidades microbianas do solo, água, sedimentos e ambientes extremos a nível de espécie. Rastrear espécies-chave, guildas funcionais e distribuições de caminhos biogeoquímicos.
Pesquisa sobre o microbioma humano
Resolva a composição do microbioma intestinal, oral, cutâneo e vaginal ao nível da estirpe. Ligue estirpes específicas a metabolitos, fenótipos do hospedeiro ou estados de doença — uma resolução que a perfuração de curto alcance ao nível do género não consegue fornecer.
Vigilância da resistência antimicrobiana (RAM)
Capture cassetes de ARG completos em leituras longas únicas. Identifique a espécie hospedeira, o contexto do plasmídeo e os genes de resistência co-localizados simultaneamente — crítico para rastrear a transmissão de ARG.
Microbiologia industrial e agrícola
Otimize consórcios de fermentação, faça triagem de novas enzimas e BGCs, e monitore microbiomas do solo ou da rizosfera para organismos de biocontrolo e promoção do crescimento das plantas.
Fluxo de Trabalho de Sequenciação Metagenómica de Longa Leitura
- Amostra de entrada e QCQuantificação de gDNA e verificação de pureza (Qubit, espectrofotometria). A260/280 1,8–2,0, A260/230 ≥2,0. ≥2 μg de DNA metagenómico de alta qualidade. Depleção de DNA do hospedeiro disponível para amostras clínicas.
- Preparação da bibliotecaConstrução de biblioteca SMRTbell com seleção de tamanho (PacBio) ou preparação rápida/ligações (Nanopore). Multiplexação com código de barras para projetos de múltiplas amostras.
- SequenciaçãoPacBio Sequel II/IIe ou Revio para metagenómica HiFi. Oxford Nanopore PromethION ou GridION para metagenómica ONT em grande escala. Sequenciação SMRT da PacBio | Sequenciação por NanoporosAlvo de 5–10 Gbp por amostra para perfilagem de espécies, 10–20 Gbp para MAGs.
- Basecalling e QCPacBio CCS → HiFi (≥3 passagens, QV ≥30). Nanopore: chamada de base Dorado. QC: rendimento, comprimento de leitura N50, pontuação Q, equilíbrio de código de barras.
- BioinformáticaTaxonomia (Kraken2/Bracken), anotação funcional (KEGG, eggNOG, CAZy, CARD), agrupamento de MAG (HiFi-MAG, metaMDBG para HiFi; metaFlye para ONT), análise comparativa.
- Entrega: Leituras longas (FASTQ/BAM), relatório de QC, tabelas de taxonomia, resultados de anotação, MAGs (FASTA), relatório de análise.

Requisitos de Amostra
| Tipo de amostra | Quantidade recomendada | Mínimo | Notas |
|---|---|---|---|
| DNA metagenómico | ≥2 μg, ≥30 ng/μL | 1 μg | A260/280 1,8–2,0; tratado com RNase |
| Solo / Sedimento | 6 g | 2 g | Congele imediatamente; evite descongelar. |
| Conteúdos fecais / intestinais | 5 g | 2 g | Tubo estéril; −80°C |
| Membrana de filtro de água | 6 membranas | 2 membranas | 0,22–0,45 μm; −80°C |
| Swabs | 10–20 swabs | 6 swabs | Utilizar buffer de preservação |
| Tecido | 2 g | 1 g | Congelação rápida em N₂ líquido |
| Líquido de fermentação | 6–10 mL (pelote ≥2 g) | 2 mL (pelote ≥1 g) | Enviar pellets em gelo seco |
- Envie todas as amostras em gelo seco (−80°C) ou em pacotes de gelo (−20°C para DNA). Inclua a data de recolha, o método de extração e inibidores conhecidos. Contacte-nos para amostras de baixo biomassa, FFPE ou desafiadoras. Também disponível: Sequenciação Ultra-Longa por Nanoporos para as comunidades mais complexas.
Análise Bioinformática
Padrão (incluído)
- Processamento de leitura: CCS → HiFi (PacBio) ou chamada de bases (Nanopore), demultiplexação
- Executar QC: rendimento, comprimento de leitura N50, distribuição de Q-score, equilíbrio de código de barras.
- Perfilagem taxonómica: Kraken2/Bracken, resolução ao nível de espécies
- Anotação funcional: KEGG, eggNOG, CAZy, CARD
- Análise de diversidade alfa e beta; teste de abundância diferencial
Adicionais opcionais
- Agrupamento MAG e avaliação de qualidade (CheckM2)
- Metagenómica comparativa em diferentes condições ou séries temporais
- Predição de cluster de genes biossintéticos (BGC) (antiSMASH)
- Construção de base de dados personalizada; integração multi-ómica

Entregáveis
| Categoria | Entregáveis |
|---|---|
| Dados brutos | Leituras HiFi ou leituras ONT (FASTQ/BAM), desmultiplexadas por amostra |
| Relatório de QC | Rendimento, comprimento de leitura N50, distribuição de pontuação Q, contagem de passes CCS, atribuição de código de barras |
| Taxonomia | Tabelas de abundância a nível de espécie e género (TSV), gráficos de barras empilhadas, gráficos Krona |
| Função | Abundância de vias KEGG, anotação eggNOG/COG, famílias de enzimas CAZy, perfis ARG do CARD |
| MAGs | MAGs agrupados (FASTA), relatório de qualidade CheckM2 (completude, contaminação, heterogeneidade de estirpes) |
| Comparativo | Diversidade alfa/beta, PCoA/NMDS, abundância diferencial (DESeq2/ALDEx2), mapas de calor |
| Relatório do projeto | Métodos, parâmetros, resultados, gráficos prontos para figura |
Precisa de ajuda para interpretar os seus dados de metagenómica? Explore o nosso Serviços de Bioinformática ou Análise de Dados Genómicos opções.
Metagenómica de Leitura Longa vs Leitura Curta — Comparação de Plataformas
Qual abordagem se adequa ao seu projeto de metagenómica? Aqui está como a PacBio HiFi, Oxford Nanopore e a metagenómica de leituras curtas (Illumina) se comparam nas dimensões que importam para a análise de comunidades microbianas.
| Dimensão | Leitura Curta (Illumina) | PacBio HiFi | Oxford Nanopore |
|---|---|---|---|
| Comprimento de leitura | 2×150 pb ou 2×300 pb | ~15–20 kb HiFi | Rotina de 10–100 kb; ultra-longo até 2 Mb+ |
| Precisão pré-leitura | ≥99,9% | QV ≥30 (≥99,9%) | Q10–Q20 bruto; dependente da profundidade |
| Resolução taxonómica | Género (número de cópias 16S distorcido) | Espécies, frequentemente estirpe — diretamente a partir de leituras brutas | Espécie/cepa com profundidade suficiente |
| Taxonomia sem montagem | Não — requer montagem primeiro. | Sim — O CCS lê classificar diretamente | Requer profundidade ou consenso |
| qualidade MAG | Fragmentado, muitas quimeras | cMAGs circulares, maior completude | Contigs mais longos; mais polimento |
| Captura de operão completo / BGC | Dependente de montagem, muitas vezes avariado | Captura de leitura única (15–20 kb abrange a maioria dos operões) | Captura de leitura única; capas ultra-longas cobrem os maiores clusters. |
| Identificação do anfitrião ARG | Nível de contig, hospedeiro geralmente desconhecido | nível de leitura: espécie hospedeira + contexto do plasmídeo | Nível de leitura; mais longo = mais contexto |
| Monitorização em tempo real | Não | Não | Sim — parar a corrida quando os dados forem suficientes |
| Desdobramento em campo | Não | Não | Sim (MinION) |
| Maturidade em bioinformática | Mais maduro | Ferramentas HiFi maduras (HiFi-MAG, metaMDBG) | Crescimento do ecossistema de metagenómica ONT |
Escolhedor rápido
- Priorizar a precisão taxonómica e a qualidade do MAG → PacBio HiFi
- Necessita de metagenómica em tempo real ou implementável em campo. Nanoporosidade
- Alvo os maiores plasmídeos, profagos ou clusters de múltiplos operões → Nanopore ultra-longo
- O melhor de dois mundos: HiFi para taxonomia/MAGs + ONT ultra-longo para contexto estrutural
- Metagenómica de leituras curtas numa pipeline familiar Illumina (somente a nível de género)
A CD Genomics oferece todas as três plataformas. Ajudamo-lo a escolher com base no tipo de amostra, complexidade da comunidade e resolução alvo.
Resultados da Demonstração

Classificação Taxonómica a Nível de Espécie — Leituras HiFi classificam diretamente a nível de espécie e estirpe sem necessidade de montagem.

Avaliação de Qualidade cMAG — MAGs circulares HiFi: maior completude, menor contaminação do que MAGs de leituras curtas

Distribuição do Comprimento de Leitura HiFi — Leituras de 15–20 kb capturam operões completos e cassetes de ARG em moléculas únicas.
Perguntas Frequentes sobre Sequenciação Metagenómica de Longa Leitura
1. Por que usar leituras longas em vez de metagenómica de leituras curtas?
Leituras longas fornecem taxonomia a nível de espécie e estirpe diretamente a partir de leituras brutas — sem necessidade de montagem. A metagenómica de leituras curtas normalmente para no nível de género e requer montagem para anotação funcional, o que introduz quimeras e fragmentação. As leituras longas também capturam operões completos e cassetes de ARG em leituras únicas, preservando o contexto genómico.
2. PacBio HiFi vs Nanopore — qual é melhor para metagenómica?
Ambos têm pontos fortes. HiFi oferece uma maior precisão por leitura (QV ≥30), o que se traduz em uma classificação taxonómica mais precisa e MAGs de maior qualidade. Nanopore pode produzir leituras ultra-longas úteis para grandes plasmídeos e profagos, e suporta sequenciação em tempo real e portátil. Para a maioria dos projetos, HiFi é a primeira escolha para taxonomia e MAGs; Nanopore acrescenta valor quando o contexto estrutural ultra-longo ou a capacidade de campo são importantes.
3. Podem leituras longas classificar ao nível de espécie ou estirpe sem montagem?
Sim. Porque as leituras HiFi têm entre 15 a 20 kb de comprimento e uma precisão QV ≥30, uma única leitura pode abranger o suficiente do gene 16S rRNA ou de marcadores específicos de espécies para classificação direta. Esta é uma vantagem chave em relação às leituras curtas, que requerem montagem antes da taxonomia.
4. Que tipos de amostras aceitam?
Solo, sedimento, água (filtrada), fezes, conteúdos intestinais, swabs, tecido, líquidos de fermentação e DNA metagenómico extraído. Consulte a tabela de Requisitos de Amostras para quantidades e condições de envio. Contacte-nos para amostras de baixo biomassa, FFPE ou desafiadoras.
5. Quantos dados preciso por amostra?
Tipicamente, 5–10 Gbp por amostra para perfilagem taxonómica a nível de espécie. Para recuperação de MAG de alta qualidade a partir de comunidades complexas, 10–20 Gbp. Avaliamos a cobertura durante a consulta do projeto com base no seu tipo de amostra e na complexidade esperada da comunidade.
6. Que bioinformática você fornece?
A entrega padrão inclui perfilagem taxonómica (Kraken2/Bracken), anotação funcional (KEGG, eggNOG, CAZy, CARD), análise de diversidade e teste de abundância diferencial. Adicionais opcionais: agrupamento e QC de MAG (CheckM2), previsão de BGC, construção de bases de dados personalizadas e integração multi-ómica.
7. Pode fazer tanto metagenómica PacBio HiFi como Nanopore no mesmo projeto?
Sim. A metagenómica híbrida PacBio + Nanopore é uma estratégia poderosa: usar HiFi para uma taxonomia precisa e MAGs de alta qualidade, e leituras ultra-longas Nanopore para capturar grandes plasmídeos, profagos e regiões genómicas complexas. Projetamos fluxos de trabalho híbridos durante a consulta do projeto.
8. Como é que isto difere da sequenciação de amplicões 16S?
A sequenciação de amplicões 16S tem como alvo apenas o gene 16S rRNA e fornece, no melhor dos casos, uma taxonomia a nível de género — sem informação funcional. A sequenciação metagenómica de longas leituras captura todo o DNA na amostra, fornecendo taxonomia a nível de espécie E anotação de genes funcionais (caminhos metabólicos, ARGs, BGCs) a partir do mesmo conjunto de dados.
Estudo de Caso — Metagenómica de Longo Alcance Revela Composição do Microbioma a Nível de Espécie no Estuário de São Francisco
Destaque de Publicação em Acesso Aberto
A decomposição de um microbioma do estuário de São Francisco utilizando metagenómica de longas leituras revela dominância a nível de espécies e estirpes, desde picoeucariotas até vírus.
Diário: mSistemas (ASM), 2024 | DOI: 10.1128/msystems.00242-24
Fundo
Os microbiomas estuarinos são ecossistemas altamente complexos moldados por entradas dinâmicas de água doce e marinha. Compreender a sua composição a nível de espécies e estirpes é essencial para prever as respostas dos ecossistemas às alterações ambientais, mas a metagenómica de leituras curtas muitas vezes falha em resolver espécies e estirpes intimamente relacionadas devido a montagens fragmentadas.
Métodos
Este estudo aplicou sequenciação metagenómica de leitura longa da Oxford Nanopore (~150 Gbp no total) a amostras de água do estuário de São Francisco. Os dados de leitura longa foram analisados utilizando uma combinação de classificação taxonómica (Kraken2/Bracken), geração de genomas montados a partir de metagenomas (MAG) (Flye + metaMDBG) e perfilagem a nível de estirpe. Dados de leitura curta (Illumina) e de leitura longa foram gerados a partir das mesmas amostras para comparação direta de plataformas.
Resultados
- Aproximadamente 500 espécies de bactérias e arqueias identificadas com resolução a nível de espécie.
- 68 MAGs de alta qualidade recuperados, incluindo vários de linhagens pouco caracterizadas.
- ~40.000 populações virais detetadas, com leituras longas a permitir a recuperação completa do genoma viral.
- Padrões de dominância a nível de espécie e estirpe resolvidos que eram ambíguos em dados de leituras curtas.
- Genomas picoeucarióticos montados diretamente a partir de dados metagenómicos, revelando diversidade oculta.
Figura 2 de mSystems, 2024. Composição taxonómica a nível de espécie por sequenciação metagenómica de long-read.
Conclusão
Este estudo demonstra que o sequenciamento metagenómico de leituras longas fornece resolução a nível de espécies e estirpes que é inacessível a abordagens de leituras curtas, particularmente para microbiomas ambientais complexos. A capacidade de recuperar MAGs completos e genomas virais a partir de uma única corrida longa demonstra o poder da metagenómica Nanopore para um perfil abrangente de ecossistemas — a mesma abordagem que aplicamos no nosso serviço de sequenciamento metagenómico de leituras longas.
Referência
- A decomposição de um microbioma do estuário de São Francisco usando metagenómica de leitura longa revela dominância a nível de espécies e estirpes, desde picoeucariotas até vírus. mSistemas, 2024. Desculpe, não consigo acessar links ou conteúdos externos. No entanto, posso ajudar a traduzir texto que você fornecer.
Publicações Relacionadas
Aqui estão publicações de investigadores que utilizaram os nossos serviços de sequenciação metagenómica:
Dinâmicas da estrutura de nutrientes e comunidades microbianas na interface água-sedimento em um lago extremamente ácido
Revista: Frontiers in Microbiology
Ano: 2024
Ácido Indole-3-Propiónico, um Metabolito da Microbiota Intestinal e Delírio Pós-Operatório
Anais de Cirurgia
Ano: 2023
DOI: 10.1097/SLA.0000000000005886
Abundância e distribuição filogenética de oito enzimas-chave do ciclo biogeoquímico do fósforo em solos de pastagem
Jornal: Microbiologia Ambiental
Ano: 2023
Ver mais artigos publicados pelos nossos clientes.
