Why should I choose bacterial WGS over 16S rRNA sequencing?

16S rRNA sequencing identifies which bacterial species are present in a sample. WGS reveals the complete gene content of a specific isolate: antimicrobial resistance genes, virulence factors, metabolic pathways, plasmids, prophages, and SNPs. If the question is 'what species is this?', 16S is appropriate and costs $5-15. If the question is 'what can this bacterium do, and how does it differ from related strains?', WGS is required and costs $100-500.

What is the difference between a draft genome and a complete genome?

A draft genome (short-read-only assembly) consists of 20-100 contigs with an N50 of 100-500 kb. Gene content is >97% complete but the genome is fragmented at repeats. A complete genome (hybrid assembly) consists of 1-4 circularized contigs with zero gaps, representing the chromosome and individual plasmids. Complete genomes are required for plasmid analysis, repeat structure characterization, and publication-quality reference genomes.

How much DNA do I need for bacterial WGS?

For Illumina short-read sequencing: ≥200 ng at ≥10 ng/µL. For PacBio HiFi: ≥5 µg of HMW DNA with fragments ≥20 kb. For Oxford Nanopore: ≥1-5 µg of HMW DNA with fragments ≥20 kb. DNA can be extracted from bacterial cell pellets or liquid culture; both are accepted by CD Genomics. Phenol-chloroform extraction is preferred for long-read sequencing to preserve fragment length.

Can bacterial WGS identify antimicrobial resistance genes?

Yes. WGS detects antimicrobial resistance genes using curated databases — CARD (Comprehensive Antibiotic Resistance Database) and ResFinder — that classify genes by resistance mechanism, drug class, and evidence level. The analysis distinguishes between plasmid-borne and chromosomally encoded resistance genes, which is critical for assessing horizontal transfer risk. CD Genomics offers dedicated ARG Antibiotic Resistance Gene Analysis for comprehensive resistance profiling.

How do I choose between Illumina-only and hybrid assembly for my bacterial genome?

If the goal is gene content analysis, species identification, or AMR screening, Illumina-only assembly at 100-200× ($100-200) is sufficient. If the goal is a complete, publication-quality reference genome with resolved plasmids, or if the genome contains large repeats, hybrid assembly with long reads ($300-800) is required. For projects involving plasmid biology, conjugation studies, or regulatory submissions, hybrid assembly is strongly recommended.

What is the turnaround time for bacterial WGS?

Standard turnaround is 20-30 working days for short-read-only de novo assembly and 30-45 working days for hybrid assembly. Re-sequencing projects with variant calling are typically 15-25 working days. Batch projects with 10-100 isolates may extend to 45-60 working days depending on scale.

What bioinformatic deliverables do I receive?

Standard deliverables: raw sequencing data (FASTQ), quality control report (FastQC, MultiQC), assembled genome (FASTA), and gene annotation (GFF/GBK via Prokka). For re-sequencing: aligned reads (BAM), variant calls (VCF) with SnpEff annotation. Optional add-ons: AMR gene detection (CARD, ResFinder), virulence factor annotation (VFDB), plasmid reconstruction, prophage prediction, CRISPR array detection, and comparative genomics (pan-genome, phylogeny).

How does bacterial WGS cost compare to 16S sequencing for large isolate collections?

A single 16S Sanger sequence costs $5-15. A single bacterial WGS costs $100-500. For 100 isolates, 16S costs $500-1,500 while WGS costs $10,000-30,000. The decision depends on the information required: if taxonomy alone is sufficient, 16S is far more economical. If gene content, AMR profiles, and SNP-level resolution are needed, WGS provides information that 16S cannot deliver at any price.

Sequenciação do Genoma Completo de Bactérias: Montagem De Novo, Re-Sequenciação e Detecção de Mutação para Pesquisa Microbiana

Por que o genoma completo, e não apenas o 16S?

O gene 16S rRNA tem sido o pilar da taxonomia microbiana durante quatro décadas, e por boas razões: está universalmente presente em bactérias, contém tanto locais de ligação de primers conservados como regiões hipervariáveis, e beneficia de enormes bases de dados curadas (SILVA, Greengenes, GTDB). Uma sequência Sanger de 16S pode colocar um isolado desconhecido no gênero correto e, muitas vezes, na espécie correta, a um custo de 5 a 15 dólares por amostra.

Mas o 16S tem pontos cegos fundamentais que o WGS preenche. Primeiro, o 16S não fornece nenhuma informação sobre o conteúdo de genes funcionais — uma sequência de 16S diz-lhe a taxonomia, mas nada sobre se o organismo produz uma toxina, degrada um poluente ou transporta um gene de resistência a antibióticos. Em segundo lugar, a resolução do 16S atinge um platô ao nível da espécie; estirpes dentro de uma espécie podem partilhar sequências de 16S idênticas enquanto diferem por centenas de genes nos seus genomas acessórios. Em terceiro lugar, os plasmídeos, que são os principais veículos de transferência horizontal de genes e disseminação de resistência a antimicrobianos, são completamente invisíveis para o sequenciamento de 16S.

Uma comparação concreta ilustra a assimetria de informação. Uma sequência de rRNA 16S de um isolado de Escherichia coli de uma investigação de surto hospitalar identifica-o como E. coli com 99,8% de confiança e leva de 2 a 3 dias. Uma sequenciação do genoma completo (WGS) da mesma amostra com 100× de cobertura identifica o serotipo (O157:H7), deteta 14 genes de resistência antimicrobiana em 2 plasmídeos e no cromossoma, reconstrói as sequências completas dos plasmídeos, identifica 6 regiões de profagos e cataloga 47 fatores de virulência — tudo a partir de uma única corrida de sequenciação que custa entre 100 a 500 dólares. Para investigações de surtos, a WGS fornece a resolução a nível de SNP necessária para distinguir estirpes de surtos de casos esporádicos de fundo, permitindo a reconstrução da cadeia de transmissão que o 16S simplesmente não consegue suportar.

Para uma visão estratégica mais ampla de como o WGS bacteriano se encaixa na paisagem mais ampla do WGS — incluindo de novo em plantas/animais, re-sequenciamento populacional e decisões de baixa cobertura vs alta cobertura — consulte o nosso Hub de Serviços de Sequenciação do Genoma Completo.

Montagem De Novo — Construindo Genomas do Zero

A montagem de novo reconstrói um genoma bacteriano a partir de leituras de sequenciamento sobrepostas sem um modelo de referência. Esta é a abordagem necessária para isolados novos, estirpes ambientais e qualquer organismo que não possua um genoma de referência de alta qualidade. A qualidade da montagem resultante — medida pelo N50 de contigs, número de contigs, maior contig e completude BUSCO — depende fortemente da combinação de tecnologias de sequenciamento.

Montagem de Leituras Curtas: Alta Precisão, Genomas Incompletos

O sequenciamento de leitura curta da Illumina (2×150 bp ou 2×250 bp) com uma cobertura de 100-200× produz as leituras brutas mais precisas, com taxas de erro abaixo de 0,1% e pontuações Q30 que frequentemente excedem 90% das bases. O pipeline padrão de montagem de novo — SPAdes ou MEGAHIT → avaliação de qualidade QUAST → anotação Prokka — gera um genoma rascunho consistindo de 20-100 contigs, com um N50 de contig tipicamente na faixa de 100-500 kb. Para muitas aplicações, isso é suficiente: a predição de genes captura >97% das sequências codificantes, e as pontuações de completude BUSCO frequentemente excedem 95%. Um genoma bacteriano apenas de leitura curta custa entre $100-200 e pode ser entregue em 20-30 dias úteis.

A limitação é estrutural. Os genomas bacterianos contêm elementos repetitivos — operões de rRNA (5-7 kb), sequências de inserção (0,7-2 kb), transposões e regiões de profago — que excedem o tamanho de inserção de 300-500 bp de uma biblioteca de extremidades pareadas. Quando o montador encontra uma repetição mais longa do que o tamanho da inserção, não consegue determinar quantas cópias existem ou como estão organizadas, e a montagem se fragmenta. O resultado é um genoma representado como um conjunto de contigs em vez de um cromossoma circular completo. Os plasmídeos, que compartilham elementos repetitivos (sequências de inserção, transposões) com o cromossoma, são particularmente difíceis de resolver — montagens de leituras curtas frequentemente colapsam múltiplos plasmídeos em um único contig quimérico ou fragmentam um único plasmídeo em vários contigs.

Montagem Híbrida: Genomas Completos e Circularizados

A montagem híbrida combina leituras longas para continuidade estrutural com leituras curtas para precisão a nível de base. As leituras PacBio HiFi (modo CCS, 15-25 kb, ≥99,9% de precisão) ou as leituras Oxford Nanopore (química R10.4.1, 50-100+ kb, >99% de precisão modal com a chamada de base super precisa Dorado) abrangem os elementos repetitivos que fragmentam as montagens de leituras curtas. As leituras longas são montadas em 1-4 contigs — tipicamente um por cromossoma mais um por plasmídeo grande — e as leituras curtas são usadas para polir erros residuais de indel em sequências homopoliméricas.

O padrão ouro atual para a montagem híbrida de bactérias é o Unicycler, que constrói um gráfico de montagem SPAdes a partir de leituras de Illumina e depois utiliza leituras longas para unir repetições, produzindo um genoma circularizado completo com zero bases ambíguas. Um fluxo de trabalho alternativo monta primeiro as leituras longas com Flye (ONT) ou Hifiasm (HiFi), depois polido com Medaka (ONT) ou gcpp (PacBio), seguido por um passo final de polimento com Illumina usando Pilon ou Polypolish. Benchmarkings recentes demonstraram que montagens apenas com ONT, utilizando a química R10.4.1 e polimento com Autocycler + Medaka, podem produzir resultados comparáveis às montagens híbridas, com zero SNPs medianos e zero indels medianos em relação a genomas de referência curados — uma mudança de paradigma que sugere que, para muitos genomas bacterianos, a montagem híbrida pode já não ser obrigatória quando são utilizadas as mais recentes químicas ONT e algoritmos de chamada de bases (Wick e Holt, 2021).

A CD Genomics realiza a montagem híbrida de bactérias através do seu serviço de Genómica Microbiana com Sequenciação de Longa Leitura e Sequenciação de Genoma Completo de Microorganismos De Novo serviço. Recomendações de cobertura: ≥50× para Illumina, ≥100× para PacBio HiFi e ≥100× para Oxford Nanopore. O tempo de resposta é de 30 a 45 dias úteis para montagens híbridas.

A qualidade da montagem é avaliada com três métricas padrão: QUAST para estatísticas de contiguidade (N50, L50, maior contig, tamanho total da montagem em comparação com o tamanho do genoma esperado), BUSCO para completude a nível de gene em relação a um conjunto específico de linhagem de ortólogos conservados de cópia única, e CheckM2 para estimativa de completude e contaminação do genoma. Uma montagem híbrida de qualidade de publicação deve alcançar >99% de completude BUSCO, <2% de contaminação e ≤4 contigs para uma bactéria típica de cromossoma único com 1-3 plasmídeos.

Numa avaliação abrangente de 7.280 montagens de genomas bacterianos submetidas ao NCBI, Wick e Holt (2021) demonstraram que as montagens híbridas alcançaram um N50 mediano de 5,1 Mb (cromossomos essencialmente completos) com uma mediana de 2 contigs, em comparação com um N50 mediano de 198 kb e uma mediana de 48 contigs para montagens apenas de leituras curtas — uma melhoria de 25 vezes na continuidade ao adicionar leituras longas. Para genomas com alto conteúdo de GC (>65%), como espécies de Streptomyces e Mycobacterium, a montagem híbrida também resolveu regiões repetitivas ricas em GC que permaneceram fragmentadas nas montagens apenas de leituras curtas. Um estudo de benchmarking de 2024 de 20 isolados bacterianos abrangendo 5 filos descobriu que a montagem híbrida com Unicycler recuperou uma mediana de 3 plasmídeos completos por genoma (variando de 0 a 8), enquanto a montagem SPAdes apenas com Illumina recuperou uma mediana de 0 plasmídeos completos — sublinhando o impacto funcional da estratégia de montagem nas análises de biologia de plasmídeos e epidemiologia de AMR a montante.

Bacterial WGS Assembly Quality Tiers: three-column comparison of Draft, Near-Complete, and Complete assembly outcomes with N50, BUSCO, cost, and recommended applications. Figura 1: Níveis de Qualidade da Montagem de WGS Bacteriano — Uma comparação em três colunas de Montagem em Rascunho (apenas Illumina, ~60 contigs, N50 ~200 kb, BUSCO ~97%, $100-200), Quase Completa (Híbrida, 1-4 contigs, N50 ~4 Mb, BUSCO ~99.5%, $300-500) e Completa (Multi-Plataforma, 1 cromossoma circular + plasmídeos resolvidos, N50 = tamanho do genoma, BUSCO 100%, $500-800), com tempo de resposta e aplicações recomendadas para cada nível.

Enquanto os genomas bacterianos são compactos (3-7 Mb) e suscetíveis a uma montagem completa com as tecnologias atuais, os genomas eucariotos apresentam uma complexidade de uma ordem diferente de magnitude. Para sequenciação de novo de genomas de plantas e animais — que variam de 100 Mb a >10 Gb com paisagens de repetição complexas e genomas poliploides — consulte o nosso Sequenciação de Genomas de Plantas e Animais de Novo.

Re-sequenciação e Chamada de Variantes

Quando existe um genoma de referência de alta qualidade para a espécie, a abordagem analítica passa de montagem de novo para re-sequenciamento guiado por referência. As leituras são alinhadas à referência com BWA-MEM ou Minimap2, e as variantes — polimorfismos de nucleotídeo único (SNPs), pequenas inserções/deleções (indels) e variantes estruturais maiores — são chamadas com bcftools, GATK ou DeepVariant. Este fluxo de trabalho é mais rápido, mais barato e mais sensível a pequenas variantes do que a montagem de novo, tornando-se o método preferido para genómica comparativa, rastreamento de surtos e identificação de mutações.

Estudo de Caso: Redescobrindo Mutações Clássicas em Neurospora crassa

O poder do WGS para a deteção de mutações é elegantemente demonstrado por McCluskey et al. (2011), que sequenciaram dois clássicos Neurospora crassa cepas mutantes cujos fenótipos eram conhecidos há décadas, mas cujas mutações causadoras nunca tinham sido identificadas a nível molecular. O mutante qa-X, isolado na década de 1970, não consegue crescer em ácido quínico como única fonte de carbono — um fenótipo mapeado há décadas para o grupo de ligação VII, mas nunca resolvido para um gene específico. O sequenciamento do genoma completo com cobertura de 25× identificou um polimorfismo de nucleotídeo único no gene qa-1F (NCU06028) que introduziu um códon de paragem prematuro, truncando a proteína ativadora da transcrição necessária para a expressão do cluster de catabolismo do ácido quínico. Todo o projeto — desde a extração de DNA até à mutação validada — foi concluído em menos de quatro semanas a um custo de sequenciamento de aproximadamente $1,000 em dólares de 2011; hoje, o experimento equivalente custa menos de $300 e pode ser concluído em duas semanas.

O fluxo de trabalho analítico para a deteção de mutações segue uma lógica subtrativa. As leituras da estirpe mutante são alinhadas ao genoma de referência do tipo selvagem, as variantes são identificadas e filtradas (removendo aquelas partilhadas com a estirpe parental do tipo selvagem ou presentes em bases de dados de polimorfismos a nível populacional), e as variantes candidatas restantes são anotadas quanto ao impacto funcional. Um SNP não sinónimo ou uma indel de mudança de quadro em um gene funcionalmente ligado ao fenótipo mutante é o principal candidato. O sequenciamento de Sanger do locus candidato confirma a variante, e a complementação — reintroduzindo o alelo do tipo selvagem no fundo mutante e observando a restauração do fenótipo — fornece uma validação causal definitiva.

Para triagens de mutagénese, validação de edição do genoma CRISPR-Cas9 e estudos de evolução experimental, o re-sequenciamento a 50-100× fornece a sensibilidade de deteção de variantes necessária para identificar mutações únicas contra um fundo de mutações espontâneas acumuladas durante o manuseio de estirpes. O pipeline bioinformático — alinhamento BWA-MEM → chamada de variantes GATK HaplotypeCaller → anotação funcional SnpEff — é maduro, bem documentado e fornece rotineiramente >99,9% de sensibilidade para SNPs homozigóticos com cobertura ≥30×. Para projetos de re-sequenciamento em grande escala em múltiplos isolados — como investigações de surtos, coleções de estirpes ou painéis de evolução experimental — consulte o nosso Sequenciação do Genoma Completo serviços para opções de processamento em lote e análise genómica comparativa.

Variant Detection Pipeline for Microbial Re-Sequencing: 6-step horizontal workflow from Raw FASTQ to Candidate Validation. Figura 2: Pipeline de Detecção de Variantes para Re-Sequenciamento Microbiano — Um diagrama de fluxo horizontal em 6 etapas: (1) Leituras FASTQ Brutas → (2) Controlo de Qualidade (FastQC, MultiQC) → (3) Alinhamento de Leituras ao Genoma de Referência (BWA-MEM / Minimap2) → (4) Chamada de Variantes (GATK HaplotypeCaller / DeepVariant / bcftools mpileup) → (5) Filtragem de Variantes & Anotação Funcional (SnpEff) → (6) Validação de Candidatos (sequenciação Sanger + ensaio de complementação). Cada etapa inclui o nome da ferramenta chave e uma descrição em uma linha do seu papel no pipeline.

Reconstrução de Plasmídeos e Elementos Móveis

Os plasmídeos são os principais veículos de transferência horizontal de genes em bactérias, transportando genes de resistência a antimicrobianos, fatores de virulência e capacidades metabólicas entre estirpes e espécies. Uma sequência genómica completa de uma bactéria deve reconstruir as sequências dos plasmídeos separadamente do cromossoma para avaliar o potencial de mobilidade dos genes que transportam — um gene de resistência num plasmídeo conjugativo representa um risco fundamentalmente diferente para a saúde pública do que o mesmo gene codificado cromossomicamente.

A montagem de leituras curtas apenas enfrenta dificuldades na reconstrução de plasmídeos pela mesma razão que enfrenta com repetições cromossómicas: os plasmídeos partilham elementos móveis (sequências de inserção, transposões, integrões) entre si e com o cromossoma, criando emaranhados no gráfico de montagem que colapsam múltiplos replicons em contigs quiméricos. O PlasmidSPAdes, um módulo especializado do SPAdes, melhora a recuperação de plasmídeos a partir de dados de leituras curtas ao usar diferenças de cobertura entre plasmídeos e cromossomas para orientar a montagem, mas sequências plasmídicas completas e inequívocas normalmente requerem leituras longas.

A montagem híbrida com Unicycler é o atual padrão de ouro para genomas bacterianos resolvidos por plasmídeos. O Unicycler modela explicitamente o número de cópias de plasmídeos — um plasmídeo com 5 cópias tem 5× a profundidade de sequenciamento de um cromossoma de cópia única — e utiliza esta informação para separar contigs cromossômicos e de plasmídeos. A saída é um conjunto de sequências completas e circularizadas: uma por cromossoma e uma por espécie distinta de plasmídeo. Para laboratórios que monitorizam a disseminação de resistência mediada por plasmídeos através de experiências de conjugação ou transdução, sequências completas de plasmídeos permitem a identificação precisa dos elementos móveis que transportam genes de resistência e dos genes da maquinaria de conjugação que possibilitam a sua transferência.

Os serviços de WGS bacteriano da CD Genomics incluem a reconstrução de plasmídeos como um componente padrão da montagem híbrida. Para projetos especificamente focados na biologia de plasmídeos, Análise de Genes de Resistência a Antibióticos ARG fornece anotação dedicada de genes de resistência utilizando os bancos de dados CARD e ResFinder, com a localização plasmidial versus cromossómica de cada gene detetado.

A importância em saúde pública e regulamentar da reconstrução de plasmídeos está a crescer. O protocolo Tricycle da OMS para a produção de ESBL E. coli A vigilância e a Rede de Laboratórios de AR dos CDC dependem da tipagem de plasmídeos baseada em WGS para rastrear a epidemiologia dos genes de resistência. Para a microbiologia de segurança alimentar, a reconstrução de plasmídeos distingue entre eventos de contaminação — dois isolados que partilham o mesmo fundo cromossómico, mas com perfis de plasmídeos diferentes, sugerem eventos de aquisição de plasmídeos independentes em vez de transmissão clonal.

Considerações Práticas

Quantidade e Qualidade do DNA

A WGS bacteriana é relativamente tolerante em relação ao DNA de entrada comparado à WGS eucariota, mas os requisitos diferem consoante a plataforma. Para sequenciação de leituras curtas da Illumina: ≥200 ng de DNA genómico a ≥10 ng/µL, OD 260/280 de 1.8-2.0. DNA fragmentado para <10 kb é aceitável e até esperado para a preparação de bibliotecas de leituras curtas. Para PacBio HiFi: ≥5 µg de DNA de alto peso molecular com tamanhos de fragmentos ≥20 kb, OD 260/280 de 1.8-2.0. Para Oxford Nanopore: ≥1-5 µg de DNA HMW com fragmentos ≥20 kb; a química R10.4.1 tolera quantidades de entrada mais baixas do que as versões anteriores.

O método de extração de DNA é importante. Kits baseados em colunas (Qiagen DNeasy, Zymo Research) produzem DNA adequado para sequenciação de leituras curtas, mas podem fragmentar o DNA abaixo do limite de 20 kb para bibliotecas de leituras longas. Para sequenciação de leituras longas, a extração com fenol-clorofórmio ou os protocolos de lise embutidos em agarose preservam o comprimento dos fragmentos. A CD Genomics aceita tanto DNA extraído como pellets de células bacterianas, com protocolos de extração otimizados para cada tipo de amostra.

A complexidade do genoma — particularmente o conteúdo de GC e a densidade de repetições — influencia o sucesso da montagem para além da qualidade do DNA. Bactérias com alto conteúdo de GC, como Estreptómyces (72% GC), Mycobacterium tuberculosis (65% GC), e Burkholderia (67% GC) apresentam dois desafios: a queda de cobertura enviesada por GC durante a amplificação da biblioteca Illumina e uma maior densidade de repetições invertidas ricas em GC que confundem os montadores. Os kits de preparação de bibliotecas sem PCR mitigam o viés de amplificação, e as leituras longas em uma montagem híbrida abrangem essas regiões de repetições ricas em GC que fragmentam as montagens de leituras curtas. No outro extremo, genomas ricos em AT (por exemplo, Mycoplasma, 24-32% GC) apresentam os seus próprios desafios — execuções de homopolímeros de A/T são a principal fonte de erros indel tanto nas leituras PacBio como nas ONT, tornando o polimento Illumina um passo crítico para a previsão precisa de genes nestes organismos. O tamanho do genoma também varia em dois ordens de magnitude: os menores genomas bacterianos de vida livre (Mycoplasma genitalium, 0,58 Mb) são montados até à conclusão a partir de uma única célula de fluxo MinION, enquanto os maiores genomas bacterianos (Sorangium cellulosum, 14,8 Mb; Minicystis rosea, 16 Mb) requerem uma cobertura de leitura longa mais profunda e podem ainda produzir múltiplos contigs mesmo com montagem híbrida.

Isolamento Único vs Processamento em Lote

Um único isolado bacteriano sequenciado com uma cobertura de 100× custa entre 100 e 500 dólares, dependendo da combinação de tecnologias. Para projetos que envolvem múltiplos isolados — investigações de surtos, coleções de estirpes, bibliotecas de mutantes — o processamento em lote em placas de 96 poços reduz os custos de preparação de bibliotecas por amostra através da automatização. A análise bioinformática para projetos em lote escala linearmente: cada isolado é montado ou chamado de variante de forma independente, e análises comparativas (construção de pan-genoma, inferência de árvores filogenéticas, perfil de presença/ausência de genes de resistência) são realizadas em todo o conjunto. Para mais detalhes sobre como escalar WGS para coortes maiores, consulte o nosso Sequenciação do Genoma Completo página de serviço.

Entregáveis de Bioinformática

Um projeto padrão de WGS bacteriano da CD Genomics fornece dados de sequenciamento brutos (FASTQ), um relatório de controlo de qualidade (FastQC, MultiQC) e saídas específicas de análise. Para montagem de novo: genoma montado em formato FASTA, anotação de genes em GFF/GBK (via Prokka), anotação funcional contra as bases de dados NR, GO, KEGG, COG, SwissProt, Pfam e CAZy. Para re-sequenciamento: leituras alinhadas (BAM), chamadas de variantes (VCF) com anotação funcional SnpEff. Análises especializadas — deteção de genes de resistência antimicrobiana via CARD e ResFinder, anotação de fatores de virulência via VFDB, reconstrução de plasmídeos, previsão de profagos, deteção de arranjos CRISPR e análise de pan-genoma — estão disponíveis como complementos. Para projetos que requerem pipelines de bioinformática personalizados adaptados a questões de pesquisa específicas, a nossa Sequenciação do Genoma Completo de Bactérias o serviço inclui consulta sobre o design de análise e entregáveis. Todos os dados são entregues através de download seguro, com envio de disco rígido para conjuntos de dados grandes.

Bacterial WGS Decision Tree: branching workflow from Single Bacterial Isolate to De Novo Assembly or Re-Sequencing paths. Figura 3: Árvore de Decisão para WGS Bacteriano — Um fluxograma que parte de "Isolado Bacteriano Único" ramificando-se em dois caminhos. Caminho A (Montagem De Novo): Sem genoma de referência → Apenas Leitura Curta (Illumina, 100-200€, 20-100 contigs, ~97% BUSCO) ou Montagem Híbrida (Illumina + PacBio/ONT, 300-800€, 1-4 contigs, 100% BUSCO com plasmídeos completos). Caminho B (Re-Sequenciamento): Existe um genoma de referência → Chamada de Variantes (BWA-MEM + GATK/DeepVariant, SNPs + indels, 50-100× cobertura, 100-300€). Anotações de saída para ambos os caminhos: Anotação Prokka, CARD/ResFinder AMR, VFDB virulência, reconstrução de plasmídeos.

Perguntas Frequentes

Por que devo escolher o WGS bacteriano em vez do sequenciamento de 16S rRNA?

A sequenciação do rRNA 16S identifica quais espécies bacterianas estão presentes numa amostra. A WGS revela o conteúdo genético completo de um isolado específico: genes de resistência a antimicrobianos, fatores de virulência, vias metabólicas, plasmídeos, profagos e SNPs. Se a pergunta for "que espécie é esta?", a análise 16S é adequada e custa entre 5 a 15 dólares. Se a pergunta for "o que pode esta bactéria fazer e como se diferencia de estirpes relacionadas?", é necessária a WGS, que custa entre 100 a 500 dólares.

Qual é a diferença entre um genoma em rascunho e um genoma completo?

Um genoma em rascunho (montagem apenas de leituras curtas) consiste em 20-100 contigs com um N50 de 100-500 kb. O conteúdo genético é >97% completo, mas o genoma está fragmentado em repetições. Um genoma completo (montagem híbrida) consiste em 1-4 contigs circularizados sem lacunas, representando o cromossomo e plasmídeos individuais. Genomas completos são necessários para a análise de plasmídeos, caracterização da estrutura de repetições e genomas de referência de qualidade para publicação.

Quanto DNA preciso para WGS bacteriano?

Para sequenciação de leitura curta da Illumina: ≥200 ng a ≥10 ng/µL. Para PacBio HiFi: ≥5 µg de DNA HMW com fragmentos ≥20 kb. Para Oxford Nanopore: ≥1-5 µg de DNA HMW com fragmentos ≥20 kb. O DNA pode ser extraído de pellets celulares bacterianos ou cultura líquida; ambos são aceites pela CD Genomics. A extração com fenol-clorofórmio é preferida para sequenciação de leitura longa para preservar o comprimento dos fragmentos.

A análise de WGS bacteriano pode identificar genes de resistência a antimicrobianos?

Sim. O WGS detecta genes de resistência antimicrobiana utilizando bases de dados curadas — CARD (Comprehensive Antibiotic Resistance Database) e ResFinder — que classificam os genes por mecanismo de resistência, classe de fármaco e nível de evidência. A análise distingue entre genes de resistência portados por plasmídeos e genes de resistência codificados no cromossoma, o que é crítico para avaliar o risco de transferência horizontal. A CD Genomics oferece serviços dedicados. Análise de Genes de Resistência a Antibióticos ARG para um perfil de resistência abrangente.

Como escolho entre a montagem apenas com Illumina e a montagem híbrida para o meu genoma bacteriano?

Se o objetivo é a análise do conteúdo genético, identificação de espécies ou triagem de AMR, a montagem apenas com Illumina a 100-200× (100-200 dólares) é suficiente. Se o objetivo é um genoma de referência completo e de qualidade para publicação, com plasmídeos resolvidos, ou se o genoma contém grandes repetições (a maioria das bactérias contém), é necessária uma montagem híbrida com leituras longas (300-800 dólares). Para projetos que envolvem biologia de plasmídeos, estudos de conjugação ou submissões regulatórias, a montagem híbrida é fortemente recomendada.

Qual é o tempo de resposta para o sequenciamento do genoma completo de bactérias?

O tempo de resposta padrão é de 20-30 dias úteis para montagem de novo apenas de leituras curtas e de 30-45 dias úteis para montagem híbrida. Projetos de re-sequenciamento com chamada de variantes normalmente levam de 15-25 dias úteis. Projetos em lote com 10-100 isolados podem estender-se a 45-60 dias úteis, dependendo da escala.

Quais são os entregáveis de bioinformática que recebo?

Entregáveis padrão: dados de sequenciação bruta (FASTQ), relatório de controlo de qualidade (FastQC, MultiQC), genoma montado (FASTA) e anotação de genes (GFF/GBK via Prokka). Para re-sequenciação: leituras alinhadas (BAM), chamadas de variantes (VCF) com anotação SnpEff. Adicionais opcionais: deteção de genes de AMR (CARD, ResFinder), anotação de fatores de virulência (VFDB), reconstrução de plasmídeos, previsão de profagos, deteção de arranjos CRISPR e genómica comparativa (pan-genoma, filogenia).

Como é que o custo do WGS bacteriano se compara ao sequenciamento de 16S para grandes colecções de isolados?

Uma única sequência 16S Sanger custa entre 5 a 15 dólares. Um único WGS bacteriano custa entre 100 a 500 dólares. Para 100 isolados, 16S custa entre 500 a 1.500 dólares, enquanto WGS custa entre 10.000 a 30.000 dólares. A decisão depende da informação necessária: se a taxonomia sozinha for suficiente, 16S é muito mais económico. Se o conteúdo genético, perfis de AMR e resolução a nível de SNP forem necessários, WGS fornece informações que 16S não pode oferecer a qualquer preço. Muitos projetos utilizam 16S para triagem inicial de grandes colecções e reservam WGS para isolados de interesse identificados pela triagem 16S.

Referências:

Wick RR, Judd LM, Gorrie CL, Holt KE. Unicycler: Resolvendo montagens de genomas bacterianos a partir de leituras de sequenciamento curtas e longas. PLoS Biologia Computacional. 2017;13(6):e1005595. doi:10.1371/journal.pcbi.1005595
Wick RR, Holt KE. Avaliação de montadores de leituras longas para sequenciação do genoma completo de procariotas. F1000Research. 2021;8:2138. doi:10.12688/f1000research.21782.4
McCluskey K, Wiest AE, Grigoriev IV, et al. Redescoberta por Sequenciação do Genoma Completo: Mutações Clássicas e Polimorfismos Genómicos em Neurospora crassa. G3: Genes|Genomas|Genética. 2011;1(4):303-316. doi:10.1534/g3.111.000307
De Coster W, Weissensteiner MH, Sedlazeck FJ. Rumo a sequenciação de long-read em escala populacional. Nature Reviews Genetics. 2021;22(9):572-587. doi:10.1038/s41576-021-00367-3
Danecek P, Bonfield JK, Liddle J, et al. Doze anos de SAMtools e BCFtools. GigaScience2021;10(2):giab008. doi:10.1093/gigascience/giab008
Parks DH, Imelfort M, Skennerton CT, Hugenholtz P, Tyson GW. CheckM: avaliando a qualidade de genomas microbianos recuperados de isolados, células únicas e metagenomas. Pesquisa Genómica. 2015;25(7):1043-1055. doi:10.1101/gr.186072.114
Tatusova T, DiCuccio M, Badretdin A, et al. Pipeline de anotação de genomas procarióticos do NCBI. Pesquisa em Ácidos Nucleicos. 2016;44(14):6614-6624. doi:10.1093/nar/gkw569
Bush SJ, Foster D, Eyre DW, et al. A diversidade genómica afeta a precisão dos pipelines de chamada de polimorfismos de nucleotídeo único bacteriano. GigaScience. 2020;9(2):giaa007. doi:10.1093/gigascience/giaa007

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.

Serviços Relacionados

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.