Serviços de Sequenciação de Amplicons para Pesquisa de Microbioma e Biodiversidade: Soluções de 16S, 18S, ITS e Codificação de DNA

Em 2025, a CD Genomics recebeu mais de 50 perguntas de investigadores de todo o mundo a perguntar sobre serviços de sequenciação microbiana baseados em ampliconsAs questões vieram de um veterinário peruano que estuda a microbiota da placa subgengival felina — o primeiro estudo desse tipo no Peru — de um ensaio clínico espanhol que investiga como o consumo diário de amendoim remodela o microbioma intestinal em 188 amostras fecais, de um microbiologista ambiental nos Estados Unidos que tenta caracterizar comunidades de bioincrustação em dois poços de água subterrânea, e de um estudante de graduação canadense que planeia um projeto de microbioma do solo para o verão com um orçamento limitado.

Estas investigações abrangem organismos, tipos de amostras e orçamentos vastamente diferentes. No entanto, cada investigador escolheu sequenciação de amplicões como o seu método primário ou exclusivo — não metagenómica de espingarda, não sequenciação de leituras longas, não metatranscriptómica. A amplificação direcionada de genes marcadores filogenéticos — 16S para bactérias e arqueias, ITS para fungos, 18S para microrganismos eucarióticos, e COI/rbcL/matK para identificação de espécies — continua a ser a abordagem que responde à maioria das questões sobre microbioma e biodiversidade com o melhor equilíbrio entre custo, rendimento, interpretabilidade e suporte de base de dados.

A sequenciação de amplicons tem sido a base da ecologia microbiana durante mais de duas décadas porque funciona em condições que derrotam outros métodos. Funciona com ADN degradado de amostras clínicas fixadas em formalina e embebidas em parafina (FFPE), onde os fragmentos de ADN têm menos de 200 pares de bases. Funciona em amostras ambientais de baixa biomassa, onde o ADN microbiano total é medido em picogramas em vez de nanogramas. Funciona com centenas de amostras em uma única corrida de sequenciação, permitindo a replicação biológica que os estudos de microbioma requerem criticamente. E funciona dentro das limitações orçamentais dos laboratórios académicos, onde uma única amostra de metagenómica shotgun pode custar tanto quanto preparar e sequenciar dez a vinte bibliotecas de amplicons.

Este guia fornece uma estrutura prática de decisão para investigadores que precisam de escolher entre as quatro principais abordagens baseadas em amplicões — Sequenciação de rRNA 16S para comunidades procariotas, sequenciação de ITS para comunidades fúngicas, sequenciação de rRNA 18S para microplâncton e Código de barras de DNA para a identificação de espécies de macro-organismos. Para cada método, abordamos quando utilizá-lo, como otimizar os parâmetros experimentais, que profundidade e estratégia de sequenciação escolher, que dados esperar e como evitar armadilhas comuns que desperdiçam amostras e orçamento. As recomendações que se seguem estão baseadas no que realmente vimos funcionar — e falhar — em projetos de investigação reais submetidos à nossa instalação de sequenciação.

Antes de Escolher: Uma Visão Geral das Quatro Abordagens de Amplicon

Todos os quatro métodos de amplicão cobertos neste guia — sequenciação de 16S rRNA, sequenciação de ITS, sequenciação de 18S rRNA e código de barras de DNA — partilham uma base técnica comum: amplificação por PCR de um gene marcador conservado a partir de DNA extraído, seguida de sequenciação em alta capacidade do pool de amplicões e atribuição bioinformática das sequências resultantes a grupos taxonómicos utilizando bases de dados de referência curadas. As diferenças entre os métodos residem nos organismos que visam, na resolução taxonómica que fornecem e nas questões de investigação que podem responder. As seções que se seguem examinam cada método em detalhe, começando pelo mais amplamente utilizado: sequenciação de 16S rRNA para perfilagem de comunidades procarióticas.

Decision tree for choosing between 16S, ITS, 18S, and DNA barcoding amplicon approaches.Figura 1: Infográfico de Árvore de Decisão — Escolhendo o Seu Marcador de Amplicon. Quatro caminhos ramificados desde o tipo de amostra e a questão de pesquisa até o marcador recomendado (16S, ITS, 18S, COI/rbcL), codificados por cores de acordo com o método.

Sequenciação de 16S rRNA — O Padrão Ouro para Perfilagem de Comunidades Procarióticas

A Arquitetura do Gene 16S rRNA e Por Que É Importante

O gene do RNA ribossómico 16S tem aproximadamente 1.500 pares de bases de comprimento e contém uma alternância bem caracterizada entre regiões conservadas e hipervariáveis. As nove regiões hipervariáveis — V1 a V9 — são flanqueadas por trechos de sequência altamente conservada que servem como locais de ligação para primers universais de PCR que visam tanto bactérias como arqueias. Este design estrutural permite a amplificação de essencialmente qualquer procarioto com um único par de primers, enquanto as regiões variáveis codificam um sinal filogenético suficiente para atribuir taxonomia desde o filo até ao género, e frequentemente até ao nível de espécie com sequenciação de comprimento total.

A decisão chave no design de amplicões 16S é qual região hipervariável ou combinação de regiões escolher para almejar. Esta escolha tem profundas consequências para a resolução taxonómica que você alcança, os enviesamentos de amplificação que introduz e a comparabilidade dos seus dados com estudos publicados.

V3–V4: O Padrão Padrão para a Maioria das Aplicações

A região V3–V4 é o alvo mais amplamente utilizado na investigação do microbioma humano e animal. Tanto o Projeto do Microbioma Humano (HMP) como o Projeto do Microbioma da Terra (EMP) padronizaram-se na V3–V4, gerando o maior conjunto de dados 16S disponíveis publicamente para comparação entre estudos. Os primers padrão (341F e 805R) produzem amplicões de ~460 bp, bem dentro da química de 300 bp de extremidade pareada da Illumina para sobreposição total e fusão de alta confiança. A V3–V4 oferece uma excelente cobertura de bactérias e arqueias — capturando Firmicutes, Bacteroidetes, Actinobacteria, Proteobacteria e Verrucomicrobia com viés mínimo — e apresenta um desempenho consistente em tipos de amostras fecais, de solo, de água, de sedimentos e clínicas. A resolução taxonómica é tipicamente ao nível do género, com a atribuição ao nível da espécie possível para táxons bem caracterizados dentro de bases de dados de referência robustas.

V4–V5: Melhor Resolução para Certos Taxas Ambientais

A região V4–V5 (primers 515F/926R, ~410 bp) proporciona uma melhor cobertura de Thaumarchaeota, tornando-se uma escolha preferida em estudos de solo e marinhos onde os arqueus oxidantes de amónia desempenham papéis ecológicos críticos. No entanto, a V4–V5 pode subrepresentar Firmicutes em comparação com a V3–V4, pelo que não é recomendada para estudos do microbioma intestinal, a menos que grupos arqueus específicos sejam o principal alvo da pesquisa.

Sequenciação Completa de 16S: A Revolução ao Nível das Espécies

A adoção da sequenciação de consenso circular PacBio (CCS) e das tecnologias Oxford Nanopore para a análise completa do 16S representa o avanço metodológico mais significativo na sequenciação de amplicões nos últimos anos. Ao sequenciar o gene 16S completo de ~1.500 pb numa única leitura, sequenciamento completo de 16S alcança resolução taxonómica a nível de espécie e, por vezes, a nível de estirpe, resolvendo ambiguidades inerentes ao sequenciamento de uma única região. Duas espécies bacterianas indistinguíveis em V3–V4 muitas vezes diferem em V1–V2 ou V6–V8 — o sequenciamento de comprimento completo captura toda esta variação. O Banco de Dados de Taxonomia Genómica (GTDB), agora a referência padrão para a taxonomia procariótica, é baseado em dados de 16S de comprimento completo e a nível de genoma, o que significa que o sequenciamento de amplicões de comprimento completo se alinha diretamente com a estrutura taxonómica mais atual.

Uma equipa de investigação marinha que estuda a sobrevivência das larvas de vieira (Argopecten purpuratus) na aquicultura chilena precisava de determinar se os juvenis criados em viveiro que sofrem mortalidade em massa durante a transferência para a zona de ressurgência da Corrente de Humboldt carecem de táxons microbianos específicos que conferem tolerância ao stress ambiental. O sequenciamento padrão V3–V4 distinguiu apenas os géneros dominantes. O sequenciamento completo PacBio CCS revelou as diferenças a nível de espécie que distinguiam os grupos sobreviventes dos não sobreviventes — informação que não poderia ter sido obtida com o sequenciamento de amplicões de leitura curta.

O compromisso com o 16S de comprimento completo é a taxa de transferência e o custo por amostra: o sequenciamento PacBio HiFi custa duas a três vezes mais por amostra do que o Illumina para uma profundidade de sequenciamento equivalente. No entanto, cada leitura de comprimento completo fornece a informação filogenética de todas as nove regiões hipervariáveis simultaneamente, com ligação completa entre elas, muitas vezes eliminando a necessidade de múltiplos ensaios específicos para cada região. Para projetos onde a atribuição taxonómica a nível de espécie é o objetivo principal, o custo por amostra do 16S de comprimento completo é justificado pela evitação da ambiguidade taxonómica.

Requisitos de Profundidade de Sequenciação: Quantas Leituras Você Realmente Precisa?

"Quantas leituras por amostra preciso?" é a pergunta mais comum que recebemos de investigadores que estão a planear um projeto de amplicão 16S. A resposta depende do tipo de amostra, nível de biomassa, questão de investigação e tolerância a táxons raros não detectados. Não há uma resposta única que sirva para todos, mas desenvolvemos diretrizes baseadas em evidências a partir da nossa experiência em projetos e da literatura publicada.

Amostras de alta biomassa (fezes, solo, sedimento, biofilme)Para a caracterização padrão da composição da comunidade e comparação entre grupos de métricas de diversidade, 50.000 leituras de extremidade emparelhada por amostra é geralmente suficiente. As curvas de rarefação para a maioria dos microbiomas humanos e ambientais aproximam-se da sua assíntota entre 10.000 e 30.000 leituras. Aumentar a profundidade para além de 100.000 leituras por amostra produz retornos decrescentes — você detecta OTUs cada vez mais raras, mas a importância biológica desses táxons ultra-raros em análises a nível de comunidade é frequentemente questionável. Um ensaio clínico de microbioma fecal com 188 amostras, como o RCT de consumo de amendoim na Espanha, gera dados robustos prontos para publicação com 50.000 leituras por amostra. Nossa Sequenciação do Genoma Completo Microbiano o serviço pode complementar os dados de 16S para projetos que requerem insights metagenómicos funcionais.

Amostras de baixa biomassa (água, swabs, tecido de biópsia, filtros de ar)estes amostras requerem entre 100.000 a 300.000 leituras por amostra, uma vez que o DNA microbiano total é baixo e as bibliotecas de sequenciação podem ser dominadas pelo DNA do hospedeiro ou por contaminantes dos reagentes. Para estudos de microbiomas aquáticos de baixa biomassa, recomendamos consistentemente um experimento piloto de 10 amostras com 100.000 leituras para avaliar a riqueza da comunidade, a adequação da profundidade e os níveis de contaminação antes de nos comprometermos com a sequenciação em larga escala. Um investigador que estudava a bioincrustação de poços de água subterrânea perguntou se as suas amostras de água, que apresentavam níveis de ácidos nucleicos indetectáveis após a extração padrão, poderiam ser sequenciadas. A resposta foi sim, mas apenas após otimizar o protocolo de extração de DNA para concentrar o mínimo de DNA microbiano presente e sequenciar a uma profundidade maior para maximizar a recuperação da comunidade escassa. Para amostras tão desafiadoras, sequenciação metagenómica shotgun teria sido proibitivamente caro.

Amostras clínicas com alto fundo de ADN do hospedeiroOs swabs cervicovaginais, swabs de pele e tecidos de biópsia contêm frequentemente mais de 90% de DNA do hospedeiro. Mesmo com a depleção de DNA do hospedeiro, a fração microbiana efetiva pode ser tão baixa quanto 1–10% do total de leituras. Para tais amostras, recomendamos um mínimo de 100.000 leituras por amostra. Se uma corrida de sequenciação inicial produzir menos de 5.000 leituras microbianas por amostra, é indicada uma sequenciação mais profunda ou uma reextração com remoção aprimorada de DNA do hospedeiro.

A Importância Crítica dos Controles Negativos

Um dos erros mais comuns e prejudiciais no design de estudos de 16S é a omissão de controlos negativos adequados. Os kits de extração de DNA, os reagentes de PCR e o ar do laboratório contêm todos DNA bacteriano em níveis baixos. Em amostras de baixa biomassa, esses contaminantes do "kitome" e do laboratório podem dominar os resultados de sequenciação, levando a conclusões completamente erradas sobre a composição da comunidade microbiana em estudo. Um estudo muito publicitado que afirmava ter descoberto um microbioma placentário distinto foi posteriormente mostrado, através de uma análise cuidadosa de controlos negativos, que tinha detetado principalmente contaminantes de reagentes. Exigimos controlos negativos de extração e de PCR em todos os projetos de baixa biomassa que sequenciamos, e recomendamos fortemente que sejam utilizados em todos os projetos, independentemente do nível de biomassa. Estes controlos negativos são sequenciados juntamente com as amostras experimentais e analisados utilizando ferramentas como o pacote R decontam para identificar e remover OTUs contaminantes. Este passo não é opcional para estudos rigorosos de microbioma de baixa biomassa, no entanto, raramente é mencionado nas descrições de protocolos padrão.

Para o investigador cujas amostras de água subterrânea apresentaram níveis indetectáveis de ácidos nucleicos: os controlos negativos não eram uma medida de precaução. Eram a única forma de distinguir o sinal microbiano real da água subterrânea da contaminação de fundo introduzida durante a extração de DNA e a construção da biblioteca de sequências. O projeto gerou dados interpretáveis precisamente porque desenhámos o estudo com controlos negativos desde a primeira amostra — e não como uma reflexão tardia.

A Transição de OTU para ASV na Bioinformática de 16S

O processamento bioinformático de dados de 16S passou de agrupamento de OTUs a 97% de similaridade para uma análise de ASVs (Variação de Sequência de Amplicon) de maior resolução, utilizando DADA2 ou Deblur. ASVs distinguem sequências que diferem por um único nucleotídeo, proporcionando uma resolução mais fina, maior reprodutibilidade em estudos independentes e a capacidade de vincular ASVs individuais a sequências de genomas de referência através de correspondência exata de sequências, em vez de aproximação baseada em agrupamentos. O pipeline padrão na CD Genomics segue estes passos: desmultiplexação e remoção de primers (cutadapt), filtragem de qualidade e corte (filtragem de erro esperado do DADA2), inferência de ASV (inferência de amostra central do DADA2), atribuição taxonómica (SILVA 138 ou GTDB), construção de árvore filogenética, cálculo de diversidade alfa e rarefação, ordenação de diversidade beta (PCoA) e teste de abundância diferencial (DESeq2, ANCOM-BC ou MaAsLin2). O QIIME 2 é a plataforma mais amplamente adotada para análise de 16S de ponta a ponta. Fornecemos tanto artefatos de saída do QIIME 2 quanto formatos de dados compatíveis com R no nosso pacote padrão de entregas bioinformáticas.

Sequenciação ITS — Desbloqueando o Reino Fúngico

Por que um marcador separado para fungos?

As bactérias dominam a maioria das discussões sobre a investigação do microbioma, os fungos são ubíquos — no solo, nas raízes das plantas, nos tratos digestivos dos animais, na pele humana e no ambiente construído. Um inquérito de 16S rRNA captura apenas procariontes, perdendo toda a componente fúngica. Dado que os fungos são motores principais da decomposição da matéria orgânica, mediadores diretos das interações planta-microbio em sistemas agrícolas e importantes patógenos oportunistas em pacientes imunocomprometidos, excluir os fungos dos inquéritos do microbioma significa ver, no máximo, metade do quadro microbiano.

A CD Genomics oferece perfilamento abrangente da comunidade fúngica através de sequenciação de amplicões ITS, com opções para sequenciação de leitura curta (Illumina) e leitura longa (PacBio, Nanopore), dependendo das suas necessidades de resolução taxonómica.

ITS1 vs. ITS2: Escolhendo a Região Certa

ITS1 (primers ITS1f/ITS2)Este conjunto de primers amplifica a região ITS1 entre o rRNA 18S SSU e o rRNA 5.8S. O primer ITS1f é especificamente otimizado para evitar a co-amplificação de DNA de plantas, tornando o ITS1 a escolha preferida para tecidos radiculares de plantas, solo da rizosfera ou qualquer amostra com alta biomassa vegetal. O ITS1 proporciona uma melhor cobertura de Ascomycota e Basidiomycota e é o padrão para a maioria das pesquisas fúngicas ambientais. O comprimento do amplicão varia de aproximadamente 250 a mais de 600 pares de bases, dependendo da espécie fúngica, com a ampla variação de comprimento apresentando tanto desafios analíticos quanto informações taxonómicas adicionais.

ITS2 (primers ITS3/ITS4)Este conjunto de primers amplifica a região ITS2 entre 5.8S e 28S LSU. O ITS2 apresenta significativamente menos variação de comprimento entre os táxons fúngicos em comparação com o ITS1 — uma vantagem significativa para o agrupamento bioinformático, pois reduz a necessidade de filtragem e normalização baseadas no comprimento que podem introduzir viés. Alguns estudos demonstraram que o ITS2 proporciona uma melhor resolução a nível de espécies dentro de grupos taxonomicamente difíceis, nomeadamente o género Fusarium e outros fungos fitopatogénicos importantes para a agricultura. O ITS2 é recomendado quando o foco principal da pesquisa é a micologia clínica ou a deteção de patógenos específicos, em vez da diversidade fúngica ambiental ampla.

ITS completo utilizando sequenciação de leitura longaA PacBio CCS pode capturar tanto o ITS1 como o ITS2, além do gene 5.8S interveniente, em um único amplicão de aproximadamente 600–800 pares de bases para a maioria dos fungos, embora alguns grupos ultrapassem 1.000 pares de bases. A CD Genomics fornece Sequenciação ITS de Comprimento Total em plataformas da Pacific Biosciences e Oxford Nanopore para projetos que exigem a máxima resolução filogenética.

Considerações sobre Análise de Dados e Bases de Dados de ITS

A análise bioinformática do ITS fúngico difere da análise do 16S em vários aspectos importantes. A base de dados UNITE (unite.ut.ee) é a referência padrão para a taxonomia do ITS fúngico, fornecendo uma liberação de "hipótese de espécie" (SH) que agrupa sequências com aproximadamente 97% de similaridade para agrupamento de OTUs padronizados em estudos independentes. Uma consideração prática crítica é que as bases de dados de referência do ITS fúngico continuam a ser muito menos completas do que as bases de dados do 16S. Um estudo típico da comunidade fúngica do solo utilizando ITS atribui apenas 60–80% das leituras a géneros fúngicos nomeados, em comparação com bem mais de 95% para estudos bacterianos do 16S. Esta fração de "matéria escura" de sequências fúngicas não caracterizadas representa tanto uma limitação quanto uma oportunidade: muitos estudos ambientais baseados em ITS relatam linhagens fúngicas previamente desconhecidas, que podem ser contribuições significativas para a micologia orientada pela descoberta, mas apresentam desafios para a interpretação ecológica quando os papéis funcionais dos organismos detectados são desconhecidos.

Estudos de Caso a Partir de Dados de Investigação

Um investigador que estuda a composição da comunidade fúngica nas raízes das plantas submeteu 18 amostras para sequenciação de amplicões ITS. O objetivo experimental era caracterizar a comunidade fúngica micorrízica que coloniza o sistema radicular — micorrizas arbusculares, ectomicorrizas e endófitos escuros septados — e comparar os padrões de colonização entre os tratamentos de solo. A sequenciação ITS1 utilizando o conjunto de primers ITS1f (para minimizar a co-amplificação do DNA do cloroplasto das plantas a partir do tecido radicular) foi a escolha metodológica correta. Realizámos a preparação da biblioteca e a sequenciação visando 50.000 leituras por amostra — suficiente para caracterizar os táxons micorrízicos dominantes e detectar espécies raras associadas às raízes que possam servir como táxons indicadores dos efeitos dos tratamentos de solo.

Sequenciação de rRNA 18S — Perfilando os Eucariotos Microbianos

A Maioria Ignorada da Diversidade Microbiana

Quando os investigadores desenham um estudo sobre o microbioma utilizando 16S e ITS como alvos de sequenciação, capturam os componentes procarióticos e fúngicos. Mas os micróbios eucarióticos — protistas, algas unicelulares, nematóides e outros eucariotos microscópicos — podem constituir a maioria da biomassa e da atividade metabólica em muitos ecossistemas naturais e engenheirados. Protistas fotoautotróficos (diatomáceas, dinoflagelados) são os produtores primários na base das teias alimentares marinhas e de água doce. Protistas fagotróficos (ciliados, flagelados) pastam sobre populações bacterianas e regulam a estrutura da comunidade microbiana. Protistas parasitas (Plasmodium, Giardia, Cryptosporidium, Toxoplasma, Leishmania) causam algumas das doenças infecciosas mais importantes em todo o mundo. Todos esses organismos são invisíveis tanto para a sequenciação de 16S quanto de ITS. O gene do RNA ribossómico 18S serve como o marcador filogenético de escolha para a investigação da comunidade microbiana eucariótica.

O Gene 18S e a Direcionamento Regional

O gene 18S rRNA tem aproximadamente 1.800 pares de bases com nove regiões variáveis (V1–V9). Duas regiões variáveis dominam os estudos de metabarcoding eucariotos publicados:

região V4A região 18S mais comumente alvo para a perfuração de comunidades eucarióticas. Amplificada usando primers como TAReuk454FWD1 e TAReukREV3, produz um amplicão de ~380–430 bp com boa resolução taxonómica em toda a árvore da vida eucariótica. A região V4 foi escolhida pelo projeto Tara Oceans e pela iniciativa Ocean Sampling Day como seu marcador padrão para a diversidade microbiana eucariótica, gerando um enorme conjunto de dados de referência global. Para a maioria das aplicações de ecologia microbiana eucariótica — inquéritos de comunidades de protistas marinhos, monitorização de plâncton de água doce e avaliações da diversidade de protistas no solo — o sequenciamento da V4 do 18S é o ponto de partida recomendado.

região V9Uma região hipervariável mais curta (~130 pb) na extremidade 3' do gene 18S. V9 pode ser amplificada e sequenciada com leituras mais curtas e é menos suscetível a viéses de variação de comprimento. É preferida para DNA degradado, como DNA ambiental antigo de núcleos de sedimento, mas a sua resolução taxonómica é geralmente inferior à de V4 para a maioria dos grupos eucariotos.

Limitações da Metabarcoding de 18S

Vários desafios únicos da sequenciação de amplicões de 18S requerem atenção cuidadosa. A base de dados PR2 (Protist Ribosomal Reference) é o recurso melhor curado para sequências de 18S eucarióticas, mas a cobertura taxonómica é desigual: os alveolados, estramenopilos e rizários estão bem representados, enquanto os filos de protistas menos estudados têm sequências de referência escassas. O número de cópias do gene 18S rRNA varia em mais de três ordens de magnitude entre os linhagens eucarióticas — o que significa que as contagens de leituras não refletem as contagens celulares, tornando as comparações quantitativas entre grupos taxonómicos díspares pouco fiáveis. A contaminação por DNA eucariótico não microbiano é comum: as próprias células da pele do investigador, o tecido do animal ou planta hospedeira em estudo, e outros macro-organismos contêm todas sequências de 18S que se amplificam com primers eucarióticos universais, reduzindo a profundidade de sequenciação efetiva para a comunidade de protistas de interesse.

Aplicações 18S a partir dos Dados de Inquérito

Um grupo de investigação em ecologia marinha submeteu amostras de sedimentos para metabarcoding 18S para avaliar as alterações na composição da comunidade de protistas após uma floração sazonal de fitoplâncton. O investigador selecionou a sequenciação 18S V4 porque a análise da sucessão de protistas pós-floração exigia um marcador que capturasse a diversidade eucariótica de forma ampla, incluindo tanto os produtores primários como os seus consumidores heterotróficos. Esta questão não poderia ser respondida com sequenciação 16S ou ITS, nenhuma das quais recuperaria a comunidade de protistas.

Codificação de DNA — Identificação de Espécies para o Mundo Macroscópico

Da Caracterização da Comunidade à Identificação Precisa de Espécimes

A metabarcoding de amplicon responde à pergunta "Quais membros da comunidade microbiana estão presentes nesta amostra mista?" O barcoding de DNA responde a uma pergunta diferente, mas igualmente fundamental: "Que espécie é este organismo individual?" Um investigador que estuda a diversidade de borboletas submeteu 300 espécimes — 75 espécies presumidas com 4 indivíduos cada — para barcoding de COI. Eles precisavam de identidade de espécie confirmada para cada espécime e sequências de haplótipo para análise genética populacional, e não de perfis comunitários a partir de extratos de DNA mistos.

O Consórcio para o Código de Barras da Vida (CBOL, barcodeoflife.org) estabeleceu marcadores padronizados:

  • COI (subunidade I da citocromo c oxidase)Um fragmento padronizado de 658 bp do gene mitocondrial COI é o código de barras animal universal, amplificável na maioria dos filos animais utilizando primers universais (LCO1490/HCO2198). O Sistema de Dados do Código de Barras da Vida (BOLD) arquiva mais de 11 milhões de sequências de código de barras de aproximadamente 500.000 espécies descritas. A CD Genomics fornece Serviços de Código de Barras de DNA abrangendo os marcadores COI, rbcL, matK e ITS.
  • rbcL e matKA combinação padrão de código de barras para plantas terrestres. rbcL é fácil de amplificar com primers universais, mas fornece uma resolução limitada a nível de espécies. matK é mais variável, mas mais difícil de amplificar de forma universal. Juntos, os dois marcadores alcançam aproximadamente 70–75% de sucesso na identificação a nível de espécies em plantas terrestres.
  • ITS no contexto de codificação de barrasA mesma região ITS que serve como marcador de metabarcoding fúngico serve como código de barras fúngico, mas cada sequência origina-se de um único isolado cultivado ou corpo de frutificação, produzindo uma identificação de espécie sem ambiguidades.

Codificação em Escala: Do Sanger ao NGS

A marcação tradicional baseada em Sanger é prática para dezenas a centenas de espécimes, mas torna-se proibitivamente cara na escala de milhares de espécimes. Para grandes projetos de inventário de biodiversidade, utilizamos um fluxo de trabalho de marcação baseado em NGS. Os espécimes individuais são processados através da extração de DNA e amplificação por PCR em formato de placa de 96 poços, cada um recebendo um índice de código de barras único. Os amplicons indexados são agrupados e sequenciados em uma única corrida de Illumina, gerando sequências de código de barras para milhares de espécimes a um custo por espécime inferior a um dólar americano.

Escolhendo a Sua Abordagem de Amplicão: Estrutura de Decisão

Genomic structure comparison of 16S, 18S, ITS, and COI marker genes.Figura 2: Esquema de Comparação de Genes Marcadores — Mapas genómicos lado a lado dos genes 16S rRNA (V1–V9), 18S rRNA, ITS (ITS1/5.8S/ITS2) e COI, com regiões conservadas e variáveis destacadas.

A tabela abaixo resume quando escolher cada método com base na sua questão de investigação:

Pergunta de PesquisaMétodo RecomendadoLeituras por AmostraBase de Dados de Referência
"Quais bactérias estão na minha amostra de intestino/solo/água?"16S V3–V4 ou V4–V550.000–100.000SILVA, GTDB
"Que fungos colonizam as raízes da minha planta?"ITS1 ou ITS230.000–80.000UNIR
"Que protistas vivem nesta amostra marinha?"18S V4 ou V930.000–80.000PR2
"Este produto de peixe/carne está rotulado corretamente?"Codificação de COISanger ou NGS de baixo fluxoNEGRITO
"Preciso de identificações bacterianas a nível de espécie."16S completo10.000–30.000SILVA, GTDB
"Microbioma total (bactérias + fungos)"16S + ITS dual50.000 + 50.000SILVA + UNIR
"O dinheiro é escasso — dados mínimos viáveis"16S V3–V4 reduzido25.000–50.000SILVA
"Confirmar a identidade de espécie de 300 espécimes animais"Codificação COI (NGS)NGS de passa-baixaNEGRITO

Estratégias de Marcadores Duais e Múltiplos

Uma abordagem dual de 16S + ITS captura bactérias, arqueias e fungos da mesma extração de DNA, revelando interações entre reinos que nenhum dos marcadores consegue detectar isoladamente. Redes de coocorrência bacteriano-fúngica são cada vez mais reconhecidas como impulsionadoras da função do microbioma na saúde do solo, supressão de doenças em plantas e ecologia intestinal humana. Ao sequenciar ambos os marcadores a partir do mesmo conjunto de amostras, é possível construir redes de associação inter-reinos e identificar potenciais relações sinérgicas ou antagónicas entre os membros da comunidade bacteriana e fúngica.

Para um perfil abrangente de três domínios (procariotos + fungos + protistas), uma abordagem tripla de 16S + ITS + 18S é viável num único projeto coordenado, mas cara. Recomendamos apenas quando as comunidades microbianas eucarióticas são uma questão central de pesquisa, e não um objetivo exploratório. O custo aumenta aproximadamente de forma aditiva com cada marcador adicional, mas a necessidade de DNA por amostra não — uma extração de cada amostra fornece DNA template suficiente para todas as três reações de PCR, e as preparações de bibliotecas são realizadas em paralelo.

Sequenciação 16S vs. Metagenómica Shotgun: Um Ponto de Decisão

Uma questão que surge em quase todas as consultas de projeto é quando fazer a transição de sequenciação de amplicões 16S para sequenciação metagenómica shotgun. A resposta curta é que a sequenciação 16S responde quem está aí (composição taxonómica) enquanto a metagenómica shotgun responde do que são capazes (seu potencial funcional). Se a sua questão de pesquisa requer conhecimento sobre vias metabólicas, perfis de genes de resistência a antibióticos ou variação genómica a nível de estirpe na comunidade, a metagenómica shotgun é o método apropriado — a um custo por amostra tipicamente 5–10 vezes superior. Se a sua questão diz respeito à composição da comunidade, comparações de diversidade entre grupos ou mudanças na abundância de táxons específicos após uma intervenção, o sequenciamento de amplicões 16S fornece a informação certa a uma fração do custo. Para muitos estudos, uma abordagem em camadas funciona melhor: um inquérito 16S em todas as amostras para caracterizar padrões a nível comunitário, seguido de metagenómica shotgun em um subconjunto de amostras selecionadas estrategicamente para obter insights funcionais.

Two-column comparison infographic of Amplicon Sequencing vs Shotgun Metagenomics across cost, data type, depth, sample flexibility, and bioinformatics complexity.Figura 4: Infográfico de Comparação — Sequenciação de Amplicon vs. Metagenómica Shotgun. Comparação lado a lado em relação ao custo por amostra, tipo de dados, profundidade de sequenciação necessária, flexibilidade do tipo de amostra e complexidade bioinformática.

Como a CD Genomics Entrega o Seu Projeto de Amplicon

End-to-end amplicon sequencing workflow from sample to data delivery.Figura 3: Diagrama de Fluxo de Processo — Serviço de Sequenciação de Amplicões de Ponta a Ponta. Seis etapas sequenciais desde a Amostra até Extrair, Amplificar, Sequenciar, Analisar, até Entrega de Dados.

Nosso Serviço de Sequenciamento de Amplicões é concebido em torno de um ciclo de vida completo do projeto, desde a consulta de design até dados prontos para publicação. Durante a discussão inicial de definição de âmbito, abordamos a matriz de amostras e os desafios esperados, o número de amostras e grupos experimentais, a questão de pesquisa, o orçamento, o cronograma e quaisquer requisitos especiais, incluindo conjuntos de primers personalizados.

Após a receção da amostra, medimos a concentração (Qubit), pureza (NanoDrop A260/A280, A260/A230) e integridade (TapeStation). Para amostras brutas, adaptamos os protocolos de extração à matriz específica — o solo rico em ácidos húmicos requer uma abordagem diferente em comparação com amostras fecais rotineiras. Amostras de água com ácidos nucleicos indetectáveis requerem etapas de concentração e deteção aprimorada, muitas vezes sem custo adicional.

A preparação da biblioteca utiliza codificação de dupla indexação para multiplexar até 384 amostras por faixa de célula de fluxo NovaSeq S4. Os conjuntos de primers padrão incluem 16S V3–V4 (341F/805R), ITS1 (ITS1f/ITS2), ITS2 (ITS3/ITS4) e 18S V4 (TAReuk454FWD1/TAReukREV3). Sequenciação de Amplicões de 16S/18S/ITS de Comprimento Total está disponível para resolução a nível de espécie em plataformas PacBio ou Nanopore. Primers personalizados são suportados para aplicações especializadas, incluindo primers 16S específicos para cianobactérias e específicos para arqueias.

Os entregáveis padrão de bioinformática incluem arquivos FASTQ demultiplexados, tabelas de ASV/OTU com taxonomia (SILVA ou UNITE), sequências representativas de ASV, métricas de diversidade alfa (Shannon, Simpson, Chao1, PD de Faith), ordenações de diversidade beta (PCoA com UniFrac, Bray-Curtis, Jaccard), gráficos de barras taxonómicos, mapas de calor de comunidades e árvores filogenéticas. Análise personalizada — testes de abundância diferencial (DESeq2, ANCOM-BC, MaAsLin2), previsão funcional (PICRUSt2), análise de redes de coocorrência, figuras prontas para publicação — está disponível mediante solicitação.

O prazo padrão é de 3 a 6 semanas desde a receção da amostra até à entrega dos dados. Projetos piloto pequenos (10 a 30 amostras) podem ser concluídos em 2 a 3 semanas. Serviço urgente está disponível para projetos urgentes. Fornecemos documentação detalhada de QC para cada projeto, incluindo contagens de leitura por amostra, distribuições de Q-score e avaliação de contaminação. Se uma amostra não amplificar, informamos antes de prosseguir para a sequenciação — não sequenciamos bibliotecas que não amplificam nem cobramos por preparações de bibliotecas falhadas.

Perguntas Frequentes

P: As minhas amostras de água apresentam níveis de ácidos nucleicos indetetáveis após a extração de DNA. Conseguem ainda sequenciá-las?

Sim, na maioria dos casos. Podemos otimizar o protocolo de extração para concentrar o DNA microbiano mínimo e sequenciar a uma maior profundidade. Isso requer controlos negativos sequenciados juntamente com as amostras experimentais para distinguir o sinal microbiano da contaminação por reagentes — um passo que não é opcional para estudos de baixa biomassa. Contacte a nossa equipa científica para discutir as suas amostras específicas antes de submeter.

P: É suficiente duplicado ou precisamos de triplicados biológicos?

Para qualquer comparação a nível comunitário, é necessário um mínimo de três réplicas biológicas por grupo experimental. Recomendamos cinco réplicas para comunidades com alta variabilidade, como microbiomas do solo ou da pele. O desenho de estudo mais comum com baixa potência é de duas réplicas com alta profundidade de sequenciação — pelo mesmo custo total, recomendamos sequenciar cinco réplicas com menor profundidade.

P: Posso usar o mesmo DNA para sequenciação de 16S e ITS?

Sim. Ambos os marcadores são amplificados a partir da mesma extração de DNA utilizando conjuntos de primers separados em reações de PCR independentes. Podemos coordenar projetos de marcadores duplos para minimizar o manuseio e envio das suas amostras.

Q: Qual é a quantidade mínima de ADN necessária para sequenciação de amplicões?

Recomendamos pelo menos 10 ng de DNA por amostra para a preparação de bibliotecas de amplicões padrão. Para amostras com rendimentos mais baixos, podemos tentar a amplificação com um número de ciclos aumentado, mas o risco de viés de PCR e formação de quimeras aumenta com ciclos adicionais.

Q: Quanto tempo demora um projeto típico de amplicon desde a submissão até à entrega dos dados?

Projetos padrão requerem 3–6 semanas: controlo de qualidade e extração de amostras (3–5 dias), preparação da biblioteca (3–5 dias), sequenciação (1–7 dias) e análise bioinformática (5–10 dias). Pequenos projetos piloto (10–30 amostras) podem ser concluídos em 2–3 semanas.

P: Vocês fornecem extração de DNA a partir de amostras brutas, ou preciso extrair primeiro?

Oferecemos extração de DNA a partir de uma ampla gama de tipos de amostras, incluindo fezes, solo, filtros de água, swabs, tecido e FFPE. A extração é realizada utilizando protocolos otimizados para cada matriz, com etapas apropriadas de remoção de inibidores. Por favor, especifique se necessita de extração ao solicitar o seu orçamento.

Q: Qual é a diferença entre a análise de OTU e a análise de ASV?

A análise de OTU (Unidade Taxonómica Operacional) agrupa sequências com 97% de similaridade, agrupando sequências intimamente relacionadas mas distintas. A análise de ASV (Variante de Sequência de Amplicon) distingue sequências que diferem por um único nucleótido, proporcionando maior resolução e reprodutibilidade. Oferecemos ambas as opções nos nossos entregáveis padrão.

Q: Você suporta conjuntos de primers personalizados?

Sim. Podemos sintetizar e validar primers personalizados para aplicações especializadas, incluindo primers 16S específicos de grupos para filos bacterianos específicos, primers específicos para arqueias e marcadores personalizados para alvos de codificação não padrão.

Todas as referências abaixo estão publicadas sob a licença CC BY 4.0 ou licenças de acesso aberto equivalentes.

Referências:

  1. Callahan BJ, Sankaran K, Fukuyama JA, McMurdie PJ, Holmes SP. Fluxo de Trabalho Bioconductor para Análise de Dados de Microbioma: desde leituras brutas até análises de comunidade. F1000Research. 2016;5:1492. doi:10.12688/f1000research.8986.2 (CC BY 4.0)
  2. Estaki M, Jiang L, Bokulich NA, et al. O QIIME 2 permite uma análise abrangente de ponta a ponta de dados microbioma diversos e aprendizagem de máquina comparativa. mSystems. 2020;5(1):e00150-20. doi:10.1128/mSystems.00150-20 (CC BY 4.0)
  3. Quast C, Pruesse E, Yilmaz P, et al. O projeto da base de dados de genes de RNA ribossómico SILVA: processamento de dados melhorado e ferramentas baseadas na web. Nucleic Acids Research. 2013;41(D1):D590–D596. doi:10.1093/nar/gks1219 (Acesso Aberto)
  4. Nilsson RH, Larsson KH, Taylor AFS, et al. A base de dados UNITE para a identificação molecular de fungos: tratamento de táxons obscuros e classificações taxonómicas paralelas. Nucleic Acids Research. 2019;47(D1):D259–D264. doi:10.1093/nar/gky1022 (Acesso Aberto)
  5. Guillou L, Bachar D, Audic S, et al. A base de dados de referência ribossomal de protistas (PR2): um catálogo de sequências de rRNA da subunidade pequena de eucariotas unicelulares com taxonomia curada. Nucleic Acids Research. 2013;41(D1):D597–D604. doi:10.1093/nar/gks1160 (Acesso Aberto)
  6. Ratnasingham S, Hebert PDN. Um Registo Baseado em DNA para Todas as Espécies Animais: O Sistema de Número de Índice de Código de Barras (BIN). PLOS ONE. 2013;8(7):e66213. doi:10.1371/journal.pone.0066213 (CC BY 4.0)
  7. Walters W, Hyde ER, Berg-Lyons D, et al. Primers Melhorados para o Gene 16S rRNA Bacteriano (V4 e V4-5) e para o Gene Marcador do Espaço Intertranscrito Fúngico para Inquéritos de Comunidades Microbianas. mSystems. 2016;1(1):e00009-15. doi:10.1128/mSystems.00009-15 (CC BY 4.0)
  8. Davis NM, Proctor DM, Holmes SP, Relman DA, Callahan BJ. Identificação estatística simples e remoção de sequências contaminantes em dados de genes marcadores e metagenómica. Microbiome. 2018;6:226. doi:10.1186/s40168-018-0605-2 (CC BY 4.0)
  9. Parks DH, Chuvochina M, Rinke C, et al. GTDB: um censo contínuo da diversidade bacteriana e arqueal através de uma taxonomia baseada em genomas que é filogeneticamente consistente, normalizada por classificação e completa. Nucleic Acids Research. 2022;50(D1):D785–D794. doi:10.1093/nar/gkab776 (Acesso Aberto)
  10. Callahan BJ, Wong J, Heiner C, et al. Sequenciação de amplicões de alto rendimento do gene 16S rRNA completo com resolução de nucleotídeo único. Nucleic Acids Research. 2019;47(18):e103. doi:10.1093/nar/gkz569 (Acesso Aberto)
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo