Quebrando a Barreira do Reino: Estratégias Avançadas para Distinguir Bactérias e Fungos em Microbiomas Complexos

Intenção meta: Ajude os investigadores do microbioma a resolver os estrangulamentos técnicos da co-análise de bactérias e fungos em amostras mistas de investigação ambiental, industrial, agrícola, de fermentação e outras não clínicas, avançando de preconceitos de extração e limitações de marcadores para uma precisão metagenómica e filogenómica.

Microbiomas complexos são difíceis porque as bactérias e os fungos entram no mesmo fluxo de trabalho, mas não obedecem às mesmas regras. Eles diferem na química da parede celular, no comportamento de lise, nas regiões-alvo, na adequação ao sequenciamento e no suporte de referência. Se um fluxo de trabalho for aplicado a ambos os reinos sem ajustes, a saída pode parecer limpa, mas ainda assim estar enviesada. Na prática, esse viés muitas vezes começa durante a extração, muito antes de a classificação das leituras começar.

É por isso que a análise de reinos mistos não deve ser enquadrada como um simples exercício de identificação. O verdadeiro problema não é apenas como rotular uma leitura como bacteriana ou fúngica. O problema mais difícil é como recuperar ambos os reinos de forma justa a partir de uma matriz heterogénea, preservar informação molecular suficiente para o ensaio escolhido e, em seguida, interpretar a saída com a confiança taxonómica e filogenómica adequada. Isso é importante em solo, sedimentos, águas residuais, compostagem, sistemas de fermentação, biofilmes industriais e microbiomas associados a plantas, onde a biomassa fúngica pode ser irregular, densa em paredes ou fisicamente protegida, enquanto o DNA bacteriano é mais fácil de liberar e capturar.

Uma estratégia robusta deve, portanto, conectar quatro camadas. Primeiro, o fluxo de trabalho deve respeitar a divergência biológica entre células procarióticas e fúngicas. Em segundo lugar, a extração deve ser otimizada para uma recuperação representativa em vez de apenas para o rendimento total. Em terceiro lugar, o design de sequenciação deve corresponder à questão real, seja isso significando perfis baseados em marcadores, uma análise mais ampla de shotgun ou resolução de leitura longa. Por último, a análise posterior deve levar em conta o fato de que as referências bacterianas e fúngicas não são igualmente completas, igualmente padronizadas ou igualmente fáceis de classificar.

Divergência Biológica Fundamental

A química diferente das paredes cria diferentes comportamentos de extração.

A primeira barreira do reino é física. Muitas bactérias dependem de paredes celulares ricas em peptidoglicano que rodeiam uma arquitetura procariótica relativamente compacta. Os fungos, por outro lado, são microrganismos eucarióticos com paredes mais espessas e em camadas, frequentemente construídas a partir de quitina, glucanos, manoproteínas e polímeros estruturais relacionados. Esta diferença não é apenas biologia descritiva. Ela molda diretamente a quantidade de força, pré-tratamento e tempo necessários para liberar DNA sem introduzir viés.

Um protocolo de extração padrão pode, portanto, parecer bem-sucedido enquanto ainda está desequilibrado. Uma boa concentração não garante uma recuperação justa. Numa amostra mista, as células bacterianas podem romper-se rapidamente e libertar DNA precocemente, enquanto esporos fúngicos, células semelhantes a leveduras ou fragmentos hifais permanecem parcialmente intactos. Uma vez que isso acontece, o extrato já contém uma distorção a nível de reino. O sequenciamento preserva essa distorção. Não a corrige.

Kingdom-Level Structural Differentiation Map Figura 1. Mapa de Diferenciação Estrutural a Nível de Reino
Contraste estrutural entre células bacterianas e fúngicas, destacando paredes ricas em peptidoglicano versus quitina-β-glucano, organização intracelular e os principais alvos moleculares utilizados para identificação específica de reinos. A camada chave a ler é a conexão entre a composição da parede e a escolha do ensaio subsequente.

A arquitetura ribossómica define diferentes pontos de entrada molecular.

A segunda barreira é molecular. A caracterização da comunidade bacteriana ainda se centra no gene 16S rRNA porque fornece uma estrutura estável para inferências taxonómicas amplas. A caracterização de fungos depende muito mais da região ITS, com o 18S utilizado quando é necessária uma cobertura eucariota mais ampla. Isto não é apenas uma convenção. Estes alvos são utilizados porque a conservação e a variabilidade das sequências estão distribuídas de forma diferente entre os dois reinos. O UNITE reflete essa realidade ao centrar a padronização de referências fúngicas na ITS e ao organizar sequências em hipóteses de espécies com identificadores baseados em DOI.

Isto tem uma consequência de design imediata. Não existe um único marcador que forneça perfis bacterianos e fúngicos igualmente fortes na maioria das amostras heterogéneas reais. Um ensaio de 16S é inerentemente centrado em bactérias. Um ensaio de ITS é inerentemente centrado em fungos. Um ensaio de 18S pode alargar a deteção eucariótica, mas geralmente não fornece o mesmo poder a nível de espécies fúngicas que o ITS. A escolha do marcador não é, portanto, um passo rotineiro de configuração. É uma decisão sobre que tipo de resposta o experimento pode produzir.

Para projetos que necessitam de uma co-análise justa de ambos os reinos, um design emparelhado é geralmente mais robusto do que um compromisso forçado de um único marcador. Em termos práticos, isso muitas vezes significa começar com Sequenciação de Amplicões 16S/18S/ITS para uma caracterização específica de reinos, passando depois a sequências mais amplas quando a interpretação entre reinos se torna o principal objetivo.

A morfologia ainda ajuda, mas já não é suficiente.

A morfologia continua a ser útil como contexto. Em ambientes de investigação ambiental e industrial, a microscopia pode ainda revelar se uma amostra é rica em esporos, rica em hifas, densa em biofilmes ou dominada por agregados bacterianos. Essa informação pode orientar a estratégia de extração e explicar por que algumas amostras se comportam mal a montante. Mas a morfologia sozinha não pode responder às perguntas que mais importam em fluxos de trabalho guiados por sequenciação. Não pode mostrar qual reino foi preferencialmente lisado, qual alvo foi amplificado seletivamente ou se o padrão final de abundância reflete biologia ou viés do fluxo de trabalho. É aqui que a análise de reinos mistos deixa a identificação básica para trás e se torna um problema de design de fluxo de trabalho.

O Gargalo da Lise: Otimização da Extração de DNA para Amostras Heterogéneas

Por que os fluxos de trabalho padrão frequentemente sub-representam os fungos

A falha mais comum em estudos mistos de bactérias e fungos é a sub-recuperação silenciosa de fungos. Os protocolos de extração padrão são frequentemente robustos para bactérias porque as células bacterianas são abundantes, pequenas e mais fáceis de desagregar em muitos fluxos de trabalho genéricos. Os fungos são diferentes. Esporos de parede espessa, estruturas melanizadas e fragmentos hifais podem exigir mais força ou um pré-tratamento mais especializado. Se o fluxo de trabalho terminar antes que essas estruturas sejam eficientemente abertas, o DNA fúngico nunca entra na biblioteca em quantidades representativas.

Isto altera a interpretação, não apenas o rendimento. Uma comunidade pode parecer dominada por bactérias, com baixa riqueza fúngica, ou inesperadamente pobre em táxons filamentosos quando o verdadeiro problema é o viés de extração. Em matrizes ambientais densas, o efeito pode ser amplificado porque partículas, resíduos orgânicos, polímeros extracelulares ou pellets de biomassa protegem as estruturas fúngicas da destruição. A saída de sequenciação pode parecer estável, mas o sinal fúngico pode ser artificialmente comprimido.

A cinética de lise diferencial molda o pool de DNA desde o primeiro passo.

As bactérias e os fungos não se lisam na mesma linha do tempo. As células bacterianas frequentemente se rompem precocemente sob detergente, calor e agitação moderada com esferas. As estruturas fúngicas geralmente respondem de forma mais lenta e menos uniforme. Mesmo dentro dos fungos, esporos, células em brotação e hifas não se comportam da mesma maneira. Isso cria um desequilíbrio cinético dentro do mesmo tubo. Quando o DNA bacteriano já inundou o extrato, parte da fração fúngica pode ainda estar presa dentro de estruturas intactas.

Isso significa que o viés chave se forma antes da sequenciação. Uma vez que o pool de DNA se torna tendencioso para as bactérias, a amplificação a jusante, a preparação da biblioteca e a classificação herdam esse viés. Nenhum classificador pode recuperar DNA que nunca foi libertado. Este é o primeiro lugar onde os investigadores devem resolver falhas de reinos mistos.

Differential Lysis Workflow in Mixed Samples Figura 2. Fluxo de Lise Diferencial em Amostras Mistas
As condições padrão de lise frequentemente perturbam as células bacterianas mais cedo do que os esporos fúngicos ou fragmentos hifais, levando a um pool de ADN enriquecido em bactérias e a um viés de representação a montante. A camada mais importante é a separação dependente do tempo entre a ruptura bacteriana precoce e a liberação fúngica atrasada.

A física da batida de contas é um equilíbrio entre interrupção e dano.

A batida de esferas é frequentemente o ponto de viragem na recuperação de fungos, mas nunca deve ser tratada como uma variável binária. O resultado depende do tamanho das esferas, do material das esferas, da intensidade da oscilação, da duração do tratamento e do número de ciclos. Essas variáveis fazem duas coisas ao mesmo tempo. Elas controlam quão eficientemente as paredes celulares resistentes dos fungos são quebradas e controlam quanto DNA de alto peso molecular sobrevive ao processo.

É por isso que configurações mais rigorosas não são automaticamente melhores. A sub-bateção deixa estruturas fúngicas resistentes parcialmente intactas. A sobre-bateção aumenta a fragmentação e reduz o valor das aplicações de fragmentos longos a montante. A janela de operação útil situa-se entre essas duas falhas. Em fluxos de trabalho de amplicões de leitura curta, alguma fragmentação pode ser aceitável se o equilíbrio dos reinos melhorar. Em fluxos de trabalho de fragmentos longos, essa mesma fragmentação torna-se uma penalização direta.

Bead-Beating Parameter Matrix Figura 3. Matriz de Parâmetros de Bateção de Esferas
Visão do espaço de parâmetros da otimização por batimento de esferas, mostrando como o tamanho da esfera, material, intensidade e duração afetam conjuntamente a disrupção bacteriana, a disrupção fúngica e a integridade do DNA. A camada chave a ser lida é a zona de compromisso entre a lise fúngica suficiente e o corte excessivo do DNA.

Tabela 1. Impacto prático das variáveis de extração de chave em amostras mistas de bactérias e fungos

Variável de extração Efeito principal nas bactérias Efeito principal nos fungos Principal risco se sub-otimizado Principal risco se estiver excessivamente otimizado
Lise mecânica leve Frequentemente suficiente para células fáceis de lisar. Frequentemente insuficiente para esporos e formas de paredes grossas. Sub-representação fúngica Limitado
Batida forte de contas Geralmente melhora a ruptura. Frequentemente necessário para estruturas fúngicas resistentes. Disrupção fúngica incompleta Fragmentação de DNA e perda de fragmentos longos
Pequenas contas Alta frequência de colisões Útil para interrupção em pequena escala Pobre interrupção de estruturas mais rígidas em algumas matrizes Fragmentação se executado de forma demasiado agressiva
Contas grandes Força de impacto forte Útil para estruturas densas em paredes Perturbação desigual em matrizes mistas Dano mecânico excessivo
Pré-tratamento enzimático Necessidade direta limitada em muitos fluxos de trabalho focados em bactérias. Pode melhorar a libertação de células fúngicas recalcitrantes. Resistência de parede persistente Complexidade de manuseio adicionada
Ciclos de extração prolongados Pode aumentar o rendimento total. Pode melhorar a recuperação fúngica. Análise persistente insuficiente Calor, cisalhamento e menor integridade dos fragmentos

Esta tabela captura a regra central da extração de reinos mistos: o protocolo correto não é aquele com o maior rendimento total. É aquele que produz o pool de ADN mais representativo e compatível com o ensaio entre os reinos.

O pré-tratamento enzimático pode alargar a janela de extração útil.

A força mecânica sozinha muitas vezes não é suficiente para materiais fúngicos difíceis. O pré-tratamento enzimático pode ajudar ao enfraquecer a parede antes de começar a batida com esferas. A principal vantagem não é apenas um rendimento mais elevado. O benefício mais importante é uma janela operacional mais ampla entre a sub-licença e o excesso de cisalhamento. Isso é mais relevante quando se espera que a fração fúngica seja baixa, quando a amostra é rica em esporos ou material de parede densa, ou quando o plano a montante requer fragmentos de DNA mais longos.

Ainda assim, o pré-tratamento não é gratuito. Passos adicionais aumentam o tempo de manuseio, podem introduzir variabilidade e podem não ser adequados para todas as matrizes. A decisão deve estar ligada à questão de pesquisa, e não adotada como um hábito padrão.

Pre-treatment Decision Scheme for Recalcitrant Fungi Figura 4. Esquema de Decisão Pré-tratamento para Fungos Recalcitrantes
Lógica de árvore de decisão para selecionar fluxos de trabalho apenas mecânicos versus assistidos por enzimas com base na carga de esporos, abundância de hifas, nível de biomassa e requisitos de comprimento de fragmento a montante. A camada chave é o caminho de decisão, não os reagentes em si.

A extração otimizada significa recuperação representativa, não máxima de ADN.

Um protocolo de extração não é otimizado apenas porque produz a maior quantidade de DNA. É otimizado porque preserva melhor a representatividade biológica enquanto permanece compatível com a estratégia de sequenciação subsequente. Isso significa que a qualidade da extração deve ser avaliada em relação a múltiplos parâmetros: rendimento total, comprimento dos fragmentos, estabilidade das réplicas, detectabilidade fúngica e compatibilidade com o ensaio pretendido.

É também aqui que a escolha da sequenciação começa a moldar a escolha da extração. Um fluxo de trabalho projetado para marcadores bacterianos e fúngicos curtos pode tolerar mais fragmentação do que um fluxo de trabalho projetado para leituras contíguas longas. Projetos que planeiam Sequenciação de Amplicões de Comprimento Total 16S/18S/ITS ou Sequenciação Metagenómica de Longa Leitura preciso de fragmentos mais longos do que projetos que fazem apenas perfis curtos e direcionados.

Um pequeno piloto é muitas vezes a forma mais segura de resolver este compromisso. Comparar algumas condições de extração em amostras representativas pode mostrar se a fração fúngica é realmente fraca ou simplesmente mal recuperada. Também ajuda a determinar se o projeto deve permanecer em modo de perfilagem direcionada ou escalar para uma abordagem mais ampla. Sequenciação Metagenómica por Shotgun para uma caracterização mista de comunidade mais profunda.

Estratégias Avançadas de Sequenciação: 16S/ITS vs. Metagenómica Shotgun

A sequenciação de amplicões simplifica a questão, razão pela qual continua a ser útil.

A sequenciação de amplicões continua a ser o ponto de entrada mais eficiente para muitos projetos de microbioma, pois reduz a complexidade na fase de geração de dados. Em vez de sequenciar todo o ADN recuperável, enriquece um marcador e utiliza esse marcador como uma lente taxonómica. Para as bactérias, essa lente é geralmente o 16S. Para os fungos, é geralmente o ITS. Esse design é custo-efetivo, escalável e analiticamente maduro. Continua a ser útil para triagens amplas, comparação de comunidades de base e conjuntos de amostras grandes, onde o primeiro objetivo é estabelecer a estrutura composicional em vez do contexto genómico completo.

A sua força, no entanto, é também o seu limite. Cada ensaio de amplicon reduz o espaço de resposta por design. Um fluxo de trabalho de 16S não recuperará a diversidade fúngica. Um fluxo de trabalho de ITS não recuperará a diversidade bacteriana. Um projeto de reinos mistos que utiliza apenas um desses marcadores já decidiu qual reino será visível e qual permanecerá largamente invisível. Isso pode ser aceitável para uma questão estreita. Não é ideal para uma co-análise equilibrada.

O problema do viés do primer é maior em estudos de reinos mistos do que parece.

O viés dos primers não é apenas um incómodo em trabalhos mistos de bactérias e fungos. É um problema de design de primeira ordem. A questão não é apenas que alguns táxons amplificam de forma mais eficiente do que outros. O problema maior é que as alegações de primers "universais" podem esconder uma grande assimetria na cobertura dos reinos, na cobertura das linhagens e na amplificação de alvos não pretendidos. Quando isso acontece, a profundidade efetiva disponível para os táxons pretendidos diminui, e o perfil resultante torna-se mais difícil de interpretar.

Um caminho de atualização prático ajuda. A combinação de 16S + ITS geralmente é suficiente. quando o objetivo é a triagem rápida específica de reinos, classificação de amostras ou comparação composicional ampla entre muitas amostras. A metagenómica de shotgun torna-se necessária. quando a questão principal passa a ser a coocorrência entre reinos com contexto de conteúdo genético, atribuições de marcadores ambíguas ou a necessidade de conectar a taxonomia a evidências genómicas mais amplas. As estratégias de amplicão quantitativo absoluto são as mais importantes. quando a distorção da abundância relativa é parte do problema e os investigadores precisam de um suporte mais forte para a comparação de abundância entre amostras em vez de apenas para a composição dentro da amostra.

Por essa razão, estudos em comunidades mistas frequentemente beneficiam da combinação de perfis baseados em marcadores com um acompanhamento mais amplo. Os investigadores podem começar com Sequenciação de Amplicões 16S/18S/ITS, adicionar Sequenciação de Amplicões Absoluta Quantitativa 16S/18S/ITS quando o controlo do viés relativo se torna importante, e expandir para Sequenciação Metagenómica por Shotgun quando a interpretação informada pelo genoma se torna o verdadeiro ponto final.

A metagenómica de shotgun alarga a perspetiva, mas não remove a complexidade.

A metagenómica shotgun altera a estrutura do problema. Em vez de pedir que um locus represente um reino inteiro, o shotgun tenta amostrar todo o DNA recuperável no extrato. Isso torna-o mais atraente quando o projeto necessita de conteúdo genético, elementos móveis, capacidade metabólica ou uma transição da taxonomia baseada em marcadores para a filogenómica.

Mas a espingarda não apaga a dificuldade. Ela transfere a dificuldade de escolha do alvo para separação de sinaisNuma amostra mista, as leituras brutas chegam como um composto de ADN bacteriano, ADN fúngico, fragmentos extracelulares, moléculas de fundo e ruído derivado da matriz. Se os fungos forem de baixa abundância, mal lisados ou fraca e mal representados em referências, os seus genomas podem tornar-se um pequeno sinal dentro de um espaço de leitura dominado por bactérias muito maior. Esse é o verdadeiro significado da complexidade metagenómica.

Sequencing Strategy Comparison Figura 5. Comparação de Estratégias de Sequenciação: 16S, ITS, Shotgun e Leitura Longa
Tabela de comparação mostrando como a arquitetura alvo, amplitude, resolução e pontos cegos diferem entre os fluxos de trabalho de 16S, ITS, shotgun e leituras longas. A camada chave não é qual método é "melhor", mas qual corresponde à necessidade real da pesquisa.

Distinguir genomas fúngicos num mar de leituras bacterianas

A principal promessa da metagenómica shotgun é a amplitude. A principal dificuldade é o desequilíbrio. Em muitos microbiomas mistos, o DNA bacteriano domina o espaço de leitura porque as bactérias são mais abundantes, mais fáceis de lisar ou melhor representadas no extrato. O DNA fúngico aparece então como um sinal de menor profundidade, mais fraco e apoiado, embutido dentro de um fundo bacteriano muito maior. É por isso que a deteção de fungos em dados shotgun muitas vezes não é um simples problema de consulta taxonómica. É um problema de deconvolução de leituras.

Essa deconvolução geralmente depende de várias camadas ao mesmo tempo. Leituras de baixa qualidade devem ser removidas. O fundo não alvo deve ser filtrado. As leituras podem então ser classificadas diretamente, montadas em contigs, ou ambas. Depois disso, características como conteúdo de GC, profundidade de cobertura, composição de k-mer, comprimento de contig, genes marcadores e comportamento de alinhamento são usadas para separar bins mais confiantes de atribuições mais fracas ou ambíguas. Nenhum desses sinais é suficiente por si só. A força vem da combinação deles.

Cross-Kingdom Read Deconvolution and Binning Funnel Figura 6. Funil de Deconvolução e Agrupamento de Leituras entre Reinos
Visão em estilo funil do processamento de leituras mistas, mostrando como as leituras brutas de shotgun são progressivamente filtradas, deconvoluídas e alocadas em frações bacterianas, fúngicas, ambíguas e não classificadas. A camada chave a ler é onde o sinal fúngico fraco é retido ou perdido.

Instantâneo de Seleção de Fluxo de Trabalho

Necessidade de investigação Abordagem recomendada Porquê
Triagem rápida específica para o reino 16S + ITS Fluxos de trabalho de marcadores eficientes, maduros e escaláveis
Comparação de abundância relativa com um controlo de abundância mais forte Design de amplicão quantitativa absoluta Ajuda quando a distorção composicional em si é a preocupação.
Perfilamento entre reinos com contexto de conteúdo genético Metagenómica de shotgun Move além das restrições de marcador
Resolução consciente do genoma em amostras mistas difíceis Metagenómica de leitura longa Melhora a continuidade e o suporte à montagem
Interpretação ecológica focada na atividade Metatranscriptómica Captura funções expressas em vez de potencial estático.

A sequenciação de leitura longa aproxima a análise da precisão filogenómica.

A sequenciação de longas leituras é importante porque altera o que pode ser ligado numa única molécula. As leituras curtas são poderosas, mas frequentemente deixam um contexto fragmentado em torno de regiões repetitivas, loci ribossomais multicópias, variação estrutural e montagens difíceis. As longas leituras melhoram a continuidade, ajudam a ligar regiões complexas e suportam uma reconstrução genómica mais completa em conjuntos de dados microbianos mistos.

Para a diferenciação bacteriana-fúngica, isso importa de duas maneiras. Primeiro, leituras longas podem cobrir amplicões mais longos ou regiões ribossomais maiores, o que melhora a interpretabilidade dos marcadores taxonómicos que são difíceis de resolver apenas com leituras curtas. Em segundo lugar, e mais importante para a estruturação deste artigo, leituras longas ajudam a mover a análise para longe da identidade de um único locus e em direção a evidências em escala genómica. Esse é o verdadeiro significado da precisão filogenómica em microbiomas mistos.

se o projeto precisar de uma triagem em muitos amostras, os fluxos de trabalho de amplicão curto ainda fazem sentido. Se o projeto precisar de uma resolução entre reinos com maior confiança, recuperação de lócus complexos ou uma colocação evolutiva mais defensável, então Sequenciação Metagenómica de Longa Duração, Sequenciação de Amplicões de 16S/18S/ITS de Comprimento Totalou Sequenciação de Amplicões por Nanoporos tornar-se muito mais relevante.

Desafios Bioinformáticos: Bases de Dados e Quimeras

A assimetria da base de dados é uma fonte oculta de viés de interpretação.

Nem todos os espaços de referência são construídos da mesma forma. A classificação bacteriana beneficia frequentemente de um ecossistema maior e mais maduro de genomas, marcadores e recursos taxonómicos. A classificação fúngica melhorou substancialmente, mas o seu panorama de referência ainda é mais desigual e mais dependente de recursos focados em locos curados. O UNITE é uma grande força para a identificação fúngica porque se concentra na região ITS e organiza sequências em hipóteses de espécies com identificadores baseados em DOI, mas essa força também destaca a diferença estrutural: a interpretação fúngica é frequentemente mais dependente de recursos especializados, enquanto a classificação bacteriana recorre mais frequentemente a espaços de referência em escala genómica mais amplos.

Esta assimetria é importante porque a saída do classificador nunca é melhor do que a interação entre as leituras, o algoritmo e a referência. Uma atribuição bacteriana pode parecer mais forte em parte porque a paisagem de referência é mais profunda. Uma atribuição fúngica pode parecer mais fraca não apenas porque o organismo é raro, mas porque o espaço de referência mais próximo é mais fino, mais fragmentado ou menos padronizado para esse contexto analítico exato. A baixa confiança não é sempre uma propriedade da amostra. Muitas vezes, é uma propriedade da relação amostra-referência.

Reference Database and Classifier Asymmetry Map Figura 7. Mapa de Assimetria da Base de Dados de Referência e Classificador
Visão do ecossistema de referência sobre o apoio desigual a bases de dados bacterianas e fúngicas, mostrando como a profundidade da base de dados e a rota do classificador podem moldar a confiança na atribuição em conjuntos de dados de múltiplos reinos. A camada chave é a assimetria entre leituras e apoio de referência, não apenas o nome do software.

O desempenho do classificador depende tanto do método como do tipo de dados.

Kraken2, Centrifuge e QIIME2 são frequentemente mencionados juntos, mas resolvem problemas diferentes de maneiras distintas. O Kraken2 é um classificador baseado em k-mer projetado para atribuição taxonómica rápida com um uso de memória substancialmente reduzido em relação ao Kraken 1, mantendo alta velocidade e alta precisão. O Centrifuge também suporta classificação rápida em grande escala, mas utiliza uma estratégia de índice compacto para manter as exigências computacionais mais baixas, ao mesmo tempo que lida com grandes colecções de referências. O QIIME2 é diferente. É uma plataforma mais ampla de ciência de dados do microbioma, construída para fluxos de trabalho reprodutíveis de genes marcadores.

Esta distinção é importante porque os estudos de reinos mistos muitas vezes confundem a análise de genes marcadores com a análise de shotgun. O QIIME2 é apropriado quando os dados estão estruturados como perfilagem de comunidades baseada em marcadores. O Kraken2 e o Centrifuge são escolhas mais naturais quando o conjunto de dados é rico em leituras, não direcionado e metagenómico. Nenhum deles é universalmente o melhor. O seu desempenho depende da questão biológica, da construção de referência, do âmbito taxonómico e de se a entrada é derivada de amplicões ou de shotgun.

Tabela 2. Comparação prática entre Kraken2, Centrifuge e QIIME2 em estudos mistos de bactérias e fungos

Ferramenta Tipo de dado mais adequado Força do core Principal limitação em estudos de reinos mistos Melhor uso no contexto deste artigo
Kraken2 Leituras de espingarda Classificação de k-mer muito rápida com menos memória do que o Kraken 1 A confiança continua a depender da referência; referências fúngicas escassas reduzem a força da atribuição. Classificação ampla de primeira passagem em metagenomas mistos
Centrífuga Leituras de espingarda Indexação compacta com classificação eficiente de grandes bases de dados O sinal fúngico de baixa abundância pode continuar a ser fraco se o suporte de referência for limitado. Classificação de leitura eficiente em termos de recursos quando é necessária uma triagem ampla.
QIIME2 Fluxos de trabalho de genes marcadores Estrutura reproduzível e extensível para análise de microbiomas baseada em amplicões Não é um substituto direto para classificadores metagenómicos de shotgun. Workflows de 16S/ITS e análise estruturada de comunidades de amplicões

A lição chave não é que uma ferramenta vence. É que a escolha do classificador deve seguir a estrutura dos dados. Os fluxos de trabalho de marcadores perguntam: "Que sinal taxonómico este lócus capturou?" Os fluxos de trabalho de shotgun perguntam: "Como separam as leituras heterogéneas em unidades biológicas defensáveis?" Essas são perguntas relacionadas, mas não são a mesma pergunta.

Quimeras entre reinos podem criar uma falsa novidade.

As quimeras são uma verdadeira fonte de falsa diversidade, falsa riqueza e falsa novidade taxonómica, especialmente em fluxos de trabalho baseados em amplicões. Isso continua a ser importante na análise de amplicões de leitura longa, onde trabalhos recentes continuam a enfatizar a deteção de quimeras e o manuseio robusto de consensos. Se as quimeras não forem filtradas adequadamente, podem produzir sequências que se assemelham a táxons incomuns ou fraca-mente suportados, que se tornam especialmente difíceis de interpretar em conjuntos de dados mistos de bactérias e fungos.

O risco aumenta quando bibliotecas misturadas contêm uma abundância de templates altamente desigual ou quando múltiplos tipos de amplicões são processados em conjunto. Nesses casos, a abordagem mais segura é conservadora: combinar um forte pré-processamento, deteção explícita de quimeras e uma interpretação consciente da confiança, em vez de tratar cada variante de sequência como biologicamente significativa por padrão. Isso é especialmente importante quando o projeto visa avançar para a filogenómica.

Diferenciação Funcional: Metatranscriptómica e Secretómica

A taxonomia diz-lhe quem está lá. A função diz-lhe o que estão a fazer.

Em determinado momento, a diferenciação taxonómica deixa de ser suficiente. Um microbioma misto de bactérias e fungos pode ser claramente perfilado, mas a questão biológica mais importante pode ainda estar sem resposta. Qual reino está a processar ativamente o substrato? Quais organismos estão a impulsionar a decomposição, fermentação, produção de metabolitos secundários ou libertação de enzimas extracelulares? Quais táxons estão presentes mas inativos, e quais são de baixa abundância mas dominantes a nível transcricional? Métodos focados na função tornam-se úteis quando a questão de investigação muda de composição para atividade.

A metatranscriptómica é especialmente valiosa porque muda a análise do potencial genético estático para a atividade expressa. Pode resolver transcritos ativos em comunidades complexas, mas também exige um manuseio de RNA mais rigoroso, estratégias de depleção mais cuidadosas e uma disciplina analítica mais elevada do que o perfilamento baseado em DNA.

Quando vale a pena fazer metatranscriptómica?

Um bloco de decisão simples ajuda. A metatranscriptómica vale a pena ser feita. quando a composição da comunidade sozinha não consegue explicar a rotatividade do substrato, quando táxons de baixa abundância podem ainda ser funcionalmente dominantes, ou quando o projeto precisa de evidências da implementação ativa de vias em vez de apenas da presença de genes. A secretómica pode ser mais direta. quando a questão central é a libertação de enzimas extracelulares ou a abertura de substrato fora da célula. Os dois são mais fortes juntos. quando os investigadores precisam tanto da intenção transcricional como da execução extracelular. A taxonomia por si só é muitas vezes suficiente. quando o projeto ainda está na fase inicial de triagem comunitária ou quando a seleção de métodos ainda não justificou a amostragem de qualidade RNA.

Em microbiomas ambientais e industriais, esta distinção é útil. As bactérias frequentemente dominam a rápida rotatividade de substratos solúveis e muitas transformações associadas à fermentação. Os fungos muitas vezes contribuem de forma desproporcional para a decomposição de materiais recalcitrantes e a liberação de enzimas extracelulares que abrem substratos complexos. Essas são tendências amplas, não regras absolutas, mas explicam por que o perfilamento entre reinos muitas vezes precisa de uma camada funcional uma vez que a fase descritiva está concluída.

Para acompanhamento focado na atividade, Sequenciação Metatranscriptómica é a escolha principal, enquanto RNA-Seq pode apoiar uma caracterização mais ampla a nível de transcrição, dependendo do desenho do estudo.

Perspectiva de Encerramento

A análise justa de reinos mistos começa na extração, é limitada pelo design do ensaio e torna-se verdadeiramente robusta apenas quando as camadas taxonómicas, genómicas e funcionais estão alinhadas. Em outras palavras, o verdadeiro desafio não é apenas separar bactérias de fungos. É decidir quanta equidade biológica, contexto genómico e evidência funcional a questão de pesquisa realmente requer, e depois escolher o fluxo de trabalho mais leve que ainda possa fornecer essa resposta sem forçar um reino a ficar em segundo plano.

Perguntas Frequentes

1. Quando é que a combinação de 16S + ITS é suficiente e quando é que um projeto necessita de um seguimento por shotgun?

O 16S + ITS emparelhado é geralmente suficiente para triagem rápida específica de reinos, comparação composicional ampla e classificação de amostras em grandes coortes. O sequenciamento shotgun torna-se necessário quando a questão muda para conteúdo genético, atribuições de marcadores ambíguas, desconvolução de leituras mistas ou evidências mais robustas em contexto genómico para interpretação entre reinos.

2. Quais sinais sugerem que a perda do sinal fúngico é causada pela extração em vez de uma verdadeira baixa abundância?

Três sinais de alerta são comuns: o sinal fúngico varia drasticamente entre réplicas técnicas, a microscopia sugere esporos ou hifas que a sequenciação mal detecta, e a recuperação fúngica melhora desproporcionalmente após lise mais forte ou pré-tratamento assistido por enzimas. Esses padrões geralmente apontam para um viés de liberação, e não para uma verdadeira ausência.

3. Quando é que leituras longas melhoram materialmente a resolução mista de bactérias e fungos?

Leituras longas são mais importantes quando leituras curtas não conseguem manter a continuidade do locus, quando as montagens permanecem fragmentadas, quando são necessárias regiões ribossómicas mais longas, ou quando o projeto está explicitamente a passar de uma taxonomia baseada em marcadores para uma colocação filogenómica consciente do genoma.

4. Por que é que as atribuições fúngicas são frequentemente menos confiantes do que as atribuições bacterianas?

Parte da razão é a assimetria de referência. A classificação bacteriana muitas vezes beneficia de um suporte de referência mais profundo e amplo. A classificação fúngica depende mais de recursos especializados, como o UNITE, e pode tornar-se menos estável quando as referências mais próximas são escassas ou irregulares.

5. A escolha do classificador deve ser baseada no organismo ou no tipo de dados?

Principalmente no tipo de dados. O QIIME2 é mais adequado para fluxos de trabalho de amplicon estruturados. O Kraken2 e o Centrifuge são mais adequados para a classificação de leituras shotgun. O organismo ainda é importante porque o suporte de referência difere entre os reinos, mas a primeira decisão é se o conjunto de dados é baseado em marcadores ou metagenómico.

6. Quando é que a sequenciação de amplicões quantitativos absolutos vale a pena considerar?

É mais útil quando a distorção da abundância relativa é parte do problema e o estudo necessita de um suporte mais forte para a comparação de abundância entre amostras, em vez de apenas a composição dentro da amostra. Adiciona menos valor quando a principal incerteza ainda é a equidade da extração ou a adequação do alvo.

7. Quando deve um projeto adicionar metatranscriptómica?

Quando a questão principal passa de "quem está presente" para "quem está ativo", especialmente quando táxons de baixa abundância podem ainda ser funcionalmente dominantes ou quando a implementação de vias é mais importante do que o conteúdo genético existente. É menos útil na fase inicial de triagem, onde a composição e a robustez do fluxo de trabalho ainda precisam ser estabelecidas primeiro.

8. Por que é que as verificações de quimeras são especialmente importantes em trabalhos de comunidades mistas?

Porque as quimeras podem criar uma falsa novidade. Em bibliotecas mistas, especialmente bibliotecas de amplicões, sequências artefatuais podem parecer táxons raros ou fracos. Isso torna-se especialmente perigoso quando os investigadores estão a interpretar sinais fúngicos fracos ou a fazer afirmações filogenómicas de maior resolução.

Referências:

  1. A base de dados UNITE para identificação molecular e comunicação taxonómica de fungos e outros eucariotos: sequências, táxons e classificações reconsideradas. Pesquisa em Ácidos Nucleicos. 2024;52(D1):D791-D797.
  2. Análise metagenómica melhorada com Kraken 2. Biologia do Genoma2019;20:257.
  3. Centrífuga: classificação rápida e sensível de sequências metagenómicas. Pesquisa Genómica. 2016;26(12):1721-1729.
  4. Ciência de dados do microbioma reproduzível, interativa, escalável e extensível usando QIIME 2. Biotecnologia da Natureza. 2019;37(8):852-857.
  5. Revelar a diversidade microbiana: aproveitando o sequenciamento de longas leituras para a análise do microbioma. Métodos da Natureza. 2024.
  6. Desvendando a metagenómica através do sequenciamento de longas leituras: uma revisão abrangente. Revista de Medicina Translacional2024;22:646.
  7. Metatranscriptómica para Compreender o Microbioma na Ciência dos Alimentos e Nutrição. Metabolitos2025;15(3):185.
  8. Libertando-se de referências: uma abordagem baseada em consenso para o perfilamento de comunidades com dados de nanopore de longas ampliconas. Briefings em Bioinformática2025;26(1):bbae642.
  9. Análise Comparativa de Diferentes Métodos de Extração de DNA quanto à Adequação para Sequenciação Metagenómica de Longa Leitura com Nanoporos. Fronteiras em Microbiologia Celular e de Infeção. 2022;12:919903.
  10. Impacto das técnicas de extração de DNA e abordagens de sequenciação na precisão do perfilamento de comunidades microbianas.. Fronteiras em Microbiomas. 2025;4:1688681.
  11. Avanços e Desafios na Análise Metatranscriptómica. Fronteiras em Genética. 2019;10:904.

Apenas para uso em investigação. Não para uso em procedimentos de diagnóstico.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo