Análise Bioinformática de Sequenciação de Amplicões de 16S rRNA

Este artigo fornece uma breve introdução às boas práticas para a análise bioinformática de Sequenciação de rRNA 16S por NGS (sequenciação de nova geração). O pipeline de bioinformática envolve duas etapas principais: o pré-processamento de dados (controlo de qualidade) e a quantificação (incluindo perfilagem taxonómica e perfilagem metagenómica preditiva).

Bioinformatics Analysis of 16S rRNA Amplicon Sequencing

Figura 1. Pipeline de bioinformática para sequenciação de amplicões de 16S rRNA baseada em NGS (Mataragas) et al.. 2018).

Tabela 1. Software e testes estatísticos utilizados em cada etapa do pipeline (Mataragas et al.. 2018).

Passo do pipeline Teste estatístico e software utilizados Software alternativo
Processamento Qiime v.1.9.0 Pipeline SILVAngs Pipeline BMPOS
Perfilamento taxonómico (OTUs) Pipeline SILVAngs utilizando a base de dados SILVA Pipeline BMPOS usando as bases de dados Greengenes Base de dados EzBioCloud Pipeline One Codex
Comparação estatística das amostras metagenómicas ANOSIM utilizando o software Past Carimbo MicrobiomeAnalyst Explicet
Visão geral da comunidade microbiana Analisador de Comunidade Gráfico de barras empilhadas utilizando o software GraphPad Prism MicrobiomeAnalyst Explicet
Significância estatística dos OTUs identificados METAGENassist MicrobiomeAnalyst Explicet
Relações simbióticas e antagónicas dentro da comunidade microbiana Mapa de calor utilizando o software METAGENassist MicrobiomeAnalyst Explicet
Perfilagem Metagenómica Preditiva (PMP) Tax4Fun Picrust Piphillin MicrobiomeAnalyst
Análise estatística dos resultados do PMP Teste H de Kruskal-Wallis com correção de Tuckey-Kramer para múltiplos testes de acordo com Benjamini-Hochberg Taxa de Falsos Descobrimentos utilizando o software Stamp MicrobiomeAnalyst
Orientação das amostras metagenómicas dos caminhos KEGG mais abundantes Análise de Componentes Principais (PCA) utilizando o software Past MicrobiomeAnalyst Selo
Interacções metabólicas dentro da comunidade microbiana MMinte -
  • Pré-processamento para eliminar dados não informativos

A remoção de adaptadores, primers de PCR e bases de baixa qualidade é um passo necessário para o controlo de qualidade das sequências. E foram desenvolvidas uma variedade de ferramentas integradas para este propósito. ‘Q’ é a pontuação de qualidade de saída para plataformas Illumina (Q10 representa que se espera 1 erro para cada 10 bases; Q20 representa que se espera 1 erro para cada 100 bases...). A eliminação de sequências com pontuações de qualidade baixa pode melhorar a precisão das análises bioinformáticas. Comparado com o sequenciamento shotgun, isto é mais significativo para o sequenciamento de amplicões de 16S rRNA. Para o sequenciamento do gene 16S rRNA, supõe-se que se deve estabelecer um limiar de qualidade o mais alto possível e aparar as sequências ao longo de todo o comprimento.

  • Classificação taxonómica de sequências bacterianas

Antes da classificação taxonómica, os genes 16S rRNA bacterianos são agrupados por duas abordagens principais. Uma é agrupar estas sequências em filótipos com base na sua semelhança a uma base de dados de referência, a outra é agrupar sequências em unidades taxonómicas operacionais (OTUs) utilizando um limiar de semelhança de 97%, apenas de acordo com a sua semelhança. As bases de dados de referência disponíveis para a anotação do gene 16S rRNA incluem a base de dados Greengenes, o projeto da base de dados ribossómica (RDP), SILVA e o projeto do microbioma humano (HMP).

  • Diversidade beta (β) para comparar microbiomas

A diversidade beta (β) mede a diferença na composição da comunidade bacteriana entre diferentes amostras. Antes de quantificar a diversidade β, as contagens de leituras (leituras mapeadas a cada táxon) devem ser normalizadas para minimizar a variabilidade técnica entre as amostras. Existem dois procedimentos de normalização comuns: a normalização pela soma total e a normalização pelo quartil superior.

Existem dois métodos principais para quantificar a β diversidade: a β diversidade filogenética, que considera as diferenças evolutivas entre comunidades (como o UniFrac), e métodos não filogenéticos ou baseados em táxons (como a dissimilaridade de Bray-Curtis). Uma vez determinadas as distâncias ou dissimilaridades entre amostras, estas podem ser ordenadas num espaço de baixa dimensão para ilustrar melhor quão intimamente relacionadas estão entre si. As duas ferramentas de ordenação mais utilizadas são as análises de coordenadas principais (PCoA) e a escalagem multidimensional não métrica (NMDS).

Bioinformatics Analysis of 16S rRNA Amplicon Sequencing

Figura 2. NMDS e PCoA para quantificação da diversidade beta (Jovel) et al.. 2016).

  • Perfilagem metagenómica preditiva

A tabela de abundância de OTUs pode ser utilizada para presumir funções metabólicas. É um processo para entender o papel do microbioma no metabolismo do hospedeiro e na doença. Atualmente, existem três ferramentas poderosas para o perfilamento de metagenómica preditiva (PMP): PICRUSt, Tax4Fun e Piphillin.

Perspectivas futuras

Sequenciação de amplicões de rRNA 16S é popular devido às suas características de custo-efetivo, eficácia temporal e informativas. Mas também é limitado por várias desvantagens. Primeiro, o 16S é bem adequado para múltiplos pacientes e estudos longitudinais, mas fornece informações taxonómicas e funcionais limitadas. Em segundo lugar, a amplificação por PCR de diferentes regiões do gene 16S rRNA pode gerar resultados discordantes, não apenas devido às diferentes afinidades de ligação para as regiões conservadas flanqueadoras correspondentes, mas também devido à resolução de cada região variável entre os táxons. Portanto, sequenciação de rRNA 16S de comprimento total ou metagenómica de shotgun pode às vezes ser mais favorável, especialmente este último.

Referências:

  1. Mataragas M, Alessandria V, Ferrocino I, et al.Um pipeline de bioinformática que integra perfis metagenómicos preditivos para a análise de dados de sequenciação de 16S rDNA/rRNA originados de alimentos. Microbiologia dos Alimentos, 2018.
  2. Yang B, Wang Y, Qian P Y. Sensibilidade e correlação das regiões hipervariáveis nos genes 16S rRNA na análise filogenética. BMC bioinformática, 2016, 17(1): 135.
  3. Jovel J, Patterson J, Wang W, et al.Caracterização do microbioma intestinal utilizando metagenómica 16S ou shotgun. Fronteiras em microbiologia, 2016, 7: 459.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo