Introdução à Metagenómica Shotgun, desde a Amostragem até à Análise de Dados

O que é Metagenómica de Shotgun

Metagenómica é a ciência que se aplica sequenciação de alto rendimento tecnologias e bioinformática ferramentas para obter diretamente o conteúdo genético de uma comunidade microbiana sem a necessidade de isolar e cultivar as espécies microbianas individuais. Metagenómica permite que os investigadores não só estudem a composição genética funcional de comunidades microbianas, mas também realizem pesquisas evolutivas. A metagenómica tem sido utilizada para identificar novos biocatalisadores ou enzimas e gerar novas hipóteses sobre a função microbiana, o que é uma ferramenta poderosa e prática. Comparado a Sequenciação de amplicões 16S/18S/ITSa metagenómica, que pode fornecer mais informações sobre o potencial funcional das comunidades microbianas e sequências de genoma completo. O rápido desenvolvimento e a substancial diminuição de custos no sequenciamento de alto rendimento têm promovido dramaticamente o desenvolvimento de sequenciação metagenómica shotgun.

Este artigo fornece uma visão geral de metagnómica, desde a amostragem até à análise de dados. Um projeto típico de metagenómica envolve preparação de amostras, sequenciação e análise de dados (incluindo montagem, agrupamento, anotação, análise estatística e submissão de dados).

Figure 1. Flowchart illustrating a standard metagenome project.Figura 1. Diagrama de fluxo de um projeto típico de metagenoma.

Como Funciona a Metagenómica de Shotgun

Preparação de amostras

A preparação da amostra envolve geralmente duas etapas: a coleta da amostra e a extração de DNA, ambas as quais podem afetar a qualidade e a precisão de metagenómico experimentos. Estão disponíveis kits comerciais para a coleta de amostras e isolamento de ADN. Os seus principais objetivos são coletar biomassa microbiana suficiente para sequenciação e minimizar a contaminação. Ao trabalhar com amostras de baixa biomassa, devem ser utilizados reagentes ultralimpas e controlos de sequenciação "em branco" para minimizar sinais menos "reais".

Preparação de bibliotecas e sequenciação

Comum sequenciação de alto rendimento as plataformas incluem sistemas Illumina, Roche 454, instrumentos Ion Torrent e PacBio SMRT sistemas.

Frey et al. (2014) avaliaram a capacidade de três sequenciação de nova geração (NGS) plataformas (Illumina MiSeq, Roche 454 Titanium e Ion Torrent PGM) para identificar um patógeno de baixa titulação (viral ou bacteriano) numa amostra de sangue clinicamente relevante. Descobriram que as plataformas Ion Torrent PGM e Illumina apresentam um melhor desempenho na identificação de espécies microbianas escassas, e para amostras bacterianas, apenas a plataforma MiSeq conseguiu fornecer leituras que foram classificadas de forma inequívoca como originárias de Bacillus anthracis.

A plataforma Illumina tornou-se dominante para sequenciação metagenómica shotgun devido aos seus outputs muito elevados (até 1,5 Tb por corrida), alta precisão (taxa de erro entre 0,1-1%) e ampla disponibilidade. Os instrumentos Ion Torrent e PacBio SMRT os instrumentos estão a tornar-se concorrentes difíceis no campo. As plataformas Illumina diferem principalmente na produção total e no comprimento máximo de leitura. O Illumina HiSeq 2500 (2x250 nt, 180 Gb de saída ou 2x125 nt, 1Tb de saída) é uma escolha clássica para metagenómica. Os sistemas HiSeq 3000 e 4000 mais recentes aumentam o rendimento de uma corrida, mas estão limitados ao comprimento de leitura (150 nt). Os instrumentos MiSeq geram apenas até 15Gb no modo 2x300, mas ainda são úteis para estudos de microbioma de gene marcador único ou um número limitado de amostras.

Os instrumentos da Pacific Biosciences (PacBio), baseados na deteção em tempo real de moléculas únicas (SMRT) em poços de guia de onda em modo zero, oferecem comprimentos de leitura muito maiores (comprimentos de leitura médios de até 30 kb) do que NGS instrumentos. A sequenciação de leituras curtas (ou seja, NGS) tem uma capacidade limitada de montar regiões complexas ou de baixa cobertura, enquanto sequenciação metagenómica de leitura longa Através do sequenciamento SMRT da PacBio, é possível reconstruir um genoma de alta qualidade e fechado de uma espécie microbiana previamente não caracterizada a partir de amostras metagenómicas.

Análise de dados

  • Assembléia

Se a pesquisa visa obter CDS de comprimento completo ou recuperar genomas microbianos, então a montagem deve ser realizada para gerar contigs genómicos mais longos. A montagem pode ser dividida em duas estratégias: montagem baseada em referência e montagem de novo. A montagem baseada em referência é rápida e precisa, se o metagenómico o conjunto de dados inclui sequências onde estão disponíveis genomas de referência estreitamente relacionados. A montagem baseada em referência pode ser realizada com pacotes de software como Newbler, AMOS, MIRA. A montagem de novo requer maiores recursos computacionais. A abordagem do gráfico de De Bruijn é o método de montagem de novo de metagenomas mais popular.

Se a pesquisa visa o perfil taxonómico, não é necessário realizar montagem e agrupamento. Sem montagem. metagenómico A profilagem pode mitigar problemas de montagem e tornar possível a identificação de espécies de baixa abundância que não podem ser montadas de novo. A abordagem é limitada porque microrganismos previamente não caracterizados são difíceis de perfilar, mas o número de genomas de referência está a aumentar rapidamente.

  • Agrupamento

As montagens de metagenomas são apenas contigs fragmentados. Não sabemos de qual genoma cada contig deriva. Não sabemos sequer quantas espécies existem. O binning é o processo de agrupar contigs em espécies. Existem duas estratégias para binning, incluindo métodos baseados em composição e métodos baseados em similaridade. Os exemplos de algoritmos de binning baseados em composição incluem S-GSOM, Phylopythia, PCAHIER e TACAO. Os algoritmos baseados em similaridade incluem IMG/M, MG-RAST, MEGAN, CARMA, SOrt-ITEMS, MetaWatt, SCIMM e MetaPhyler. Alguns algoritmos consideram tanto a composição quanto a similaridade, como PhymmBL e MetaCluster.

  • Anotação

A anotação tem dois passos: identificação de genes e anotação funcional. Bases de dados que contêm combinações de famílias de proteínas anotadas manualmente e preditas computacionalmente podem ser utilizadas para genes e vias metabólicas de metagenomas. Bases de dados e ferramentas comuns estão resumidas na tabela seguinte.
Tabela 1. Bases de dados e ferramentas comuns para anotação de dados metagenómicos.

Bases de Dados/Ferramentas Detalhes
KEGG KEGG é um recurso de base de dados utilizado para compreender as funções e utilidades do sistema biológico.
UniProt A UniProt fornece um repositório de dados de sequências metagenómicas e permite visualizar análises taxonómicas e funcionais.
TIGRFAM TIGRFAMs é uma base de dados de definições de famílias de proteínas.
eggNOG eggNOG é utilizado para a identificação de grupos de genes ortólogos e anotação funcional. Outras bases de dados de grupos de genes ortólogos incluem KEGG, COG, M5NR e Metacyc.
SILVA SILVA é um recurso online para dados de sequências de RNA ribossómico de qualidade verificada e alinhada.
Greengenes Greengenes é uma combinação de uma base de dados de genes 16S rRNA verificados por quimeras e ferramentas.
RDP O Projeto de Base de Dados Ribossómica (RDP) inclui dados de sequências de genes de rRNA alinhados e anotados, bem como ferramentas.
pipeline HUMAnN HUMAnN é um pipeline para determinar com precisão a presença/ausência e abundância de vias microbianas a partir de dados metagenómicos.
CAZy A base de dados CAZY (Carbohydrate-Active enZYmes) pode ser utilizada para a previsão de genes que codificam enzimas ativas em carboidratos e para análises de correlação.
CARTÃO A base de dados abrangente de Resistência a Antibióticos (CARD) pode ser utilizada para a previsão de genes de resistência e análise de correlação.
MG-RAST MG-RAST é um servidor de aplicação web de código aberto para análise filogenética e funcional de metagenomas.

Conclusão

Desde inteiro Sequenciação de DNA a amostragem ambiental foi realizada pela primeira vez por equipas lideradas por Banfield e Venter em 2004, metagenómica shotgun tornou-se uma ferramenta indispensável para o estudo de comunidades microbianas. A diminuição do custo de sequenciação e o desenvolvimento de métodos computacionais promoveram a adoção generalizada da metagenómica.

O reino de metagenómica traz numerosas vantagens, embora não esteja isento de certos inconvenientes. Uma vantagem significativa inclui a capacidade de contornar os requisitos para a cultura microbiana, permitindo a extração e análise direta do DNA microbiano a partir de amostras ambientais. Isso evita com sucesso as limitações e preconceitos intrínsecos aos métodos de cultura tradicionais. Outra força de metagenómica reside na sua abrangência, permitindo uma compreensão profunda e rápida sobre a composição e as potencialidades funcionais das comunidades microbianas. Isso inclui microrganismos menos cultiváveis e genes com funções ainda desconhecidas. Além disso, oferece capacidades de análise de alta resolução para revelar a diversidade microbiana, estrutura e funcionalidades desde o nível individual até o nível comunitário. Adicionalmente, metagenómica ajuda na descoberta de novas espécies microbianas e genes funcionais, abrindo possibilidades para novas utilizações de recursos microbianos. Por fim, a metagenómica manifesta amplas perspetivas em áreas como ecologia, biomedicina, indústria e ambiente, apresentando um meio eficaz para enfrentar diversos conjuntos de problemas.

Enquanto metagenómica oferece insights notáveis, mas também apresenta uma série de desafios inerentes. Primordialmente, a enorme escala e complexidade dos dados em crescimento representam um desafio significativo à sua interpretação e análise, exigindo a aplicação de metodologias e técnicas especializadas e sofisticadas. A análise de dados requer recursos computacionais substanciais, incluindo ferramentas de software de nível profissional, que frequentemente acarretam despesas e compromissos de tempo significativos. Além disso, o processo de extração de amostras ambientais, repleto de sua complexidade inerente e potencial de contaminação, pode introduzir ruído extrâneo nos dados. Este ruído pode, por sua vez, comprometer a precisão dos resultados. O bioinformática a paisagem, com a sua variedade de desafios, incluindo a montagem de sequências, anotação funcional e análise da composição de espécies, sublinha a constante necessidade de aperfeiçoamento e melhoria do fluxo de trabalho.

Apesar destes desafios, o campo de metagenómica não obstante apresenta um imenso potencial. À medida que as tecnologias relacionadas com o sequenciamento continuam a avançar e os custos associados diminuem, a aplicação de sequenciação metagenómica shotgun é previsto que se torne cada vez mais omnipresente. Simultaneamente, esperamos que a evolução de bioinformática resultará em ferramentas e algoritmos de análise de dados mais eficientes e precisos. Isto, por sua vez, facilitaria uma interpretação e utilização melhoradas dos dados de sequenciação. Além disso, a amalgamação de metagenómico dados com outros conjuntos de dados ómicos, numa análise abrangente, promete revelar insights mais profundos sobre a funcionalidade e a interação dentro das comunidades microbianas. No panorama da investigação do microbioma médico, a metagenómica pode servir como uma ferramenta revolucionária para a medicina de precisão. Procura abrir novas avenidas para o diagnóstico, tratamento e prevenção melhorados de doenças. Olhando para a conservação ambiental e a biotecnologia, o futuro antecipado de metagenómica apresenta uma variedade de abordagens mais eficazes para avaliar os impactos ambientais, explorar recursos biológicos e realizar engenharia de bioprocessos.

Referências:

  1. Faust K, Lahti L, Gonze D, et al. Metagenómica encontra a análise de séries temporais: desvendando a dinâmica das comunidades microbianas. Opinião atual em microbiologia, 2015, 25: 56-66.
  2. Frey K G, Herrera-Galeano J E, Redden C L, et al. Comparação de três plataformas de sequenciação de próxima geração para sequenciação metagenómica e identificação de patógenos no sangue. BMC Genomics, 2014, 15(1): 96.
  3. Quince C, Walker A W, Simpson J T, et al. Metagenómica shotgun, da amostragem à análise. Biotecnologia da Natureza, 2017, 35(9): 833.
  4. Thomas T, Gilbert J, Meyer F. Metagenómica - um guia desde a amostragem até à análise de dados. Informática microbiana e experimentação, 2012, 2(1): 3.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo