Análise Multi-Ómica: Sequenciação de Amplicões 16S/18S/ITS e Transcriptómica
Sequenciação de Amplicões 16S/18S/ITS
sequenciação da diversidade microbiana, também conhecida como sequenciação de amplicons, aproveita tecnologias de alta capacidade de sequenciação de próxima geração para sequenciar sequências genéticas como 16S rRNA/ITS. Este método permite a deteção simultânea de espécies dominantes, raras e não identificadas numa amostra. Fornece informações sobre a composição e abundância relativa das comunidades microbianas dentro da amostra.
Transcritosómica
O transcriptoma, abrangendo todos os RNAs transcritos por uma espécie, tecido ou tipo celular específico, é estudado através de sequenciação de alto rendimento. Esta abordagem captura rapidamente todo o conjunto de transcritos em uma célula ou tecido particular, auxiliando na análise da estrutura e função dos genes, splicing variável e na previsão de novos transcritos. Além disso, destaca-se na deteção de transcritos de baixa abundância e novos.
As investigações sobre as relações entre micróbios e órgãos-alvo, como os eixos cérebro-intestino e fígado-intestino, são proeminentes. Integrar micróbios e alvos transcriptomas de órgãos permite uma compreensão abrangente, ligando alterações microbianas a alterações transcripcionais e proporcionando informações valiosas.
Diversidade Microbiana e Análise de Transcriptómica
A diversidade microbiana e a análise multi-ômica de transcriptómica esforçam-se por identificar biomarcadores chave, sugerir relações inter-amostrais e revelar a significância biológica ao considerar de forma abrangente tanto os dados microbianos como os dados de transcrição.
Os nossos serviços e relatórios de multi-ómicas estão divididos em três partes principais. A parte inicial avalia as multi-ómicas como um todo e analisa a qualidade dos dados. A segunda parte foca na identificação de genes marcadores chave, enquanto a terceira parte realiza análises de correlação para ilustrar o nível de correlação entre substâncias distintas.
Análise de Agrupamento de Amostras
Os dados da coorte original passaram por normalização de desvio padrão (Normalização Z-Score) e normalização de quantis (Normalização de Quantis) antes de serem fundidos. Subsequentemente, foram aplicadas técnicas de clustering de redução de dimensionalidade para visualizar as inter-relações entre as amostras, avaliar o agrupamento das amostras e medir a reprodutibilidade intra-grupo. Dois métodos de redução de dimensionalidade, nomeadamente PCA (não supervisionado) e LDA (supervisionado), foram selecionados. Os resultados após a redução de dimensionalidade pelo PCA foram posteriormente utilizados em clustering hierárquico. Por fim, foi utilizada projeção de ajuste linear para ilustrar as variações entre diferentes ómicas dentro dos grupos.
Para avaliar ainda mais a capacidade discriminativa das características de multigrupos na distinção de agrupamentos de amostras, foi construído um modelo de floresta aleatória utilizando as características de multigrupos normalizadas. O desempenho de classificação do modelo foi avaliado utilizando curvas ROC para determinar se as características de multigrupos preveem efetivamente agrupamentos de amostras distintos. Este modelo de floresta aleatória também desempenhou um papel fundamental na seção subsequente dedicada à triagem de biomarcadores.
Triagem de Biomarcadores
Empregando uma abordagem de floresta aleatória, avaliámos a significância de cada substância dentro dos micróbios e transcritos em relação ao subgrupo presente. Pontuações de importância mais altas sugerem que uma substância tem maior probabilidade de servir como um biomarcador que distingue o subgrupo atual. Os 30 principais biomarcadores, classificados por importância, foram escolhidos para reconstruir o modelo de Random Forest. As curvas ROC foram geradas através de validação cruzada envolvendo 20 permutações aleatórias.
Cada permutação envolveu a divisão dos dados em um conjunto de treino e um conjunto de validação (proporção 1:1). Um modelo de floresta aleatória foi construído usando o conjunto de treino e, em seguida, aplicado para prever o conjunto de validação. Em casos com mais de dois grupos de amostras (>2), foi utilizado o método de micro-média para converter os resultados de multi-classificação em classificação binária. A eficácia da classificação do modelo foi avaliada pela área sob a curva ROC, onde uma área maior indica um efeito de classificação superior.
Análise de Correlação
A análise de correlação das diferenças materiais entre várias omicas revela associações inter-histológicas. Inicialmente, examinámos de forma independente dados microbianos e genéticos, focando nas 1000 entradas de dados com o valor absoluto mais substancial de log2 (FoldChange). Esta seleção foi feita garantindo a conformidade com os critérios de significância da análise original de diferenças de uma única ómica. Em casos onde o conjunto de dados tinha menos de 1000, todas as entradas foram incluídas.
É digno de nota que, ao comparar vários grupos, o processo de triagem seguiu a significância (valor p) derivada da análise de diferenças original. Subsequentemente, foram calculados os coeficientes de correlação par a par para todas as entradas de dados de microrganismos e genes.