Nos últimos anos, avanços tecnológicos em genómica de célula única e genómica espacial abriram novas vias para estudos de mapeamento celular e de tecidos na saúde e na doença. A identificação precisa de estados celulares na doença utilizando genómica de célula única pode fornecer insights sobre a patogénese, biomarcadores e potenciais alvos terapêuticos. A abordagem padrão para identificar estados celulares envolve a análise combinada de dados de sequenciação de RNA de célula única (scRNA-seq) de tecidos doentes e de referência saudáveis. Dentre estes, a seleção de conjuntos de dados de referência saudáveis é crítica.
Atualmente, o Consórcio do Atlas de Células Humanas realizou análises em grande escala de amostras saudáveis e publicou conjuntos de dados unificados em grande escala ou conjuntos de dados de atlas de múltiplos órgãos, mas as características das amostras incluídas neste atlas podem ser muito diferentes das amostras em coortes de doenças. A coleta de amostras de controlo de tecidos saudáveis que correspondam a amostras de doenças com características demográficas e clínicas semelhantes pode reduzir significativamente os erros de informação devido a fatores de confusão.
A equipa de investigação avaliou como a escolha do atlas de referência de células únicas afeta a identificação de alterações no estado celular a partir de dados de scRNA-seq de amostras de doença. Utilizando dados de transcriptoma de células únicas disponíveis publicamente, foi criado um atlas de referência de células únicas a partir de indivíduos saudáveis, confirmando que a utilização do atlas para aprendizagem de espaço latente (LST) e análise de diferença em diferença de controlos emparelhados identifica melhor as células associadas à doença, particularmente múltiplos tipos celulares perturbados. Este estudo fornece orientações para o desenho de estudos de coorte de doenças e otimização do uso de atlases celulares.
Utilizando conjuntos de dados de referência saudáveis para descobrir estados celulares associados a doenças. (Dann et al., 2023)
A equipa de investigação utilizou conjuntos de dados de scRNA-seq disponíveis publicamente de 90 pacientes com COVID-19 e 23 PBMCs de dadores saudáveis; e selecionou perfis de scRNA-seq de 1.219 indivíduos saudáveis de 12 estudos como o conjunto de dados de mapeamento; potencialmente incorporados utilizando perfis de PBMC saudáveis (design ACR) foram comparados a um conjunto de dados de mapeamento utilizando apenas COVID-19 e um conjunto de dados de controlo com uma incorporação combinada (design CR) foram comparados a um conjunto de dados de controlo. Para quantificar a capacidade dos diferentes designs em identificar estados associados à doença, a equipa examinou células que expressam genes relacionados com a via de sinalização do interferão (IFN), uma via de resposta antiviral chave e um marcador reconhecido para COVID-19.
Ao integrar dados da coorte de COVID-19 e do atlas celular PBMC, a equipa descobriu que a utilização de um design ACR permitiu uma identificação mais sensível de estados celulares patológicos transitórios e heterogéneos. Dentro do conjunto de dados de COVID-19, a equipa capturou o estado IFNhi de diferentes tipos de células imunes, bem como subdividiu subpopulações de monócitos CD14+ disfuncionais que correlacionavam com a gravidade da doença.
Deteção de estados celulares associados à COVID-19 em uma coorte caso-controlo com um atlas saudável. (Dann et al., 2023)
Para avaliar os benefícios de usar perfis de células únicas e conjuntos de dados de controlo em outros contextos biológicos, a equipa de investigação analisou conjuntos de dados de scRNA-seq de amostras de tecido pulmonar de 32 pacientes com fibrose pulmonar idiopática (FPI) e investigou o estado da doença da fibrose pulmonar utilizando perfis de células únicas de tecido pulmonar saudável. O estudo incluiu dados de 28 doadores de controlo e 18 pacientes com doença pulmonar obstrutiva crónica (DPOC), e o conjunto de dados central do Atlas de Células Pulmonares Humanas (HLCA) foi selecionado como o conjunto de dados do atlas.
A equipa de investigação utilizou um design ACR para analisar os dados dos pacientes com FPI e identificou dois estados celulares basocelulares anormais raros associados à doença, células basocelulares KRT5-KRT17+ e células basocelulares KRT5+KRT17hi. As células acima foram caracterizadas separadamente para identificar genes diferencialmente expressos (GDEs) que estavam diferencialmente expressos no estado basocelular anormal e superexpressos em comparação com células basocelulares normais. Um total de 981 GDEs significativos foram identificados, incluindo 6 marcadores de células basocelulares anormais KRT17hi e 35 marcadores de células basocelulares previamente descritos, aumentando a compreensão do fenótipo celular basocelular na FPI.
Deteção de estados celulares associados à FPI. (Dann et al., 2023)
Referência: