Sequenciação de RNA de Célula Única: Controlo de Qualidade

Atualmente, o sequenciamento de RNA de célula única emergiu como um tema proeminente e oportuno. Oferece insights inestimáveis que não são alcançáveis através do sequenciamento de RNA em massa tradicional, especialmente quando se trata de investigar biologia do desenvolvimento, biologia tumoral, imunidade e campos relacionados. No cerne do sequenciamento de célula única encontram-se as técnicas de redução de dimensionalidade T-sne e de agrupamento, que facilitam a exploração e análise de dados. No entanto, é crucial enfatizar que o sucesso ou fracasso de toda a análise depende fortemente de medidas de controlo de qualidade meticulosas realizadas antes destes passos. Neste artigo, fornecemos uma visão abrangente do controlo de qualidade de célula única.

Vários fatores influenciam as preferências na sequenciação de RNA de célula única, incluindo:

  • Preferências de amplificação: Certos mRNAs altamente expressos podem encontrar limitações durante o processo de amplificação.
  • Taxas de abandono: Alguns mRNAs podem não amplificar, levando à sua omissão da análise.
  • Explosões transcricionais: A natureza esporádica da atividade transcricional pode afetar a precisão das medições.
  • Ruído de fundo: Sinais indesejados e ruído técnico podem obscurecer os sinais biológicos desejados.
  • Preferências influenciadas pelo ciclo celular e pelo tamanho celular: Variações nos estágios do ciclo celular e nos tamanhos celulares podem impactar os resultados de sequenciação.
  • Efeito de lote: Discrepâncias resultantes de diferentes lotes experimentais podem introduzir vieses e dificultar comparações precisas.
  • Análise de correlação após replicação técnica da mesma amostra: A replicação de procedimentos técnicos permite avaliar a fiabilidade e a reprodutibilidade dos resultados.

Ao compreender e abordar estas preferências, os investigadores podem melhorar a fiabilidade e a validade dos estudos de sequenciação de RNA de célula única.

Considerações-chave para a Separação de Células em Sequenciação de Células Únicas

Antes de realizar o sequenciamento de células individuais, é essencial separar as células de forma eficaz. A falha em fazê-lo dentro de um prazo limitado pode afetar negativamente a integridade celular, resultando potencialmente em vazamento de RNA das células. Aqui estão vários fatores importantes a ter em conta ao isolar células individuais de tecidos:

  • Separação Celular Incompleta: É possível que várias células adiram umas às outras durante o processo de separação.
  • Dano Celular e Degradação de RNA: Condições inadequadas de separação celular podem prejudicar as células, levando à degradação ou fuga de RNA.
  • Sinal de Fundo de Vazamento de RNA: O vazamento de RNA durante a separação celular pode contribuir para sinais de fundo indesejados.
  • Isolamento de Células com Viés: O procedimento de isolamento de células pode introduzir viés, onde tipos celulares específicos são isolados de forma preferencial. Além disso, o próprio processo pode induzir alterações na expressão génica.

Portanto, ao analisar os resultados de agrupamento, é crucial examinar minuciosamente se existem genes que apresentam padrões de expressão específicos em determinados grupos celulares, o que pode ser atribuído ao experimento de separação celular.

Classificação de Células

Quando se trata de separação de células, encontramos vários desafios, incluindo:

  • Distribuição celular inconsistente: Os métodos de sequenciação de células únicas existentes frequentemente enfrentam o problema de encontrar gotas ou poços vazios, bem como casos em que várias células estão presentes dentro de uma única gota.
  • Preferências de tamanho celular: Muitos ensaios de célula única exibem uma preferência por tamanhos celulares específicos. Por exemplo, técnicas como o dropseq impõem um limite superior ao tamanho das células.
  • Preferências de tipo celular: Frequentemente há uma preferência por classificar tipos celulares específicos em experiências de célula única.
  • Dano celular e ruído de fundo: Experimentos de triagem prolongados podem danificar as células e introduzir ruído de fundo, o que pode afetar a qualidade dos dados obtidos.

Para abordar estes desafios, foram desenvolvidas diferentes estratégias para sequenciar células individuais. É crucial selecionar cuidadosamente a estratégia de célula única apropriada para estudar tecidos específicos. Além disso, a baixa qualidade celular ou a presença de células mortas ou detritos celulares podem resultar na encapsulação de múltiplas células dentro de gotículas. Durante a análise de dados subsequente, estas gotículas podem formar um cluster distinto ou aparecer enriquecidas entre dois grupos celulares.

Para determinar a presença de gotículas contendo múltiplas células, os seguintes critérios são tipicamente utilizados:

  • Valor elevado de códigos de barras moleculares: Um valor elevado de código de barras molecular indica a probabilidade de uma gotícula conter várias células.
  • Identificação de células caracterizadas por múltiplas populações celulares: Populações celulares específicas que exibem características de múltiplos tipos celulares podem ser indicativas de gotículas contendo várias células.
  • No caso da sequenciação de RNA de célula única 10X, a proporção de duplicados pode ser prevista, o que se correlaciona diretamente com o número de células presentes.

Atualmente, várias ferramentas de software estão disponíveis para ajudar na identificação de duplicatas, como:

  • DoubletFinder
  • Scrublet
  • DoubletDecon
  • DoubletCluster/DoubletCell no Scran

Estes algoritmos de deteção de duplicados apresentam semelhanças na sua abordagem e seguem um princípio básico que consiste nos seguintes passos:

  • Fusão aleatória de células: Duas células são fundidas aleatoriamente para simular dupletos.
  • Redimensionalização e agrupamento de dados: Os dados fundidos são redimensionados e agrupados para identificar grupos de células.
  • Remoção de duplicados identificados: As células que se agrupam com os duplicados simulados são identificadas e, posteriormente, removidas da análise.

Lise celular

Antes de realizar o sequenciamento de célula única, é necessário lisar as células. As condições de lise variarão dependendo dos tecidos celulares que estão a ser estudados. Se as condições de lise forem excessivamente rigorosas, isso afetará negativamente a preparação da biblioteca.

Transcrição Reversa

A eficiência da transcriptase reversa é de extrema importância. A taxa de abandono varia normalmente entre 60% a 90%. Em casos onde a mesma linha celular é processada da mesma forma, mas utilizando duas bibliotecas diferentes, a taxa de abandono pode apresentar variações significativas.

Processo de Amplificação

Cada etapa de amplificação pode introduzir vieses. Muitas técnicas de sequenciação do transcriptoma de células únicas utilizam códigos de barras moleculares como uma medida para ajudar a corrigir os vieses induzidos pela amplificação. No entanto, transcriptomas de comprimento total, como o SmartSeq2, não possuem códigos de barras moleculares, tornando impossível corrigir as preferências de amplificação utilizando métodos baseados em códigos de barras moleculares.

Preparação de Biblioteca e Sequenciação

Utilizando RNAs spike-in, uma coleção de transcritos de RNA com sequências conhecidas, o processo de construção da biblioteca envolveu a adição de moléculas spike-in em concentrações conhecidas. Este conjunto de spike-ins incluía:

  • ERCC: Compreendendo 92 RNAs derivados de várias bactérias, com diferentes comprimentos e conteúdos de GC, que foram incorporados em 22 concentrações distintas.
  • SIRV: Consiste em 69 transcritos sintéticos projetados para imitar genes humanos. É utilizado principalmente para validar a capacidade dos resultados de sequenciação em detectar isoformas dentro dos genes humanos.

Aplicações de Spike-ins:

  • Remoção de Ruído Técnico: Spike-ins ajudam a eliminar o ruído técnico presente durante a preparação da biblioteca e os procedimentos de sequenciação.
  • Deteção da Eficiência de Captura: Eles facilitam a avaliação da eficiência de captura, medindo quão eficazmente os RNAs-alvo são capturados.
  • Cálculo da Iniciação de RNA: Os spike-ins ajudam a calcular as taxas de iniciação de RNA, contribuindo para a compreensão da atividade transcricional.
  • Normalização de Dados: Eles permitem a normalização de dados, garantindo comparações precisas entre diferentes amostras.

Limitações dos Spike-ins:

Apesar da sua utilidade, os spike-ins ainda diferem dos genes endógenos, particularmente em termos de preferência de amplificação. Esta disparidade deve ser considerada ao interpretar os resultados. Além disso, os spike-ins geralmente não são utilizados nas metodologias drop-seq.

Pontos de Controlo de Qualidade da RNA-Seq de Células Únicas

Normalmente, os pontos de controlo para o controlo de qualidade (CQ) incluem o seguinte:

  • Taxa de Correspondências Únicas
  • Proporção de Correspondências para Regiões Exónicas
  • Preferência em Transcritos de Comprimento Total de Células Únicas 3'
  • Leituras Correspondentes ao mRNA
  • Rácio de Códigos de Barras Moleculares/Leituras
  • Número de Genes Detetados
  • Deteção de RNA Spike-in
  • Relação entre RNA Mitocondrial e RNA Ribossomal

Uma baixa proporção ou um baixo número de leituras pode ser atribuído a problemas na construção da biblioteca. Um baixo número de leituras pode resultar de uma maior formação de dímeros de primers, enquanto uma baixa proporção é tipicamente indicativa de problemas durante a construção da biblioteca.

A ausência de sequências de RNA spike-in indica diretamente uma falha na construção da biblioteca. No entanto, se o spike-in for normal e a célula apresentar um baixo número de sequências de RNA, isso pode ser devido ao pequeno tamanho da célula ou a danos na célula antes da construção da biblioteca.

O número de genes detectados está diretamente ligado ao tamanho da célula. Se um número excessivo de genes (códigos de barras moleculares) for detectado, é provável que múltiplas células estejam presentes dentro do gota. No entanto, não se pode descartar que a própria célula seja simplesmente muito grande. Como mostrado abaixo, ter genes em excesso ou em falta não é considerado normal.

Geralmente, existe uma correlação positiva entre o tamanho da célula, a razão de RNA spike-in e o número de genes detetados. Níveis elevados de RNA mitocondrial também indicam uma célula danificada. Quando uma célula se rompe, o RNA citoplasmático é libertado, mas o RNA mitocondrial permanece encapsulado dentro da membrana mitocondrial. Portanto, quando a membrana celular está danificada, a percentagem de RNA mitocondrial torna-se elevada. Nota: Este fenómeno também pode ocorrer durante a apoptose ou necrose.

Altos níveis de RNA ribossómico podem indicar um aumento da degradação de RNA dentro da célula. Em transcriptomas de células únicas de comprimento total, a preferência pelo 3' pode ser utilizada para identificar uma degradação substancial de RNA dentro da célula.

Como filtrar células

Normalmente, a maioria das células terá a mesma tendência, e combinamos várias métricas para remover algumas das células que não qualificam. Portanto, dê uma olhada na distribuição dos dados antes de decidir quais células precisam ser filtradas.

Com base na PCA, este algoritmo também pode ser utilizado para QC para encontrar células que claramente não estão agrupadas com outras células. Estas células são consideradas aquelas que não cumprem os padrões de controlo de qualidade.

Como Filtrar Genes

O próximo passo é discutir como filtrar os genes; na grande maioria dos casos, não utilizaremos todos os genes para realizar uma análise de redução de dimensão, por isso é necessária uma seleção de conjuntos de genes.

O conjunto de genes é definido com base em:

  • Genes com expressão acima de um determinado limiar
  • Genes com variação diferencial na amostra celular
  • Usando conhecimento a priori para selecionar genes
  • Genes diferenciais que foram identificados em sequenciação de RNA em massa.

Apenas os primeiros PCs são selecionados para a redução de dimensionalidade t-SNE.

Como Abordar Efeitos de Lote

Um dos problemas mais desafiadores na sequenciação de RNA de célula única gira em torno dos efeitos de lote. Os efeitos de lote podem manifestar-se em vários cenários, tais como:

  • Experimentos distintos realizados em diversos animais, pacientes ou células.
  • Várias pistas de sequenciação foram utilizadas durante os experimentos.

Para mitigar os efeitos de lote, é essencial estabelecer padrões de controlo de qualidade distintos para diferentes lotes de amostras. Uma abordagem envolve a utilização da análise de componentes principais (PCA) para identificar quaisquer efeitos de lote conspícuos nos resultados obtidos.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo