Sequenciação de RNA Pequeno: Métodos, Fluxo de Trabalho, Plataforma e Aplicações
A sequenciação de pequenos RNAs (sRNA-seq) visa a classe de moléculas de RNA não codificantes com menos de 200 nucleotídeos, incluindo microRNAs (miRNAs), RNAs interagindo com Piwi (piRNAs), RNAs pequenos interferentes (siRNAs) e pequenos RNAs derivados de tRNA (tsRNAs). Ao contrário do RNA mensageiro, estas moléculas não são traduzidas em proteínas, mas funcionam como reguladores da expressão génica a níveis transcricionais e pós-transcricionais. O seu pequeno tamanho, heterogeneidade e propriedades bioquímicas distintas criam desafios únicos tanto para a preparação de bibliotecas como para a análise bioinformática que não estão presentes nos fluxos de trabalho padrão de RNA-seq.
Este guia é escrito para investigadores que têm uma familiaridade básica com RNA-seq e necessitam de uma visão prática e orientada para a decisão sobre a sequenciação de pequenos RNAs. Abrange as classes de sRNA relevantes para a investigação biomédica, os métodos de preparação de bibliotecas e os seus perfis de viés, as ferramentas de bioinformática especializadas necessárias para dados de sRNA-seq e as aplicações emergentes em biópsia líquida e investigação de miRNA circulantes. O foco ao longo do texto está em como as escolhas metodológicas afetam a qualidade dos dados e a interpretação biológica, fornecendo o contexto necessário para desenhar experiências que gerem resultados reproduzíveis e para avaliar criticamente as descobertas publicadas que podem ter sido geradas utilizando diferentes protocolos e pipelines de análise.
Ao contrário do mRNA-seq, onde os protocolos padrão produzem resultados comparáveis entre laboratórios, os resultados do sRNA-seq são altamente sensíveis ao método específico de preparação da biblioteca, ao design do adaptador e ao pipeline bioinformático utilizado. Dois laboratórios que estudam a mesma amostra biológica com diferentes protocolos de sRNA-seq podem produzir listas substancialmente diferentes de miRNAs detectados e diferentes razões de expressão. Compreender esta sensibilidade metodológica é essencial para o desenho de experiências, a avaliação da literatura publicada e a comparação de resultados entre estudos independentes para tirar conclusões biológicas robustas.
Serviços de sequenciação de pequenos RNAs cobrir todo o fluxo de trabalho desde a preparação da biblioteca até a análise bioinformática, com protocolos otimizados para diferentes classes de sRNA, tipos de amostras e objetivos de pesquisa em uma ampla gama de sistemas biológicos.
O que são pequenos RNAs e por que sequenciá-los?
Os pequenos RNAs são um grupo diversificado de moléculas de RNA não codificante que regulam a expressão gênica através de interações específicas de sequência com mRNAs-alvo ou com a cromatina. As quatro principais classes relevantes para projetos de sRNA-seq diferem em tamanho, via de biogénese e mecanismo de ação.
- microARNs (miARNs)Com aproximadamente 22 nucleótidos de comprimento, os miARNs ligam-se a sequências complementares na UTR 3' de mARNs-alvo para reprimir a tradução ou promover a degradação do mARN. Mais de 2.600 miARNs maduros foram anotados no genoma humano, e a desregulação da expressão de miARNs está implicada em praticamente todas as principais categorias de doenças, incluindo câncer, doenças cardiovasculares e distúrbios neurológicos.
- RNAs interagentes com Piwi (piRNAs)Com 24-31 nucleótidos de comprimento, os piRNAs são principalmente expressos em células germinativas e funcionam na silenciação de transposões. O seu papel em tecidos somáticos e doenças é uma área ativa de investigação.
- RNAs pequenos interferentes (siRNAs): 20-24 nt em plantas e invertebrados, os siRNAs são derivados de RNA de cadeia dupla e orientam o silenciamento gênico específico de sequência. Em mamíferos, os siRNAs endógenos são menos proeminentes, mas os siRNAs sintéticos são amplamente utilizados como ferramentas de pesquisa e agentes terapêuticos.
- pequenos RNAs derivados de tRNA (tsRNAs)Fragmentos de 18-40 nt derivados de tRNAs maduros ou precursores, os tsRNAs estão a emergir como reguladores importantes da expressão génica e foram identificados como componentes abundantes do repertório de RNA circulante em biofluidos.
A análise de pequenos RNAs por sequenciação oferece várias vantagens em relação a métodos tradicionais, como o Northern blotting ou qPCR. A sRNA-seq proporciona uma descoberta imparcial de pequenos RNAs conhecidos e novos, quantifica a expressão em toda a faixa dinâmica e detecta variações a nível de isoformas (isomiRs) que métodos baseados em hibridação não conseguem resolver. A desvantagem é que a sRNA-seq requer protocolos de preparação de bibliotecas especializados para lidar com as entradas de RNA curto, e a análise bioinformática deve abordar desafios de alinhamento e quantificação únicos para dados de pequenos RNAs de leituras curtas.
Figura 1: Principais classes de pequenos RNAs — intervalo de tamanho, biogénese e funções biológicas
Preparação de Bibliotecas de RNA Pequeno — Quatro Métodos e os Seus Perfis de Viés
A preparação de bibliotecas para sRNA-seq é mais tecnicamente exigente do que a preparação de bibliotecas para RNA-seq padrão, uma vez que os RNAs-alvo são curtos (18-200 nt) e devem ser capturados sem introduzir um viés severo dependente da sequência. Quatro abordagens metodológicas estão disponíveis, cada uma com características de viés distintas que afetam quais pequenos RNAs são detectados e quantificados.
Métodos baseados em poliadenilaçãoUma cauda poli(A) é adicionada à extremidade 3' de pequenos RNAs, seguida pela primagem com oligo-dT para a transcrição reversa. Este método evita a etapa de ligadura que introduz viés em outros protocolos. A desvantagem é que a eficiência da poliadenilação varia conforme a sequência e a estrutura do RNA, e alguns pequenos RNAs são modificados preferencialmente pela polimerase poli(A).
Métodos baseados em ligadura diretaOs adaptadores de RNA são ligados sequencialmente às extremidades 3' e 5' de pequenos RNAs antes da transcrição reversa e amplificação por PCR. Esta é a abordagem mais amplamente utilizada, implementada em kits comerciais como o Illumina TruSeq Small RNA e o QIAGEN QIAseq miRNA Library Kits. A principal fonte de viés é a eficiência de ligação diferencial — a ligação do adaptador a algumas sequências de miRNA é até 100× mais eficiente do que a outras, dependendo da composição de nucleotídeos 3' e da estrutura secundária do pequeno RNA.
Métodos baseados na seleção de tamanhoOs pequenos RNAs são isolados por eletroforese em gel ou seleção de tamanho baseada em esferas SPRI antes da ligação de adaptadores. Isso remove espécies de RNA maiores (mRNA, rRNA) que, de outra forma, dominariam a saída de sequenciação. O viés é principalmente dependente do tamanho — pequenos RNAs nos limites da janela de seleção podem estar sub-representados.
Métodos modificados para classes específicasExistem protocolos especializados para classes específicas de sRNA. Por exemplo, os protocolos focados em piRNA utilizam oxidação por periodato para bloquear as extremidades 3' de moléculas que não são piRNA, enriquecendo especificamente para piRNAs. Os protocolos focados em tsRNA modificam as condições de ligação do adaptador para capturar as extremidades 3' modificadas características dos fragmentos de tRNA.
| Método | Viés Primário | RNA de Entrada Necessária | Mais Adequado Para |
|---|---|---|---|
| Baseada em poliadenilação | Eficiência de poliadenilação dependente da sequência | 100-500 ng | perfilagem de miRNA, descoberta de novos sRNAs |
| Baseada em ligadura direta | viés de ligação 3' (intervalo de 10-100×) | 10-1000 ng | Triagem de miRNA de alto rendimento, fluxos de trabalho padrão |
| Baseado na seleção de tamanho | Recuperação dependente do tamanho nas fronteiras da janela | 500 ng - 5 µg | Perfilagem ampla de sRNA, incluindo piRNAs e tsRNAs |
| Modificado específico para a classe | Enriquecido para uma classe à custa das outras | 100-500 ng | Análise direcionada de piRNAs, tsRNAs ou outras classes específicas |
Para projetos que exigem deteção imparcial de miRNA numa ampla gama dinâmica, métodos de ligadura direta com sequências de adaptadores aleatórias reduzem o viés de ligadura em comparação com adaptadores fixos. serviços de sequenciação de miRNA utilize protocolos de ligadura otimizados para minimizar o viés e maximizar a sensibilidade de deteção.
Figura 2: Viés na preparação da biblioteca — a eficiência de ligadura varia conforme a sequência do miRNA
O Fluxo de Trabalho de Sequenciação de RNA Pequeno — Passo a Passo
O fluxo de trabalho padrão de sRNA-seq segue seis etapas, cada uma com pontos de controlo de qualidade específicos que diferem do RNA-seq padrão devido ao pequeno tamanho das moléculas-alvo e às propriedades bioquímicas únicas dos pequenos RNAs.
- Amostra de QC e avaliação da integridade do RNAA integridade do RNA é avaliada utilizando o score RIN (RIN ≥ 7 para a maioria das aplicações) ou DV200 para amostras FFPE. Para análises específicas de sRNA, também se avalia a proporção de RNA pequeno em relação ao RNA total — amostras com elevada degradação de RNA podem apresentar um perfil de RNA pequeno alterado. A fração de RNA pequeno (RNAs <200 nt) pode ser enriquecida através de colunas de exclusão por tamanho ou purificação baseada em esferas SPRI antes da preparação da biblioteca, melhorando a proporção de leituras informativas de RNA pequeno nos dados finais.
- Preparação da bibliotecaAs pequenas RNAs são selecionadas por tamanho ou enriquecimento bioquímico, sendo depois convertidas em bibliotecas prontas para sequenciação através da ligação de adaptadores, transcrição reversa e amplificação por PCR.
- Seleção de tamanhoA biblioteca é selecionada por tamanho para remover dímeros de adaptadores (~120 bp) e fragmentos grandes (>200 bp). A faixa de tamanho alvo para bibliotecas de miRNA é aproximadamente 140-160 bp (inserção de 22 nt + adaptadores).
- QC da BibliotecaA concentração final da biblioteca é medida por qPCR, e a distribuição de tamanhos é confirmada por Bioanalyzer ou TapeStation. O conteúdo de dímeros de adaptadores deve ser <5% da massa total da biblioteca. A biblioteca final deve exceder 2 nM para uma geração de clusters fiável em células de fluxo Illumina.
- SequenciaçãoO sequenciamento de 50 bp em modo de extremidade única é suficiente para a maioria das aplicações de miRNA, uma vez que o miRNA típico tem apenas 22 nt. Para a deteção de piRNA ou tsRNA, 50 bp também proporciona uma cobertura adequada. O sequenciamento em pares geralmente não é necessário para sRNA-seq.
- Análise de dadosAs leituras brutas são pré-processadas para remover sequências de adaptadores, alinhadas ao genoma de referência ou a bases de dados de sRNA conhecidas, quantificadas ao nível de miRNA ou isomiR, e analisadas para expressão diferencial.
Análise Bioinformática de Dados de Sequenciação de Pequenos RNAs
O pipeline de bioinformática para sRNA-seq difere do RNA-seq padrão em várias maneiras importantes. O comprimento curto das leituras (50 bp em comparação com 150 bp para mRNA-seq), a presença de modificações de RNA e a natureza de mapeamento múltiplo dos pequenos RNAs exigem ferramentas e abordagens de análise especializadas.
Pré-processamento e corte de adaptadoresAs leituras brutas de sRNA-seq contêm a sequência completa do pequeno RNA, além do adaptador 3'. Como os pequenos RNAs são mais curtos do que o comprimento da leitura, a sequência do adaptador está presente na maioria das leituras e deve ser removida antes do alinhamento. Ferramentas como Cutadapt e fastp, com configurações específicas para pequenos RNAs, removem o adaptador enquanto mantêm o inserto. A precisão da remoção do adaptador é crítica — a remoção insuficiente deixa sequências de adaptador que interferem no alinhamento, enquanto a remoção excessiva elimina sequências genuínas de pequenos RNAs e reduz as taxas de mapeamento. Um passo de controlo de qualidade após a remoção deve confirmar que a distribuição do comprimento das leituras corresponde à faixa de tamanho esperada para pequenos RNAs (18-31 nt para miARNs).
Alinhamento de leituraAs leituras de pequenos RNAs podem mapear para múltiplas localizações no genoma devido à similaridade de sequência entre membros da família miRNA, pseudogenes e elementos repetitivos. Alinhadores padrão (Bowtie, BWA) podem realizar multi-mapeamento, mas a estratégia de análise deve decidir como lidar com leituras que mapeiam para múltiplos loci — as opções incluem manter apenas as leituras que mapeiam de forma única, distribuir as leituras de multi-mapeamento proporcionalmente, ou usar atribuição probabilística. O miRDeep2 e o sRNAbench são ferramentas especializadas que lidam com multi-mapeamento e quantificam miRNAs conhecidos e novos.
Quantificação e expressão diferencialA expressão de miRNA é quantificada como contagens de leitura por locus de miRNA. Os métodos de normalização para miRNA-seq incluem TPM, a mediana de razões do DESeq2 (que funciona com dados de contagem) e métodos que consideram o número total diferente de leituras mapeadas entre amostras. A análise de expressão diferencial utiliza as mesmas ferramentas que o mRNA-seq (DESeq2, edgeR), mas com o reconhecimento de que os dados de miRNA-seq têm propriedades de distribuição diferentes devido ao menor número de características (~2.000 miRNAs vs. ~20.000 mRNAs). O ônus da correção para múltiplos testes é menor para os miRNAs, o que significa que uma maior proporção de resultados nominalmente significativos sobrevive à correção FDR em comparação com o mRNA-seq. Para projetos focados em candidatos específicos de miRNA, aplicar um limiar de significância mais rigoroso (por exemplo, FDR < 0,01 em vez de FDR < 0,05) pode reduzir os achados de falsos positivos.
Deteção de IsomiRsIsomiRs são variantes de sequências de miRNA que diferem da sequência canónica de miRNA por aparas de 5' ou 3', adições de nucleotídeos ou substituições. A análise de IsomiRs requer ferramentas especializadas que alinham as leituras ao cabelo precursor de miRNA e classificam as variantes. Esta análise é cada vez mais reconhecida como importante, uma vez que diferentes isomiRs podem ter especificidades de alvo e funções biológicas distintas.
Figura 3: Pipeline de bioinformática de RNA-seq pequeno — desde leituras brutas até expressão diferencial
Viés na Preparação da Biblioteca — Por que a Escolha do Método Determina a Qualidade dos Dados
A escolha do método de preparação da biblioteca tem um impacto mais profundo na qualidade dos dados de sRNA-seq do que no RNA-seq padrão, uma vez que as moléculas-alvo curtas são diretamente afetadas pelos passos bioquímicos de ligação de adaptadores e transcrição reversa.
O viés de ligadura é a principal fonte de variação técnica.A ligase T4 RNA, a enzima utilizada para a ligação de adaptadores na maioria dos protocolos de sRNA-seq, demonstra uma forte preferência por certos nucleotídeos terminais 3'. Os miARNs que terminam em guanosina (G) são ligados até 100 vezes mais eficientemente do que aqueles que terminam em citidina (C) ou adenosina (A). Isso significa que a abundância relativa dos miARNs detectados reflete tanto a expressão biológica quanto a eficiência de ligação — um miARN que é biologicamente abundante, mas possui um nucleotídeo terminal 3' desfavorável, pode parecer sub-representado em relação a um miARN menos abundante com um nucleotídeo terminal favorável.
Viés de GC e preferência de tamanhoAlém do viés de ligação 3', a preparação da biblioteca de sRNA-seq também apresenta viés de conteúdo de GC — os miRNAs com conteúdo de GC equilibrado são recuperados de forma mais eficiente do que aqueles com conteúdo de GC extremo. A preferência de tamanho também afeta a deteção, com RNAs muito curtos (<18 nt) e pequenos RNAs mais longos (>30 nt) sendo recuperados com menor eficiência do que a faixa de 20-25 nt, que é a ideal para a maioria das enzimas de ligação. Esses viéses combinados significam que o perfil de expressão de miRNA medido é uma convolução da verdadeira expressão biológica e do perfil de viés do método de preparação da biblioteca.
Implicações práticas para o design experimentalAo comparar a expressão de miRNA entre condições dentro do mesmo experimento utilizando o mesmo protocolo, esses vieses afetam todos os amostras de forma igual e as comparações relativas permanecem válidas. O perigo surge ao comparar dados gerados utilizando diferentes métodos de preparação de bibliotecas — um miRNA que parece estar 5 vezes regulado para cima em um protocolo pode estar 2 vezes regulado para cima em outro devido a um viés diferencial. Para comparações entre múltiplos estudos ou meta-análises, utilizar apenas dados gerados com o mesmo protocolo é a abordagem mais segura. Para projetos onde a comparabilidade entre protocolos é necessária, métodos baseados em poliadenilação que evitam a ligação podem ser preferidos, apesar do seu rendimento geral mais baixo. Uma estratégia alternativa é utilizar amostras de RNA de referência disponíveis comercialmente com concentrações de miRNA conhecidas para calibrar o perfil de viés de cada protocolo.
Estratégias para reduzir o viés de ligaduraSequências de adaptadores randomizadas (onde os adaptadores 5' e 3' contêm nucleotídeos degenerados na junção de ligadura) reduzem a preferência de sequência da reação de ligadura. Kits comerciais que utilizam esta abordagem incluem o QIAGEN QIAseq miRNA Library Kit e o NEXTFLEX Small RNA-Seq Kit. Outra estratégia é usar um método baseado em poliadenilação que evita completamente a ligadura, à custa de introduzir viés de poliadenilação. A abordagem mais eficaz para minimizar o viés é usar uma combinação de adaptadores randomizados e condições de ligadura otimizadas (temperatura, concentração de enzima e tempo de incubação), o que pode reduzir a faixa de viés de 100 vezes para aproximadamente 5-10 vezes.
Orientação práticaPara projetos que comparam a expressão de miRNA em diferentes condições dentro do mesmo laboratório utilizando o mesmo protocolo, o viés é sistemático e não deve afetar as comparações relativas. Para projetos que comparam níveis de expressão absoluta ou integram dados de diferentes protocolos, o viés pode ser substancial e deve ser considerado no desenho experimental. Para projetos em que a quantificação absoluta é crítica, devem ser adicionados controlos de spike-in (oligonucleotídeos de RNA sintético em concentrações conhecidas) a cada amostra antes da preparação da biblioteca.
Figura 4: Perfil de viés de ligadura — a eficiência de ligadura relativa varia conforme o nucleotídeo 3' do miRNA
Desafios de Bioinformática Específicos para Small RNA-Seq
Três desafios de bioinformática são específicos para sRNA-seq e requerem abordagens analíticas não utilizadas no RNA-seq padrão.
Leituras de múltiplos mapeamentosLeituras curtas de sRNA-seq (18-50 bp após a remoção do adaptador) frequentemente mapeiam para múltiplas localizações no genoma. Os membros da família miRNA muitas vezes partilham a mesma sequência de semente (posições 2-8) e diferem apenas na região 3'. Quando uma leitura de 22 nt mapeia para cinco loci diferentes de miRNA, a quantificação deve decidir qual locus contribuiu para a leitura. O miRDeep2 utiliza uma estrutura bayesiana para atribuir leituras de múltiplo mapeamento com base na probabilidade de que cada locus esteja expresso, enquanto outras ferramentas simplesmente utilizam apenas leituras de mapeamento único (o que subestima a expressão de famílias de miRNA de múltiplas cópias). A decisão entre estas abordagens deve ser documentada na seção de métodos, uma vez que afeta diretamente o número de miRNAs detectados e os seus valores de expressão relativa.
Classificação de IsomiRsCada gene de miRNA produz múltiplas variantes de sequência (isomiRs) que diferem da sequência de referência canónica. Os isomiRs de modelo surgem de clivagens imprecisas pelo Drosha ou Dicer, produzindo extremidades 5' ou 3' deslocadas. Os isomiRs não-modelo apresentam adições de nucleotídeos (tipicamente adenilação ou uridilação) na extremidade 3'. Distinguir verdadeiros isomiRs de erros de sequenciação requer modelagem estatística da taxa de erro e comparação com a sequência esperada de miRNA. Ferramentas como isomiR-SEA e CPSS detetam e quantificam isomiRs alinhando leituras a precursores de hairpins de miRNA em vez de sequências de miRNA maduras. A relevância biológica dos isomiRs é uma área ativa de investigação, com evidências de que isomiRs específicos podem ter especificidade de alvo alterada em comparação com o miRNA canónico.
Classificação de fragmentos de sRNAUma fração substancial das leituras de sRNA-seq são fragmentos de RNAs maiores (mRNA, rRNA, tRNA, lncRNA) em vez de pequenos RNAs regulatórios genuínos. Distinguir leituras de miRNA e piRNA de produtos de degradação requer alinhamento contra bases de dados de sequências para cada classe de sRNA e filtragem com base em características como distribuição do comprimento das leituras, origem genómica e presença de modificações de RNA. Ferramentas como sRNAbench e miRMaster automatizam esta classificação, alinhando sequencialmente as leituras a bases de dados de miRNA, piRNA, tRNA e outros RNAs, e reportando a proporção atribuída a cada classe. Para amostras de sRNA-seq circulantes, onde a proporção de leituras de miRNA pode ser tão baixa quanto 10-20%, este passo de classificação é essencial para obter perfis de expressão de miRNA interpretáveis.
Figura 5: desafios bioinformáticos do sRNA-seq — multi-mapeamento, isomiRs e classificação de fragmentos
Aplicações Emergentes — Biópsia Líquida e miARNs Circulantes
Uma das aplicações de sRNA-seq que mais cresce é a análise de pequenos RNAs circulantes em biofluidos para a descoberta de biomarcadores não invasivos.
Os miARNs estão presentes de forma estável no sangue, soro, plasma, urina e outros biofluidos, protegidos da degradação por RNase através da encapsulação em exossomas, microvesículas ou ligação a proteínas Argonaute. Os perfis de miARNs circulantes demonstraram refletir estados de doença, incluindo câncer, doenças cardiovasculares e distúrbios neurológicos, tornando-os candidatos promissores para diagnósticos baseados em biópsia líquida. Estudos recentes com grandes coortes demonstraram que painéis de 10-50 miARNs circulantes podem distinguir pacientes com câncer de controles saudáveis com alta sensibilidade e especificidade.
Desafios técnicos da circulação de sRNA-seqA concentração de pequenos RNAs em biofluidos é extremamente baixa — tipicamente 1-50 ng de RNA total por mL de plasma ou soro. Os protocolos de preparação de bibliotecas devem ser otimizados para entradas baixas, sendo a contaminação por dímeros de adaptadores um risco significativo, uma vez que o RNA de inserção limitado pode não conseguir competir com os produtos de ligação entre adaptadores. Índices duais únicos (UDI) são recomendados para projetos multiplexados de miRNA circulante para prevenir a troca de índices entre amostras, o que comprometeria a precisão da deteção de miRNA de baixa abundância.
Considerações sobre análise de dadosOs conjuntos de dados de sRNA-seq circulantes frequentemente contêm uma alta proporção de leituras não-miRNA, incluindo fragmentos de mRNA, fragmentos de rRNA e fragmentos de RNA Y. O pipeline bioinformático deve classificar e filtrar explicitamente essas leituras não-miRNA antes da análise subsequente. A normalização dos dados de miRNA circulante também é desafiadora, uma vez que o conteúdo total de RNA varia entre indivíduos e entre tipos de biofluídos — recomenda-se o uso de controles spike-in ou normalização por média de expressão. A alta variabilidade entre indivíduos nos níveis de miRNA circulante significa que tamanhos de coorte maiores são geralmente necessários para estudos de descoberta de biomarcadores utilizando sRNA-seq em comparação com estudos baseados em tecido. Para detectar alterações de 1,5 vezes com poder estatístico adequado, são tipicamente necessários 30-50 amostras por grupo para estudos de miRNA circulante.
RNA circulante total vs. exossomalUma decisão chave no desenho experimental em sRNA-seq circulante é se deve sequenciar RNA de exossomas isolados ou de RNA total de biofluídos. O RNA exossomal é enriquecido para populações específicas de miRNA e contém menos mRNA e rRNA contaminantes, potencialmente melhorando a detecção de miRNAs circulantes de baixa abundância. O RNA total de biofluídos captura uma representação mais ampla de RNAs circulantes, incluindo miRNAs livres de vesículas ligados a proteínas Argonaute. A escolha deve ser orientada pela questão de pesquisa — o RNA exossomal é preferido para a descoberta de biomarcadores focados em populações específicas de vesículas, enquanto o RNA circulante total fornece uma visão mais abrangente do transcriptoma circulante.
Aplicações agrícolas de sRNA-seqo sequenciamento de pequenos RNAs está a ser cada vez mais utilizado na investigação em plantas e agricultura. As plantas produzem uma vasta gama de pequenos RNAs, incluindo siRNAs de 21-22 nt envolvidos na defesa antiviral e siRNAs de 24 nt que orientam a metilação do DNA. O sRNA-seq permite a caracterização dessas populações de pequenos RNAs em culturas sob condições de stress, a identificação de novos miRNAs que regulam características agronómicas e a análise da interferência de RNA entre reinos mediada por nanopartículas semelhantes a exossomas derivadas de plantas. Para os investigadores que trabalham na biologia dos pequenos RNAs em plantas, serviços de sequenciação de RNA pequeno oferecer protocolos otimizados para RNA vegetal com as suas estruturas secundárias e perfis de modificação únicos. Para projetos focados em biomarcadores de miRNA circulante, estão disponíveis protocolos especializados para amostras de biofluídos com baixo input que minimizam a formação de dímeros de adaptadores e incluem controlos de spike-in para quantificação absoluta.
Figura 6: Armadilhas comuns do sRNA-seq — problemas, causas e soluções
Requisitos Computacionais para Projetos de RNA-Seq de Pequenas RNAs
Os projetos de sRNA-seq geram substancialmente menos dados por amostra do que os projetos de mRNA-seq, tornando os requisitos computacionais mais modestos.
- Dados por amostraUma corrida padrão de miRNA-seq com 10 milhões de leituras por amostra produz aproximadamente 500 MB de dados FASTQ. Para um projeto com 48 amostras, planeie cerca de 25 GB de dados brutos.
- Requisitos de armazenamentoO armazenamento total, incluindo leituras cortadas, arquivos alinhados e saídas de análise, é de aproximadamente 50-100 GB para um projeto de 48 amostras.
- Tempo de computaçãoAnálise miRDeep2: 30-60 minutos por amostra. Expressão diferencial: 10-30 minutos no total. Alinhamento com Bowtie: 10-20 minutos por amostra. O tempo total de análise para um projeto de 48 amostras usando um pipeline padronizado é de aproximadamente 24-48 horas, sendo que a maior parte desse tempo é dedicada ao alinhamento, que pode ser paralelizado em vários núcleos de CPU.
- Requisitos de memóriaA maioria das ferramentas de análise de sRNA-seq funciona com 8-16 GB de RAM, tornando-as acessíveis em computadores portáteis ou de secretária padrão. O miRDeep2 e o Bowtie requerem aproximadamente 4-8 GB para uma análise de miRNA humano, enquanto as ferramentas de expressão diferencial necessitam de 2-4 GB. A computação em nuvem não é necessária para a maioria dos projetos de sRNA-seq.
Erros Comuns em Projetos de RNA-Seq de Pequenas RNAs
| Problema Observado | Causa Raiz | Prevenção |
|---|---|---|
| Proporção baixa de miRNA lido (<20% do total) | Altos fragmentos de degradação de rRNA/mRNA na biblioteca | Melhorar a integridade do RNA; otimizar a etapa de seleção de tamanho. |
| Contaminação de dímeros de adaptador | RNA de entrada insuficiente para a proporção do adaptador utilizada | Reduza a concentração do adaptador para amostras de baixo input; utilize adaptadores em forma de laço. |
| Taxa de alinhamento baixa (<50%) | Leituras de multi-mapeamento descartadas; incompatibilidade com a base de dados de referência. | Utilize alinhamento ciente do miRBase; inclua mapeamento múltiplo na quantificação. |
| Os efeitos de lote dominam a expressão de miRNA. | Diferentes lotes de preparação de biblioteca ou kits | Processar todas as amostras de um projeto em um único lote; utilizar controlos de spike-in. |
| Deteção inconsistente de isomiRs | Profundidade de leitura variável entre amostras | Normalizar a profundidade de sequenciação; aplicar filtros de contagem mínima de leituras. |
Perguntas Frequentes
Qual é a profundidade de sequenciação necessária para small RNA-seq?
Para o perfilamento de miRNA em tecidos mamíferos, 5-10 milhões de leituras por amostra são tipicamente suficientes para detectar a maioria dos miRNAs expressos. Para miRNAs raros ou com baixa expressão, podem ser necessários 10-20 milhões de leituras por amostra. Para a análise de miRNA circulante, recomenda-se 10-15 milhões de leituras por amostra devido à menor proporção de leituras de miRNA em amostras de biofluídos.
Devo usar sequenciação de extremidade única ou de extremidade pareada para sRNA-seq?
A sequenciação de extremidade única de 50 pb é suficiente para a maioria das aplicações de sRNA-seq, uma vez que o típico RNA pequeno tem entre 18 e 31 nt. A sequenciação de extremidade pareada não fornece informação adicional para os RNAs pequenos e aumenta o custo da sequenciação sem benefício.
Como escolho entre os diferentes métodos de preparação de bibliotecas para sRNA-seq?
A escolha depende da quantidade de RNA de entrada e da questão de investigação. Métodos de ligação direta (TruSeq, QIAseq) são adequados para a maioria dos projetos com 10-1000 ng de entrada. Métodos baseados em poliadenilação são preferidos quando é necessário minimizar o viés de ligação. Métodos baseados em seleção de tamanho são adequados para perfis amplos, incluindo piRNAs e tsRNAs, quando o RNA de entrada é abundante.
O que é um isomiR e por que é importante?
Um isomiR é uma variante de sequência de um miRNA canónico que difere em comprimento ou composição de nucleotídeos. Os isomiRs podem ter diferentes especificidades de alvo e funções biológicas. A deteção e quantificação de isomiRs requerem ferramentas bioinformáticas especializadas e uma profundidade de sequenciação suficiente.
Como devo lidar com leituras de múltipla mapeação na análise de sRNA-seq?
As leituras de multi-mapeamento são leituras que se alinham a múltiplas localizações genómicas. Ferramentas como o miRDeep2 utilizam modelos estatísticos para atribuir leituras de multi-mapeamento de forma probabilística. Para a maioria das análises subsequentes, usar apenas leituras de mapeamento único é aceitável quando o objetivo é comparar a expressão de miRNA entre condições, mas isso subestimará a expressão de miRNAs com múltiplas cópias genómicas.
Que controlos devo incluir em um experimento de sRNA-seq?
Os controlos de spike-in (oligonucleotídeos de RNA sintético em concentrações conhecidas) devem ser adicionados a cada amostra antes da preparação da biblioteca para avaliar a variação técnica e permitir a quantificação absoluta. Amostras de controlo positivo e negativo devem ser incluídas em cada lote para validar o fluxo de trabalho.
Como é que a qualidade dos dados de sRNA-seq difere da qualidade dos dados de mRNA-seq?
O sRNA-seq tipicamente apresenta taxas de alinhamento mais baixas (50-70%) do que o mRNA-seq (>80%) devido a leituras de múltipla mapeamento e à presença de fragmentos de degradação de RNAs maiores. A proporção de leituras de miRNA numa biblioteca típica de sRNA-seq varia entre 20-60%, dependendo do tipo de amostra e do método de preparação da biblioteca. Amostras de sRNA circulante tendem a ter as proporções mais baixas de leituras de miRNA, por vezes abaixo de 15% do total de leituras mapeadas.
Posso usar ferramentas de análise de RNA-seq padrão para dados de sRNA-seq?
Não diretamente. Alinhadores de RNA-seq padrão como STAR e HISAT2 são projetados para leituras mais longas e alinhamento splicing, e não são apropriados para dados de sRNA-seq. Em vez disso, utilizam-se alinhadores de leituras curtas como Bowtie e BWA. Ferramentas de quantificação e expressão diferencial projetadas para mRNA-seq (DESeq2, edgeR) podem ser aplicadas a dados de contagem de sRNA-seq, mas a normalização e as suposições estatísticas foram desenvolvidas para dados de mRNA-seq e podem não ser ideais para o menor número de características e diferentes propriedades de distribuição dos dados de sRNA-seq.
Referências
- Identificação e caracterização otimizadas de pequenos RNAs. Protocolos da Natureza. 2025;20:1587-1615.
- O estudo do sequenciamento de pequenos RNAs a partir de amostras biológicas. Métodos em Biologia Molecular. 2024;2889:151-174.
- Tecnologia de sequenciação por nanopore, bioinformática e aplicações. Biotecnologia da Natureza. 2021;39:1348-1365.
- Painéis de microRNA circulantes para deteção de múltiplos tipos de câncer. BMC Genómica Médica2025;18:20.
- Bioinformática de microRNA na oncologia de precisão: uma revisão de pipeline integrado. Revista de Genética Aplicada2025;66:551-570.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.