As Tecnologias e o fluxo de trabalho do RNA-seq

Quais são os Avanços Técnicos em RNA-seq

Sequenciação de Sanger e microarranjos. Tecnologia de sequenciação Sanger foi usado pela primeira vez para transcriptómica, que possibilitou métodos como o SAGE (análise serial da expressão génica). O SAGE foi uma das primeiras tentativas de quantificar a expressão génica de forma global. Quase instantaneamente, microarranjos utilizando hibridização de sondas complementares, rapidamente emergiu e dominou o campo do perfilamento transcriptómico na próxima década.

NGS. A chegada de tecnologias de próxima geração permitiu que a abordagem de sequenciamento superasse microarranjo abordagem. Em 2006, o primeiro RNA-seq o artigo foi publicado utilizando a tecnologia 454/Roche. A era de RNA-seq a dominância começou em 2008 com a maturidade da tecnologia Illumina/Solexa. As plataformas técnicas mais populares para RNA-Seq tem sido o Analisador de Genoma Illumina e o Hi-Seq. Embora a tecnologia Illumina/Solexa possa gerar gigabases de dados por corrida (inicialmente 1GB por corrida para o Analisador de Genoma em 2006 e 600 GB por corrida para o HiSeq em 2012), a tecnologia Roche/454 gera leituras longas o suficiente para RNA-seq mas são prejudicados pela taxa de transferência relativamente baixa e pelo alto custo.

Sequenciação de terceira geração. Apesar da popularização do tecnologias de NGSa aplicação da sequenciação de terceira geração em RNA-seq está a caminho. Por exemplo, sequenciação Heliscope e sequenciação em tempo real de moléculas únicas (SMRT) já foram aplicados em alguns RNA-seq estudos. A tecnologia de sequenciação de leituras longas PacBio SMRT pode facilmente cobrir o transcrito completo desde a extremidade 5' até a cauda poli-A 3', sem a necessidade de fragmentação para obter sequências de cDNA de comprimento completo, o que é útil para identificar novos transcritos e novos íntrons, permitindo assim identificar com precisão isoformas, locais de splicing alternativo, expressão de genes de fusão e expressão alélica.

Tabela 1. As vantagens do RNA-seq em comparação com outras abordagens de transcriptómica (Wang et al. 2009).

Tecnologia Microarray de azulejos sequenciação de cDNA ou EST RNA-seq
Especificações técnicas
Princípio hibridação Sequenciação de Sanger Sequenciação de alto débito
Resolução De vários a 100 pb Base única Base única
Rendimento Alto Baixo Alto
Dependência da sequência genómica Sim Não Em alguns casos
Ruído de fundo Alto Baixo Baixo
Aplicação
Mapear simultaneamente regiões transcritas e expressão génica Sim Limitado para a expressão génica Sim
Intervalo dinâmico para quantificar o nível de expressão génica Até várias centenas de vezes Não prático superior a 8.000 vezes
Capacidade de distinguir diferentes isoformas Limitado Sim Sim
Capacidade de distinguir a expressão alélica Limitado Sim Sim
Questões práticas
Quantidade necessária de RNA Alto Alto Baixo
Custo para mapeamento de transcriptomas de genomas grandes Alto Alto Relativamente baixo

Quais são os desafios do RNA-seq

  • Leitura curtaA tecnologia de sequenciação Illumina tem aumentado constantemente o comprimento das leituras e a capacidade de produção desde a sua introdução em 2007. Leituras longas de extremidade pareada e específicas de fita são comumente utilizadas para níveis mais elevados de mapeabilidade e de novo montagem de transcriptomas. Além disso, a tecnologia de sequenciação de terceira geração (como PacBio e Ion-Torrent) permite sequenciação de transcritos completos.
  • Vieses da PCROutra preocupação é o impacto da amplificação por PCR na precisão da quantificação da expressão génica através de RNA-seqA Helicos e alguns dos sequenciadores de terceira geração utilizaram uma tecnologia sem amplificação. Existem também métodos sem PCR para sequenciação Illumina.

Fluxo de trabalho de RNA-seq baseado em NGS

O fluxo de trabalho de RNA-seq utilizando sequenciação de alto rendimento A tecnologia é ilustrada na Figura 1. Resumidamente, os RNAs longos são primeiro convertidos em uma biblioteca de fragmentos de cDNA através da fragmentação de RNA ou DNA. Adaptadores de sequenciamento são então anexados a cada fragmento de cDNA e os dados de sequenciamento são gerados de forma de alto rendimento a partir de ambas as extremidades (sequenciamento de extremidade pareada). As leituras de sequência resultantes são posteriormente alinhadas com o genoma ou transcriptoma de referência e são classificadas em três tipos: leituras exónicas, leituras de junção e leituras de extremidade poli(A). Um perfil de expressão com resolução de base pode ser gerado utilizando esses três tipos de leituras de sequência.

Figure 1. Typical workflow of RNA-seq (Wang et al. 2009).Figura 1. Um fluxo de trabalho típico de RNA-seq (Wang et al. 2009).

  • Construção de biblioteca

Figure 2. RNA-seq library construction pipeline.Figura 2. Um pipeline típico de construção de bibliotecas de RNA-seq.

Após a coleta de amostras, o RNA total é geralmente isolado através de extração orgânica e/ou membranas de sílica de colunas de centrifugação. A amostra de RNA total é posteriormente processada, seja pela seleção direta de RNA poli(A) ou pela remoção seletiva de rRNA, uma vez que o rRNA abundante geralmente não é o foco da pesquisa e reduz significativamente a cobertura do transcrito útil. O procedimento de purificação de mRNA baseado em oligo(dT) é amplamente utilizado em eucariotos. No entanto, alguns transcritos de RNA que não possuem caudas poli(A) são perdidos. Comparado à seleção de RNA poli(A), a abordagem de depleção de rRNA é preferida porque enriquece todas as espécies de RNA não ribossômico, incluindo tRNA, ncRNAs, mRNA não poli(A) e RNA pré-processado. Os dois métodos de depleção de rRNA mais populares são: (i) hibridização de rRNA com sondas anti-rRNA marcadas com biotina, seguida da remoção com esferas magnéticas revestidas de estreptavidina; e (ii) degradação seletiva de rRNA por uma exonuclease 5'-3' que reconhece especificamente rRNA com um fosfato 5'.

A fragmentação é posteriormente realizada para atingir o comprimento desejado para diferentes NGS tecnologias. Alguns pequenos RNAs, como microARNs, RNAs interagindo com piwi e RNAs interferentes curtos, podem ser sequenciados diretamente sem fragmentação. Moléculas de RNA maiores precisam ser fragmentadas em pedaços menores (200-500 bp) antes das tecnologias de sequenciamento profundo. Fragmentação de cDNA (tratamento com DNase I ou sonicação) e hidrólise ou nebulização de RNA. No entanto, cada um desses métodos pode criar um viés diferente no resultado. Por exemplo, a fragmentação de cDNA é geralmente fortemente tendenciosa para a identificação de sequências a partir das extremidades 3' dos transcritos, enquanto a fragmentação de RNA tem pouco viés sobre o transcrito, mas é empobrecida nas extremidades do transcrito. Portanto, a fragmentação de cDNA fornece informações valiosas sobre a identidade precisa dessas extremidades e a fragmentação de RNA fornece acesso à identidade precisa do corpo do transcrito.

No clássico NGS Os protocolos, adaptadores são ligados a fragmentos de DNA de cadeia dupla partilhados. No entanto, uma grande desvantagem deste método é a perda de informação sobre a direção da transcrição. O pré-tratamento das amostras de RNA com bisulfito de sódio pode converter a citidina em uridina. A ampla transição de C-T marca, assim, a cadeia codificadora de cada transcrito. Outros métodos que mantêm a especificidade da cadeia foram propostos, como a ligação direta de adaptadores de RNA à amostra de RNA antes da transcrição reversa.

  • Sequenciação

O RNA-seq é atualmente dominado por três plataformas diferentes: Illumina (Genome Analyzer e HiSeq), Applied Biosystems SOLID e Roche 454 Life Science systems. Os comprimentos de leitura variam de 30-100 bp para Illumina e SOLiD, e de 200-500 bp para o sistema de pirosequenciação 454. Baseado em 454 RNA-seq é particularmente atraente para organismos não modelo sem genomas ou transcriptomas de referência. Leituras mais longas ou leituras curtas em pares podem revelar a conectividade entre múltiplos exões. RNA-seq é um método poderoso para estudar transcriptomas complexos e revelar variações de sequência nas regiões transcritas.

  • Bioinformática

Figure 3. Data analysis pipeline for RNA-seq.Figura 3. Um pipeline de análise típico de dados de RNA-seq.

A avaliação da qualidade é o primeiro passo para o análise bioinformática de RNA-seq, que garante um resultado final coerente através da remoção de sequências de baixa qualidade, sequências sobre-representadas e sequências de adaptadores. Uma vez que todas as leituras tenham sido filtradas e mapeadas ou montadas, os níveis de expressão génica podem assim ser inferidos, levando a um mapa do transcriptoma em escala genómica em termos de qualidade e quantidade. RNA-seq também permite detetar a expressão diferencial (DE) entre tratamentos de condições. A normalização deve ser realizada para ajustar as diferenças entre amostras, como o tamanho da biblioteca e características específicas dos genes. Além disso, RNA-seq permite-nos identificar SNPs, genes de fusão e regulação pós-transcricional do gene, como edição de RNA, degradação e tradução.

Se quiser mais informações sobre o aplicações de RNA-seq ou bioinformática fluxo de trabalho de RNA-seqpode consultar o artigo.

Referências:

  1. Wang Z, Gerstein M, Snyder M. RNA-Seq: uma ferramenta revolucionária para a transcriptómica. Revisões da Natureza em Genética, 2009, 10(1): 57.
  2. Qian X, Ba Y, Zhuang Q, et al. Tecnologia RNA-Seq e a sua aplicação na transcriptómica de peixes. Omics: um jornal de biologia integrativa, 2014, 18(2): 98-110.
  3. Marguerat S, Bähler J. RNA-seq: da tecnologia à biologia. Ciências da vida celulares e moleculares, 2010, 67(4): 569-579.
  4. Wilhelm B T, Landry J R. RNA-Seq—medição quantitativa da expressão através de sequenciação de RNA em massa e paralela. Métodos, 2009, 48(3): 249-257.
  5. McGettigan P A. Transcriptómica na era do RNA-seq. Opinião atual em biologia química, 2013, 17(1): 4-11.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo