Sequenciação de Transcritos de Comprimento Total: Uma Comparação Entre PacBio Iso-Seq e Nanopore Direct RNA-Seq
Visão Geral
Para utilizar adequadamente as montagens genómicas subjacentes, anotações de genes completas e precisas são importantes. A produção de inovações em sequenciação de RNA de leitura curta de alta eficiência (ou RNA-seq) avançou significativamente a investigação genómica ao facilitar tanto a melhoria das anotações genómicas como a experimentação de organismos que ainda não estão acessíveis para genomas de referência. As montagens de transcritos de leituras curtas, tanto sem referência como baseadas em referência, são, no entanto, difíceis e muitas vezes não alinham modelos de genes que foram verificados experimentalmente. De facto, a anotação de genomas complexos, como os de espécies vegetais relevantes para a agricultura, ainda não fornece resultados ótimos. A inconsistência da montagem genómica subjacente, em relação à reconstrução imperfeita do modelo de genes, complica as anotações de genes.
Todos os genes exibidos na célula ou tecido são representados pelo transcriptoma. A sequenciação de RNA (RNA-Seq) permite a identificação desses genes. Para o experimento de diferença na expressão gênica e o impacto do genótipo ou ambiente na sua expressão, criar um transcriptoma de referência é crucial. Através da sequenciação de leituras curtas, a maioria das pesquisas gera um transcriptoma de referência e recria o transcriptoma através da montagem e/ou mapeamento de leituras a outros genomas de referência acessíveis. No entanto, para transcritos longos, sequências repetitivas e elementos transponíveis, isso é complicado.
Para genomas poliploides intrincados, é especialmente desafiador. Recentemente, a tecnologia de sequenciação de leituras longas (LRS), representada por PacBio Sequenciação e Sequenciação por Nanoporos, tornou-se acessível, e esta tecnologia ultrapassa estes desafios ao criar dados de sequência completos como uma única sequência de leitura, incluindo transcritos longos (por exemplo, aqueles superiores a 10 kb) sem a necessidade de montagem adicional. Em alguns casos de investigação em plantas, este método foi utilizado e oferece dados adicionais sobre as diferenças de transcritos, como splicing alternativo e poliadenilação alternativa.
Comparação entre PacBio Iso-Seq e Nanopore Direct RNA-Seq
O maior potencial de sequenciação é proporcionado pela Tecnologia da Pacific Biosciences (PacBio) (Sequenciação de Isoformas). Também pode expor uma análise de dados abrangente. A Sequenciação Direta de RNA por Nanoporos, por outro lado, tem os seguintes benefícios: (1) Associada a fluxos de trabalho rápidos e simplificados, quantidades mínimas de energia permitem uma análise altamente delicada da expressão génica, (2) Transcritos de comprimento total (a alta produção de leituras longas e completas proporcionadas pela sequenciação por nanoporos permite uma descrição inequívoca das variações de splicing e fusões génicas), (3) Uma categorização precisa do transcrito e da isoforma, (4) Utilizando a sequenciação direta de RNA para eliminar o viés da PCR, (5) Distinguir alterações de bases juntamente com a sequência de nucleotídeos usando RNA direto, (6) Reconhecimento simples de transcritos anti-senso.

Figura 1. Um fluxo de trabalho para 3'end-seq (A) e PacBio Iso-seq (B). (Yeh, 2017)
Em termos de função, na área de estudo medicinal e análise agrícola, o PacBio Iso-Seq pode ser utilizado. Pode ser empregado na área médica para anotação de transcritos, exploração de genes de fusão e avaliação de mecanismos de doenças. Pode ser utilizado para pesquisa funcional, exploração de genes de fusão, avanço e teste de estresse, e coordenação para previsão de genes e anotação de genomas no campo agrícola. O Nanopore Direct RNA-Seq, por outro lado, pode ser utilizado para avaliar a função dos genes, como focar em um espécime com funções definidas para expor a razão principal de funções distintas, estrutura do gene como splicing alternativo, APA, gene de fusão, SSR, previsão de CDS, identificação de TSS/TES, quantificação de transcritos de comprimento total, como localizar transcritos diferenciais amplos e eficientes e reconhecer genes funcionais, e metilação de RNA, como sequenciamento direto de transcriptoma de comprimento total que pode identificar alterações de bases a nível de RNA, como m6A/m5C.

Figura 2. Sequenciação de RNA Direta por Nanoporos. (Byrne, 2017)
Referências:
- Byrne A, Beaudin AE, Olsen HE, et al.A sequenciação de RNA de leitura longa por nanoporo revela uma variação transcricional generalizada entre os receptores de superfície de células B individuais. Comunicações da Natureza. 2017, 8(1).
- Yeh HS, Zhang W, Yong J. Análises da poliadenilação alternativa: da bioquímica tradicional às tecnologias de alto rendimento. Relatórios BMB. 2017, 50(4).