Avanços em Métodos e Tecnologias de Análise do Transcriptoma
Transcritosmica é um assunto que estuda a expressão genética. Ao analisar o transcriptoma, as pessoas podem entender quais genes estão ativados, quando e como os seus níveis de expressão mudam. Neste artigo, primeiro resumimos e revisamos os tipos comuns de tecnologias de transcriptoma. Em seguida, comparamos e analisamos as vantagens técnicas e os principais desafios de várias estratégias de pesquisa para auxiliar o design experimental atual e a análise de pesquisa. Finalmente, enfatizamos a importância da transcriptómica na análise integrada de multi-ômicas e aguardamos as suas perspetivas de desenvolvimento.
INTRODUÇÃO
Transcriptoma, de forma geral, refere-se à soma de todos os RNAs que podem ser transcritos numa célula ou num grupo de células sob o mesmo ambiente (ou condições fisiológicas), incluindo RNA mensageiro (mRNA), RNA ribossómico (rRNA), RNA transportador (tRNA) e RNA não codificante.[1]Numa definição restrita, refere-se a todo o RNA mensageiro (mRNA) que pode ser transcrito pelas células. Assim, a transcriptómica pode ser simplesmente definida da seguinte forma: é o estudo de todas as moléculas de RNA nas células. A transcriptómica, também conhecida como perfilagem de expressão, estuda os níveis de expressão de RNA numa determinada população celular. A análise do transcriptoma tem uma ampla gama de aplicações, incluindo medicina, agricultura, ambiente e microrganismos.[2-5]Aqui começaremos com tecnologias de sequenciação do transcriptoma e métodos de análise do transcriptoma para explicar a descoberta funcional da transcriptómica no genoma, revelar a composição molecular de células e tecidos, e compreender o papel das vias regulatórias do desenvolvimento e das doenças.
TECNOLOGIAS DE SEQUENCIAÇÃO DO TRANSCRIPTOMA
RNA-Seq é uma tecnologia recentemente desenvolvida que utiliza sequenciação de próxima geração tecnologias para análise do transcriptoma. Permite obter de forma abrangente e rápida a informação de sequência e a informação de expressão de quase todos os transcritos de uma célula ou tecido específico em determinado estado, incluindo mRNA codificante de proteínas e vários RNAs não codificantes, a abundância de expressão de diferentes transcritos produzidos por splicing alternativo de genes, etc.[6,7]Ao analisar a estrutura e o nível de expressão dos transcritos, também podem ser descobertos transcritos desconhecidos e raros, permitindo assim uma análise precisa de questões importantes nas ciências da vida, como diferenças na expressão gênica, variações estruturais dos genes e triagem de marcadores moleculares.[8].
Fig. 1 Classificação das tecnologias de RNA-Seq
Serviço que pode interessá-lo
Recurso
o fluxo de trabalho para sequenciação de RNA é exatamente semelhante (Fig. 2). Começa com o controlo de qualidade da amostra (Controlo de Qualidade da Amostra) para garantir que as suas amostras cumprem os critérios da técnica de RNA-Seq. Em seguida, a biblioteca apropriada é preparada de acordo com o organismo-alvo e a aplicação, e posteriormente testada quanto à sua qualidade (Controlo de Qualidade da Biblioteca). A seguir, é utilizada uma estratégia de sequenciação para sequenciar as amostras e os dados resultantes também são verificados quanto à sua qualidade (Controlo de Qualidade dos Dados). Finalmente, análises bioinformáticas são realizados e os resultados são fornecidos. Você pode analisar os resultados de sequenciamento de acordo com os seus próprios objetivos experimentais.
Fig.2 Um fluxo de trabalho típico de experimento de RNA-seq
MÉTODOS DE ANÁLISE DO TRANSCRIPTOMA
Análise de Transcritos em Lote
Como mencionado acima, o objetivo da pesquisa transcriptómica é o RNA sob diferentes ou as mesmas condições fisiológicas/ambientais. Muitas vezes, têm funções diferentes. Os métodos de análise transcriptómica para RNA com diferentes funções serão discutidos a seguir.
Os mRNAs são modelos que orientam a síntese de proteínas e são mensageiros que transmitem informação genética do DNA para as proteínas. mRNA-seq é uma ferramenta poderosa para analisar o perfil do transcriptoma celular. Atualmente, existem muitos estudos relacionados ao transcriptoma de mRNA. Os principais objetivos/direções da pesquisa incluem: 1. Perfil quantitativo de transcritos em diferentes tecidos ou amostras, sob várias condições e tratamentos. 2. Descoberta de novos transcritos, splicing alternativo (AS) e variações de transcritos (Fig. 3)[9].3.Pesquisa de mecanismos de desenvolvimento[10] e resistência a medicamentos[11] através de transcritos específicos de tecido ou expressão gênica ao longo do tempo (Fig. 4). 4. Descoberta de biomarcadores[12] com base em transcrições/isoformas de novel, identificação de SNP/InDel e análise de genes de fusão.
Fig.3 Anotação da função génica e análise da estrutura génica de Lolium multiflorum
Fig.4 Análise do transcriptoma de tubérculos de inhame em diferentes estágios de desenvolvimento
Os longos RNAs não codificantes (lncRNAs) são uma fração moderadamente abundante do transcriptoma eucariótico, compostos por RNAs não codificantes (ncRNAs) com mais de 200nt, que afetam múltiplas funções celulares através da regulação da transcrição gênica, modificações pós-transcricionais e epigenética. O sequenciamento de lncRNA (lncRNA-seq) é uma poderosa ferramenta de NGS para estudar os papéis funcionais em diversos processos biológicos e doenças humanas, como o câncer e distúrbios neurológicos.[13,14].
Os pequenos RNAs (sRNAs) são moléculas de RNA curtas, geralmente não codificantes, envolvidas no silenciamento de genes e na regulação pós-transcricional da expressão gênica. A Sequenciação de sRNA (sRNA-seq) é um método que permite a investigação aprofundada destes RNAs, em especial dos microRNAs (miRNAs, com 18-40nt de comprimento). A sRNA-seq é uma abordagem eficaz para direcionar seletivamente qualquer espécie de sRNAs com uma sensibilidade e resolução sem precedentes, tudo numa única análise. Associado a um robusto pipeline de bioinformática interno, o serviço de sRNA-seq tem assistido investigadores a descrever a expressão diferencial de miRNAs, alterações estruturais e a descobrir novos sRNAs.[14,15].
O RNA circular (circRNA) é uma molécula de ncRNA altamente estável, na forma de um laço fechado covalentemente que não possui as tampas do 5' e as caudas poli(A) do 3'. A estrutura circular confere aos circRNAs resistência à digestão por exonucleases, uma característica que pode ser explorada na construção de bibliotecas. O serviço de sequenciação de circRNA da CD Genomics (circRNA-seq) utiliza tecnologia de sequenciação de nova geração (NGS) para apoiar uma ampla gama de investigações focadas em circRNA. A função reguladora dos circRNAs pode estar envolvida em muitos processos biológicos.[14], como a regulação da expressão génica ao atuar como "esponjas" de miRNA, o transporte de miRNAs e a regulação geral da síntese de proteínas.
Serviço que pode interessá-lo
Recurso
Análise do transcriptoma baseada em sequenciação de célula única
Pode haver muitas células com diferentes fenótipos e genótipos no mesmo tipo de células. A tecnologia de RNA-seq de célula única oferece aos cientistas a oportunidade de estudar e analisar o comportamento, o mecanismo e a relação de células individuais, sequenciando o transcriptoma ao nível de célula única.[16]É amplamente utilizado em áreas de pesquisa quentes, como células germinativas, células-tronco embrionárias, células nervosas, células tumorais e células imunes. A atual plataforma de sequenciamento de transcriptoma de célula única 10x Genomics pode capturar quase 100.000 células utilizando tecnologias como microfluídica e rotulagem por código de barras para obter uma grande quantidade de informação do transcriptoma.[17]O núcleo da análise do transcriptoma de células únicas é a classificação de células e a identificação de genes diferenciais em subpopulações. A agrupamento e a análise diferencial das células são realizadas, e a enriquecimento funcional dos genes diferenciais é efetuado para identificar as características funcionais das subpopulações (Fig. 5).[18]Possui vantagens únicas na tipificação celular e identificação de fatores marcadores, trazendo novos métodos e meios convenientes para a identificação de tipos celulares, resposta diferencial de vias de sinalização, redes regulatórias moleculares e investigação da heterogeneidade celular.[19,20].
Fig.5 A análise da paisagem de 22 tipos de células imunes de pacientes normais e com doença de Kawasaki.
Análise do transcriptoma baseada em sequenciação do transcriptoma espacial
A sequenciação do transcriptoma espacial pode fornecer informações de dados, como o transcriptoma do objeto de pesquisa, e também pode localizar a sua posição espacial no tecido. A combinação das informações do transcriptoma com as informações da posição espacial fornece uma base para detectar a composição espacial e a expressão gênica das células no tecido.[21,22]A transcriptómica espacial Visium é uma tecnologia que deteta a expressão génica de todo o transcriptoma in situ em tecidos, o que nos permite detetar os níveis de expressão génica e, ao mesmo tempo, obter informações sobre a localização da expressão espacial dos genes dentro do tecido. Comparada com a transcriptómica espacial, a transcriptómica tradicional de todo o gene ou o sequenciamento de transcriptoma de célula única perde a informação sobre a distribuição espacial dos genes ou células dentro dos tecidos, enquanto a hibridação com sondas de RNA, amplamente utilizada, só consegue detetar um número limitado de amostras ao mesmo tempo. A transcriptómica espacial pode sobrepor a expressão génica e os resultados da coloração HE sem digerir o tecido (Fig. 6), preservando assim a estrutura espacial dentro do tecido, permitindo-nos estudar a heterogeneidade celular em diferentes regiões dentro do tecido.[23-25].
Fig.6 Visualização e análises bioinformáticas de domínios teciduais definidos pela morfologia ou perfil de expressão génica.
CONCLUSÃO E DIRECÇÕES FUTURAS
Neste artigo, discutimos várias estratégias comuns e tecnologias de sequenciação para a análise do transcriptoma. A sequenciação de transcriptoma em massa só consegue detetar o nível médio de expressão dos genes em células misturadas e não inclui informações específicas sobre células e localização espacial.[26]A sequenciação do transcriptoma de células individuais pode obter perfis de expressão gênica individuais das células e explorar a heterogeneidade celular, mas a fonte de informação sobre a localização espacial não pode ser obtida.[16]; o transcriptoma espacial fornece informações sobre a distribuição espacial dos perfis de expressão génica, permitindo assim obter simultaneamente dados de expressão génica celular e informações sobre a localização espacial, além de explorar a heterogeneidade espacial. Isso promove ainda mais o estudo da expressão génica real das células in situ nos tecidos e a representação morfológica das redes de comunicação intercelular.[22].
No processo de análise de biomoléculas, é uma tendência inevitável passar do todo para os detalhes e, em seguida, dos detalhes de volta para o todo. Quando as pessoas compreendem a estrutura biológica a partir do nível molecular e celular, naturalmente desejam estudar grupos celulares e tecidos a uma escala mais macro, e até mesmo os processos fisiológicos e as conexões patológicas dos órgãos. Os métodos de pesquisa multi-ômica não são apenas amplamente utilizados no campo das doenças, mas também podem fornecer uma compreensão abrangente e sistemática das inter-relações e redes regulatórias de várias biomoléculas nos campos da pesquisa básica, melhoramento molecular, diagnóstico clínico e desenvolvimento de medicamentos, fornecendo uma base para a biologia de redes e sistemas.[27-29]Assim, a estratégia de combinar transcriptoma com genoma, proteoma, metaboloma e outras análises multi-ômicas conjuntas está a ser adotada por cada vez mais cientistas. Acredita-se que as estratégias de pesquisa multi-ômicas podem abrir mais campos de investigação no futuro.
Referências:
- Hrdlickova R, Toloue M, Tian B. Métodos de RNA-Seq para análise do transcriptoma. WIREs RNA, 2017, 8(1): e1364.
- Hong M, Tao S, Zhang L, et al. Sequenciação de RNA: novas tecnologias e aplicações na investigação do câncer. Journal of Hematology & Oncology, 2020, 13(1): 166.
- Li K, Chen X, Zhang J, et al. Análise do Transcriptoma de Stephania tetrandra e Caracterização da Norcoclaurina-6-O-Metiltransferase Envolvida na Biossíntese de Alcaloides Benzilisoquinolínicos. Frontiers in Plant Science, 2022, 13.
- Liu G, Bi X, Tao C, et al. Análise transcriptómica comparativa de Zygosaccharomyces mellis sob stress de alta concentração de glucose. Ciência Alimentar e Bem-Estar Humano, 2020.
- Pan Y, Wang Y, Hao W, et al. Metatranscriptómica Desvenda Composição, Fatores e Funções dos Microrganismos Ativos na Fermentação de Licor de Sabor Leve. Microbiol Spectr, 2022, 10(3): e0215121.
- Soneson C, Delorenzi M. Uma comparação de métodos para análise de expressão diferencial de dados de RNA-seq. BMC Bioinformatics, 2013, 14(1): 91.
- Marguerat S, Bähler J. RNA-seq: da tecnologia à biologia. Cell Mol Life Sci, 2010, 67(4): 569-79.
- Conesa A, Madrigal P, Tarazona S, et al. Um inquérito sobre as melhores práticas para a análise de dados de RNA-seq. Genome Biology, 2016, 17(1): 13.
- Liu Q, Wang F, Shuai Y, et al. Análise Integrada de Sequenciação em Tempo Real de Molécula Única e Sequenciação de Próxima Geração Revela Perspectivas sobre o Mecanismo de Tolerância à Seca de Lolium multiflorum. Jornal Internacional de Ciências Moleculares, 2022, 23(14): 7921.
- Cao T, Wang S, Ali A, et al. A análise do transcriptoma e metaboloma revela o potencial mecanismo do desenvolvimento dinâmico de tubérculos em inhame (Dioscorea polystachya Turcz.). LWT, 2023, 181: 114764.
- Ruiz De Garibay G, Roch B, Garrido López P, et al. 1010P Avaliação dos mecanismos de resistência precoces ao osimertinib de primeira linha em NSCLC mutante do EGFR utilizando transcriptómica espacial. Annals of Oncology, 2022.
- Liu W, Qiu W, Huang Z, et al. Identificação de nove proteínas marcadoras envolvidas na periodontite através da análise integrada de proteómica TMT e transcriptómica. Frontiers in Immunology, 2022, 13.
- Goede O M D, Nachun D C, Ferraro N M, et al. Transcritos de tecidos em escala populacional mapeiam RNAs longos não codificantes para doenças complexas. Cell, 2021, 184(D1).
- Li J W, Ping. Análise transcriptómica de sequenciação de alto débito sobre circRNA, lncRNA e mRNA no câncer da bexiga. Gene: Uma Revista Internacional Focada na Clonagem de Genes e na Estrutura e Função dos Genes, 2018, 677.
- Koeppen K, Hampton T H, Jarek M, et al. Um Novo Mecanismo de Interacção Hospedeiro-Patógeno através de sRNA em Vesículas de Membrana Externa Bacteriana. PLoS Patógenos, 2016, 12(6): e1005672.
- Chen G, Ning B, Shi T. Tecnologias de RNA-Seq de Célula Única e Análise de Dados Computacionais Relacionados. Front Genet, 2019, 10: 317.
- Gao C, Zhang M, Chen L. A Comparação de Duas Plataformas de Sequenciamento de Células Únicas: BD Rhapsody e 10x Genomics Chromium. Curr Genomics, 2020, 21(8): 602-609.
- Shaw R, Tian X, Xu J. Análise do Transcriptoma de Célula Única em Plantas: Avanços e Desafios. Mol Plant, 2021, 14(1): 115-126.
- Cao N, Ouyang H, Zhang X, et al. A integração de scRNA-Seq e bulk RNA-Seq revela tipos de células imunes e vias perturbadas da doença de Kawasaki. Frontiers in Immunology, 2023, 14.
- Nahrendorf M, Swirski F K. Abandonando M1/M2 por um Modelo de Rede da Função dos Macrófagos. Circulation Research, 2016, 119(3): 414-417.
- Ståhl P L, Salmén F, Vickovic S, et al. Visualização e análise da expressão génica em secções de tecido através da transcriptómica espacial. Science, 2016, 353(6294): 78-82.
- Du J, An Z J, Huang Z F, et al. Novas perspetivas a partir da análise do transcriptoma espacial em tumores sólidos. Int J Biol Sci, 2023, 19(15): 4778-4792.
- Jia E, Sheng Y, Shi H, et al. Perfil de Transcripção Espacial do Microzona de Células Únicas do Hipocampo de Rato na Doença de Parkinson. Int J Mol Sci, 2023, 24(3).
- Rao A, Barkley D, França G S, et al. Explorando a arquitetura dos tecidos usando transcriptómica espacial. Nature, 2021, 596(7871): 211-220.
- Wang Y, Liu B, Zhao G, et al. Transcriptómica espacial: Tecnologias, aplicações e considerações experimentais. Genómica, 2023, 115(5): 110671.
- Bivens N J, Zhou M. Métodos de Construção de Bibliotecas de RNA-Seq para Análise do Transcriptoma. Protocolos Actuais em Biologia Vegetal, 2016, 1(1): 197-215.
- Li D, Lu X, Zhu Y, et al. A base multi-ômica da heterose da batata. J Integr Plant Biol, 2022, 64(3): 671-687.
- Wang J M, Hong R, Demicco E G, et al. O aprendizado profundo integra histopatologia e proteogenômica a um nível pan-câncer. Cell Reports Medicine, 2023, 4(9).
- Sveinbjornsson G, Ulfarsson M O, Thorolfsdottir R B, et al. Estudo multiômico da doença hepática gordurosa não alcoólica. Nature Genetics, 2022, 54(11): 1652-1663.