Tecnologia de Sequenciação para o Transcriptoma Eucariótico: Mecanismos, Tecnologias, Aplicações e Desafios
O processo de transcrição eucariótica é o elo chave da regulação da expressão génica, e a sua regulação precisa é importante para o crescimento celular, diferenciação, desenvolvimento e resposta a estímulos ambientais externos. O objetivo central da sequenciação da transcrição eucariótica é compreender profundamente os processos biológicos chave, como a atividade de transcrição, variação de splicing e utilização de promotores. Esta informação é importante para revelar as leis básicas das atividades vitais, explorar o mecanismo de ocorrência e desenvolvimento de doenças e desenvolver novas estratégias terapêuticas.
Este artigo apresenta principalmente a tecnologia de transcrição e sequenciação de eucariotos, discute a sua aplicação, analisa as limitações da tecnologia atual e antecipa a direção de desenvolvimento futuro.
Por que Sequenciar a Transcrição Eucariótica
A ocorrência e desenvolvimento de doenças estão intimamente relacionados com a anomalia do processo de transcrição. Tomando o câncer como exemplo, a proliferação descontrolada, invasão e metástase das células tumorais são frequentemente acompanhadas por uma série de alterações na atividade de transcrição gênica e variação de splicing anormal. Ao sequenciar a transcrição eucariótica, os cientistas podem capturar com precisão essas alterações anormais, descobrir genes-chave e fatores reguladores de transcrição relacionados ao câncer, fornecer biomarcadores específicos para o diagnóstico precoce de tumores e também indicar a direção para estratégias de terapia direcionada.
Sequenciação do transcriptoma é de grande importância para a compreensão das redes regulatórias gênicas. O promotor, como um elemento regulatório chave na iniciação da transcrição gênica, possui uma alta especificidade espaço-temporal. Sob diferentes tipos celulares, estágios de desenvolvimento e condições ambientais, existem diferenças na seleção e ativação dos promotores, o que é importante para que as células alcancem especificidade funcional e mantenham o equilíbrio interno. Com a ajuda da tecnologia de sequenciamento do transcriptoma, os pesquisadores podem identificar com precisão os promotores, analisar suas regras de uso e, em seguida, explorar profundamente o mecanismo de regulação da expressão gênica nas dimensões temporal e espacial, e construir um modelo de rede de regulação gênica mais perfeito.
O sequenciamento do transcriptoma eucariótico não só ajuda a analisar as leis básicas das atividades da vida, como também fornece um forte suporte técnico e uma base teórica para superar doenças graves e promover o desenvolvimento médico, ocupando uma posição importante e insubstituível na investigação em ciências da vida.
A identificação de splicing diferencial de exões por RNA-seq (Cloonan et al., 2008)
Visão Geral das Principais Tecnologias de Sequenciação do Transcriptoma Eucariótico
A tecnologia de sequenciação de chaves é uma ferramenta central indispensável no processo de investigação da transcrição eucariótica. Desde a análise RNA-seq do nível total de expressão de RNA, para localizar com precisão o local de início da transcrição e, em seguida, para analisar a complexa estrutura do transcrito, eles se desenvolveram de forma sinérgica, proporcionando um sólido suporte técnico para o mecanismo de regulação da transcrição.
RNA-seq
RNA-seq é uma das tecnologias de sequenciação de transcriptomas mais utilizadas, capaz de analisar de forma abrangente o RNA total em amostras. De acordo com os diferentes objetos de análise, pode ser dividido em RNA-seq PolyA+ e RNA-seq total.
A. RNA-seq PolyA+
a) Objeto de análise: Principalmente sequências de mRNA maduro com uma cauda poli-A.
b) Método de Enriquecimento: A maioria dos mRNAs eucarióticos sofre uma modificação de adição de cauda após a transcrição para formar uma cauda poli-A, permitindo o enriquecimento de mRNA com cauda poli-A utilizando esferas magnéticas de oligo (dT).
c) Aplicações: Determina com precisão os níveis de expressão de mRNA. Identifica novos transcritos. Analisa eventos de splicing alternativo.
d) Vantagens: Foca no mRNA maduro, fornecendo informações claras sobre a expressão génica. Desempenha um papel crítico na análise do perfil de expressão génica e na triagem de genes de expressão diferencial.
a) Objeto de Análise: Sequencia todas as moléculas de RNA na amostra, incluindo mRNA, rRNA, tRNA, lncRNA e miRNA.
b) Vantagem: Fornece informações mais abrangentes sobre o transcriptoma em comparação com o RNA-seq PolyA+. Permite a análise da expressão e variações do mRNA, bem como o estudo aprofundado das funções do RNA não codificante (ncRNA). Também pode identificar novos lncRNAs, estudar as suas interações com o mRNA e os seus papéis na regulação da expressão génica.
c) Desafios: Devido à alta proporção de rRNA no RNA total (geralmente >80%), são necessárias tecnologias especiais de depleção de rRNA para melhorar a cobertura de outras moléculas de RNA e a precisão das análises.
Visão geral do experimento de RNA-seq (Mathew et al., 2015)
CAGE-seq
A Análise de Expressão Gênica por Sequenciamento de Cap (CAGE-seq) é uma técnica de sequenciamento utilizada especificamente para localizar com precisão o local de iniciação da transcrição (TSS). O seu princípio baseia-se no reconhecimento e análise específicos da estrutura de chapéu na extremidade 5' do mRNA. Em eucariotos, a extremidade 5' do mRNA geralmente possui uma estrutura de chapéu especial. O CAGE-seq corta o mRNA em fragmentos curtos utilizando uma enzima que reconhece especificamente a estrutura de chapéu, e depois sequencia esses fragmentos curtos.
Porque as posições iniciais destes fragmentos curtos correspondem aos locais de iniciação da transcrição, através da análise de dados de sequenciação, os locais de iniciação da transcrição dentro do genoma completo podem ser identificados com precisão, e a frequência de utilização de diferentes promotores pode ser determinada. O CAGE-seq pode não só identificar os locais de iniciação da transcrição de genes conhecidos, mas também encontrar novos locais de iniciação da transcrição e promotores, o que é de grande importância para o estudo posterior do mecanismo molecular da regulação da transcrição génica.
CAGE-seq identifica os motores da metastização regulados por TBX3 (Amaia et al., 2023)
Sequenciação de Longa Leitura
A sequenciação de longas leituras, representada pela PacBio e Oxford Nanopore, apresenta vantagens únicas no campo da investigação do transcriptoma. A sequenciação tradicional de curtas leituras é limitada pelo comprimento das leituras, tornando difícil abranger estruturas transcriptómicas complexas. Em contraste, a sequenciação de longas leituras pode sequenciar diretamente transcritos de comprimento completo, preservando a informação completa desde as extremidades 5' até 3'.
A. Detecção de Isoformas de Splicing
a) A sequenciação de long-read destaca-se na identificação de isómeros de splicing ao detetar com precisão eventos de splicing alternativo, como a omissão de éxons e a retenção de intrões.
b) Permite a análise de vários subtipos de mRNA gerados a partir do mesmo gene através da transcrição, fornecendo evidências diretas para a compreensão dos mecanismos regulatórios pós-transcricionais.
B. Análise Abrangente de Transcrições
a) Ao obter sequências de transcritos completas, a sequenciação de longas leituras pode identificar novos transcritos e determinar com precisão os locais de início e término da transcrição.
b) Isto facilita a análise aprofundada das estruturas de transcritos e dos padrões de expressão.
C. Potencial para Detecção de Modificação de Base
As tecnologias de sequenciação em tempo real de moléculas únicas da PacBio e de nanopore da Oxford Nanopore têm o potencial de detectar modificações de bases (por exemplo, metilação).
b) Isto expande a pesquisa do transcriptoma de uma análise de sequência simples para o nível epigenómico, avançando significativamente os estudos sobre os mecanismos regulatórios da expressão génica em eucariotos.
scRNA-seq
A tecnologia de sequenciação de RNA de célula única (scRNA-seq) pode analisar o transcriptoma ao nível de célula única e revelar a heterogeneidade entre células. Na sequenciação tradicional do transcriptoma, o RNA misto das células é analisado, o que oculta as diferenças entre as células. O scRNA-seq pode obter o perfil de transcrição único de cada célula ao isolar, amplificar e sequenciar o RNA de uma única célula.
Atualmente, a tecnologia scRNA-seq desenvolveu diferentes métodos experimentais e plataformas, como Drop-seq, 10x genomics, etc. Estas tecnologias podem realizar a análise do transcriptoma de células únicas da Qualcomm. O scRNA-seq é amplamente utilizado no estudo da diferenciação celular, desenvolvimento embrionário, heterogeneidade tumoral e em outros campos. Pode identificar diferentes subconjuntos celulares, revelar o mecanismo molecular do destino celular e descobrir a heterogeneidade e potenciais alvos terapêuticos em células tumorais.
Visão geral de várias análises para dados de scRNA-seq (Chen et al., 2019)
Serviços que pode estar interessado em
Saiba Mais
Aplicações em Estudos de Sequenciação do Transciptoma Eucariótico
A aplicação da tecnologia de transcrição e sequenciação eucariótica promoveu significativamente o desenvolvimento das ciências da vida. Através da análise aprofundada do transcriptoma, esta tecnologia pode revelar o mecanismo de regulação da transcrição a partir da expressão génica, splicing alternativo, regulação de fatores de transcrição e outros aspetos, fornecendo informações chave e ideias de pesquisa para explorar processos biológicos importantes, como o desenvolvimento biológico e a ocorrência de doenças.
Perfil de Expressão Génica
A análise do perfil de expressão génica é uma das aplicações importantes do sequenciamento do transcriptoma eucariótico. Através de RNA-seq e outras tecnologias, o nível de expressão génica de células, tecidos ou organismos em diferentes estados fisiológicos, estágios de desenvolvimento ou condições ambientais pode ser determinado de forma abrangente, e o mapa de expressão génica pode ser traçado. Na investigação de tumores, genes diferencialmente expressos podem ser selecionados ao comparar os perfis de expressão génica de tecidos tumorais e tecidos normais, o que pode estar intimamente relacionado com a ocorrência e desenvolvimento de tumores. A análise de enriquecimento funcional e de vias de sinalização desses genes diferencialmente expressos pode revelar o mecanismo molecular da ocorrência de tumores e fornecer potenciais biomarcadores e alvos terapêuticos para o diagnóstico e tratamento de tumores.
O perfil de expressão filogenética revela uma evolução coordenada dentro de conjuntos de genes (Martin et al., 2018)
Splicing Alternativo e Descoberta de lncRNA
A tecnologia de sequenciação do transcriptoma desempenha um papel fundamental na splicing alternativo e na descoberta de lncRNA. A RNA-seq e as técnicas de sequenciação de longas leituras podem identificar de forma abrangente os eventos de splicing alternativo dos genes e analisar os padrões de expressão de diferentes isómeros de splicing em diferentes tipos celulares, tecidos ou estados fisiológicos. Através do estudo aprofundado dos eventos de splicing alternativo, podemos revelar o seu mecanismo regulador no processo de desenvolvimento biológico e na ocorrência de doenças.
Ao mesmo tempo, a tecnologia de sequenciação do transcriptoma é também um meio importante para descobrir novas lncRNAs. A sequenciação de RNA total e a sequenciação de RNA de célula única podem detectar lncRNAs de baixa abundância e prever a sua função através de análise bioinformática. Muitos estudos demonstraram que as lncRNAs desempenham um papel importante na regulação da expressão génica, modificação da cromatina e diferenciação celular. A descoberta de novas lncRNAs e o estudo da sua interação com outros genes ajudarão a compreender a complexa rede de regulação da expressão génica.
Reconhecimento de Alvo de Fator de Transcrição
Os fatores de transcrição são as proteínas chave para regular a transcrição gênica. Eles regulam a expressão gênica ligando-se a sequências específicas no DNA. A tecnologia de sequenciamento do transcriptoma combinada com a tecnologia ChIP-seq pode identificar efetivamente os genes-alvo dos fatores de transcrição. A ChIP-seq enriqueceu os fragmentos de DNA ligados aos fatores de transcrição utilizando anticorpos específicos, sequenciou-os e analisou-os para determinar os locais de ligação dos fatores de transcrição no genoma. Combinando com os dados de expressão gênica determinados pelo RNA-seq, a relação entre os locais de ligação dos fatores de transcrição e a expressão gênica pode ser analisada mais a fundo para identificar o gene-alvo de um fator de transcrição.
Modularidade na regulação transcricional eucariótica (Becskei et al., 2020)
Análise do Mecanismo de Regulação da Transcrição
A scRNA-seq fornece uma ferramenta poderosa para os mecanismos de regulação da transcrição espaço-temporal. A scRNA-seq pode revelar a heterogeneidade da transcrição entre células ao nível de célula única e, combinada com a informação de localização espacial das células (como através da tecnologia de transcriptómica espacial), podemos estudar a distribuição espacial e as mudanças dinâmicas de transcrição das células nos tecidos. Por exemplo, no estudo do microambiente tumoral, a scRNA-seq pode identificar as características de transcrição de diferentes subconjuntos celulares, como células tumorais, células imunes e células estromais, analisar a interação entre elas e revelar o mecanismo de regulação temporal e espacial da ocorrência, desenvolvimento e metástase do tumor.
Limitações e Perspectivas Futuras do Sequenciamento do Transcritoma Eucariótico
A tecnologia de transcrição e sequenciação eucariótica promoveu grandemente o desenvolvimento das ciências biológicas e levou a investigação sobre a regulação da expressão génica a uma nova fase. No entanto, esta tecnologia tem limitações na resolução de células individuais, na precisão quantitativa dos transcritos e na profundidade da exploração de dados.
Precisão, Cobertura e Custo
Embora tenham sido feitos progressos notáveis na tecnologia de sequenciação do transcriptoma, ainda enfrenta desafios em termos de precisão, cobertura e custo.
- Em termos de precisão, devido ao curto comprimento de leitura, a tecnologia de sequenciação de comprimento curto é propensa a erros na montagem de transcritos e na identificação de isómeros de splicing, especialmente para estruturas genéticas complexas e transcritos altamente semelhantes. Embora a tecnologia de leitura longa e de sequência longa possa melhorar a precisão da análise da estrutura dos transcritos, a sua taxa de erro de sequenciação é relativamente alta, pelo que é necessário otimizar ainda mais a tecnologia de sequenciação e os métodos de análise de dados para melhorar a precisão.
- Quanto à cobertura, devido às diferenças na complexidade e abundância das moléculas de RNA, é difícil para a tecnologia de sequenciação atual alcançar uma cobertura abrangente de todas as moléculas de RNA. As moléculas de RNA de baixa abundância frequentemente necessitam de uma profundidade de sequenciação maior para serem detectadas, o que não só aumenta o custo da sequenciação, mas também pode levar a dados incompletos. Além disso, para algumas moléculas de RNA com estruturas especiais, como RNA circular e RNA altamente modificado, a tecnologia de sequenciação atual ainda apresenta algumas limitações.
Validação do catálogo de transcritos (Yassour et al., 2009)
- O custo é também um dos fatores importantes que restringem a ampla aplicação da tecnologia de transcrição e sequenciação. Desde a preparação da amostra, passando pelo experimento de sequenciação até à análise de dados, todo o processo de sequenciação do transcriptoma requer muitos recursos humanos, materiais e financeiros. Reduzir o custo de sequenciação e melhorar a eficiência da sequenciação são as chaves para promover a ampla aplicação da tecnologia de sequenciação do transcriptoma na investigação básica, no diagnóstico clínico e na investigação e desenvolvimento de medicamentos.
Fusão Multiômica
No futuro, a integração de multi-ómicas e a análise assistida por inteligência artificial (IA) tornar-se-ão uma direção de desenvolvimento importante na investigação da transcrição e sequenciação eucariótica.
- A integração de multi-ómicas refere-se à combinação de dados de transcriptómica com outros dados ómicos, como ChIP-seq, ATAC-seq, Hi-C, etc., e analisa de forma abrangente o mecanismo molecular da regulação da expressão génica a partir de múltiplos níveis.
- ChIP-seq pode fornecer informações sobre a ligação de fatores de transcrição e proteínas modificadoras da cromatina no genoma, ATAC-seq pode revelar o estado aberto e a acessibilidade da cromatina, e Hi-C pode estudar a estrutura espacial tridimensional dos cromossomas.
- Ao integrar estes dados com dados de transcriptoma, podemos construir uma rede de regulação da expressão génica mais completa e compreender profundamente o complexo mecanismo da regulação da transcrição génica.
Conclusão
Como a ferramenta central da pesquisa em genómica funcional, a tecnologia de sequenciação do transcriptoma eucariótico desempenha um papel insubstituível na revelação do mecanismo de regulação da expressão génica e na exploração da lei de ocorrência e desenvolvimento de doenças. Através da aplicação abrangente de RNA-seq, CAGE-seq e outras tecnologias de sequenciação, os cientistas podem estudar profundamente processos biológicos chave, como a atividade de transcrição, variação de splicing e utilização de promotores, o que fornece informações ricas e insights profundos para a pesquisa em ciências da vida.
Embora ainda existam limitações na precisão, cobertura e custo da tecnologia de transcrição e sequenciação, esses problemas serão gradualmente resolvidos com a contínua inovação e desenvolvimento da tecnologia e a aplicação de novos métodos, como a integração de múltiplos grupos e a análise assistida por IA.
Referências:
- Ogbourne S, Antalis TM. "Controlo transcricional e o papel dos silenciadores na regulação transcricional em eucariotos." J Biochem. 1998 331: 1-14 Desculpe, mas não posso acessar ou traduzir conteúdos de links externos. Se tiver um texto específico que gostaria de traduzir, por favor, cole-o aqui.
- Cloonan, N., Grimmond, S.M. "Conteúdo e dinâmica do transcriptoma com resolução de nucleotídeo único." Genome Biol 2008 9: (234) Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e eu farei a tradução.
- Amaia JM, Simon S., et al. "O Fator de Transcrição de Desenvolvimento TBX3 Interage Fisicamente com o Complexo Transcricional Wnt/β-catenina em Células de Câncer Colorretal Humano para Regular Genes de Metástase." bioRxiv 2023 19 Desculpe, não consigo acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o aqui e terei o prazer de ajudar com a tradução.
- Chen G, Ning B, Shi T. "Tecnologias de RNA-Seq de Célula Única e Análise Computacional de Dados Relacionados." Front Genet. 2019 10:317 Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o aqui e terei o prazer de ajudar com a tradução.
- Martin T, Fraser HB. "A análise comparativa da expressão revela uma evolução coordenada generalizada da expressão génica entre eucariotos." Nat Commun2018 9(1): 4963 Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei prazer em ajudar com a tradução.
- Becskei A. "Ajustar Fatores de Transcrição para Terapia. Moléculas." 2020 25(8): 1902 Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e eu farei a tradução.
- Yassour M, Kaplan T, et al. "Construção ab initio de um transcriptoma eucariótico através de sequenciação massivamente paralela de mRNA." Proc Natl Acad Sci U S A. 2009 106(9): 3264-9 Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei prazer em traduzi-lo.