PacBio Iso-Seq: Permitir uma Exploração Aprofundada do Splicing Alternativo
Splicing Alternativo
O splicing alternativo é um processo celular fundamental que permite que um único gene codifique múltiplas isoformas de proteínas, expandindo significativamente a diversidade funcional do proteoma. A caracterização precisa dos eventos de splicing alternativo é essencial para compreender a regulação gênica, funções específicas dos tecidos e mecanismos de doenças.
Técnicas tradicionais de sequenciamento de leituras curtas, embora eficazes em muitos contextos, muitas vezes não conseguem capturar com precisão a complexa paisagem do splicing alternativo devido às limitações dos comprimentos curtos das leituras e altas taxas de erro de sequenciamento. A tecnologia Iso-Seq da PacBio emergiu como uma ferramenta poderosa para análises abrangentes do transcriptoma, oferecendo sequenciamento de leituras longas em alta capacidade, que facilita a exploração do splicing alternativo com uma precisão e profundidade sem precedentes.
Estudos recentes demonstraram de forma convincente que mais de 90% dos genes humanos passam por um extenso splicing alternativo, resultando em uma diversidade de isoformas. Notavelmente, certos genes exibem um repertório surpreendente de mais de 10 isoformas. Concomitantemente, esses padrões dinâmicos de splicing frequentemente têm implicações cruciais para o crescimento, suscetibilidade a doenças, tumorigenese e várias formas de câncer. Surpreendentemente, os métodos convencionais de sequenciamento de leituras curtas muitas vezes falham em capturar uma parte substancial—variando de 60% a 80%—dessas nuances transcriptômicas intrincadas. Entra a investigação Iso-Seq, construída sobre a engenhosa tecnologia da PacBio, que oferece uma solução iluminadora ao permitir a detecção abrangente de moléculas de cDNA de comprimento total, aumentando substancialmente nossa capacidade de descobrir essas isoformas elusivas.
Estudo de Caso 1: Iso-Seq Revela Diversidade de Transcritos no Câncer de Mama
- Contexto
O câncer de mama é uma doença heterogênea caracterizada por uma ampla gama de alterações no transcriptoma que contribuem para a progressão tumoral e os resultados dos pacientes. Um dos principais mecanismos subjacentes à diversidade do transcriptoma é o splicing alternativo, que gera múltiplas isoformas de mRNA a partir de um único gene. No entanto, o espectro completo dos subtipos de splicing seletivo a nível de isoforma no câncer de mama permanece amplamente desconhecido. Os métodos tradicionais de sequenciamento de leituras curtas têm limitações em capturar com precisão isoformas de comprimento total e identificar eventos de splicing específicos do tumor. Neste estudo de caso, os pesquisadores visaram identificar e anotar de forma abrangente isoformas de comprimento total e eventos de splicing específicos do tumor no câncer de mama utilizando três gerações da tecnologia Iso-seq.
- Métodos
O estudo empregou a tecnologia Iso-seq, que se baseia no sequenciamento de leituras longas de moléculas únicas. Esta abordagem permite o sequenciamento direto de cDNAs de comprimento total, possibilitando a identificação de isoformas completas e a detecção precisa de eventos de splicing complexos. Os pesquisadores obtiveram amostras de câncer de mama de uma coorte diversificada de pacientes representando vários subtipos de câncer de mama. Eles realizaram sequenciamento Iso-seq nessas amostras, gerando dados transcriptômicos de alta qualidade e leituras longas.
Para identificar e anotar isoformas de comprimento total, os pesquisadores desenvolveram um pipeline de bioinformática que envolveu correção de erros, agrupamento de isoformas e geração de sequências de consenso. Eles também utilizaram anotações do genoma de referência para distinguir entre isoformas conhecidas e novas. Para identificar eventos de splicing específicos do tumor, os perfis de expressão a nível de isoforma das amostras tumorais foram comparados com amostras de tecido normal.
LR-seq identifica isoformas previamente não detectadas no câncer de mama. (Veiga et al., 2022)
- Resultados
Notavelmente, 30% dessas novas isoformas exibiram alterações que afetam exões codificadores de proteínas, indicando o potencial significado funcional dessas isoformas na biologia tumoral. Uma extensa validação cruzada das isoformas e eventos de splicing identificados foi realizada, aumentando a robustez das descobertas.
No total, os pesquisadores identificaram 3.059 eventos de splicing específicos do tumor de mama que não haviam sido caracterizados anteriormente. Notavelmente, 35 desses eventos de splicing estavam significativamente associados à sobrevivência dos pacientes, sugerindo seu potencial como marcadores prognósticos. Entre esses genes, 21 estavam ausentes de bancos de dados e literatura existentes, destacando o poder do sequenciamento de leituras longas na descoberta de novas características transcriptômicas. Além disso, 10 genes foram encontrados enriquecidos em subtipos específicos de câncer de mama, fornecendo insights sobre a paisagem de splicing específica do subtipo.
Estudo de Caso 2: Iso-Seq Revela Diversidade de Promotores em Diferentes Subtipos de Câncer Gástrico
- Contexto
A expressão gênica desregulada é uma característica definidora do câncer, desempenhando um papel crítico no desenvolvimento e progressão tumoral. Métodos tradicionais de análise de expressão gênica, frequentemente baseados em sequenciamento de segunda geração, têm sido limitados pela sua incapacidade de capturar transcritos de comprimento total, potencialmente perdendo informações importantes sobre a verdadeira paisagem transcricional nas células cancerígenas. Para superar essa limitação, foi realizado um estudo abrangente para investigar o perfil transcricional do câncer gástrico (CG) utilizando uma combinação das tecnologias Iso-seq e RNA-seq. Este estudo visou descobrir a diversidade do uso de promotores e splicing alternativo em diferentes subtipos de câncer gástrico.
- Métodos
O estudo concentrou-se na análise do transcriptoma de comprimento total de 10 linhagens celulares de câncer gástrico, abrangendo quatro subtipos distintos de CG. Para alcançar isso, os pesquisadores empregaram uma abordagem de duas frentes envolvendo as tecnologias Iso-seq e RNA-seq.
Tecnologia Iso-seq: A Iso-seq, um método de sequenciamento de última geração, foi utilizada para capturar transcritos de comprimento total. Este método forneceu comprimentos de leitura mais longos em comparação com o sequenciamento tradicional, permitindo uma representação mais precisa de todo o transcrito. Esta abordagem possibilitou a identificação de transcritos novos que poderiam ter sido perdidos por técnicas de sequenciamento anteriores.
Tecnologia RNA-seq: Além da Iso-seq, o RNA-seq foi empregado para obter dados quantitativos de expressão gênica. Esta tecnologia forneceu informações sobre a abundância relativa de diferentes transcritos nas linhagens celulares.
Paisagem do transcriptoma de leituras longas em linhagens celulares de câncer gástrico. (Huang et al., 2021)
- Resultados
Um número significativo de transcritos de comprimento total não redundantes foi identificado, com mais de 60% representando transcritos recém-descobertos. Isso destaca o poder do sequenciamento em comprimento em capturar elementos do transcriptoma que não foram anotados anteriormente. Transcritos novos foram encontrados como específicos de subtipo, sugerindo uma ligação potencial entre esses transcritos e os distintos subtipos de câncer gástrico. Além disso, parece haver uma preferência dependente do subtipo para o splicing alternativo. Os transcritos recém-descobertos exibiram características estruturais mais complexas em comparação com os transcritos previamente conhecidos, indicando a existência de mecanismos regulatórios intrincados envolvidos nesses subtipos de câncer gástrico. Promotores alternativos foram identificados em aproximadamente 25% dos genes analisados. Importante, muitos desses promotores alternativos estavam associados a mudanças funcionais nas proteínas que codificavam, potencialmente impactando a progressão da doença. O conjunto de dados abrangente gerado por este estudo tem implicações além de suas descobertas imediatas. Espera-se que as variantes de transcritos identificadas ofereçam um potencial diagnóstico aprimorado e contribuam para avaliações prognósticas mais precisas para diferentes subtipos de câncer gástrico.
Os resultados do estudo também forneceram um recurso valioso de dados do transcriptoma de comprimento total, não apenas para uma exploração mais aprofundada do câncer gástrico, mas também para o estudo de outras malignidades gastrointestinais.
Referências:
- Veiga, Diogo FT, et al. "Uma plataforma abrangente de análise de isoformas de leitura longa e recurso de sequenciamento para câncer de mama." Science Advances 8.3 (2022): eabg6711.
- Huang, Kie Kyon, et al. "O sequenciamento do transcriptoma de leitura longa revela uma abundante diversidade de promotores em distintos subtipos moleculares de câncer gástrico." Genome biology 22 (2021): 1-24.