Iso-Seq tecnologia, desenvolvida pela Pacific Biosciences, é um método de sequenciação do transcriptoma completo baseado em Sequenciação em tempo real de moléculas únicas PacBio Tecnologia (SMRT). Sequencia diretamente cDNA de comprimento total sem fragmentar moléculas de RNA, permitindo a geração de sequências de transcritos de alta qualidade que podem estender-se até 10 kb ou até mais. A principal vantagem do Iso-Seq reside na sua capacidade de oferecer informações completas sobre os transcritos, abrangendo a região não traduzida 5' (5'UTR), a região não traduzida 3' (3'UTR) e a cauda de poli-A. Isso contorna os processos complexos de splicing e reconstrução de transcritos inerentes à tecnologia tradicional de RNA-seq.
O Iso-Seq pode identificar com precisão fenómenos biológicos como eventos de splicing alternativo, locais de início e de paragem alternativos, genes de fusão e RNAs longos não codificantes (lncRNAs). Isto oferece uma nova perspetiva para investigar a regulação da expressão génica, a complexidade do transcriptoma e a função dos genes. Além disso, devido à sua capacidade de cobrir transcritos de comprimento total, o Iso-Seq é particularmente adequado para estudar espécies sem um genoma de referência. Pode revelar isómeros de transcritos e novos genes que as abordagens tradicionais. RNA-seq métodos falharam em detectar.
A tecnologia Iso-Seq tem uma importância significativa em genómica e transcriptómica pesquisa devido às suas capacidades de sequenciação de transcritos completos. Não só melhora a precisão da anotação do genoma, mas também revela a complexidade do transcriptoma, promove a descoberta de novos genes e transcritos, e oferece uma ferramenta valiosa para o estudo de espécies de genomas não de referência.
Melhorar a precisão da anotação do genoma: A tecnologia Iso-Seq gera transcritos de comprimento completo, permitindo a determinação direta dos limites dos éxons, locais de splicing e locais de splicing alternativo. Isso leva a uma anotação genética mais precisa. Por exemplo, em estudos de transcriptoma de plantas, os transcritos de comprimento completo obtidos através do Iso-Seq melhoraram significativamente o refinamento dos modelos genéticos. Além disso, o Iso-Seq pode identificar genes de fusão e locais de metilação, aumentando ainda mais a informação disponível para a anotação do genoma.
Revelando a complexidade do transcriptoma: A tecnologia Iso-Seq permite uma análise abrangente da intrincada estrutura do transcriptoma, incluindo eventos de splicing alternativo, RNAs não codificantes, degradação de mRNA (NMD) e poliadenilação. Em estudos em mamíferos, por exemplo, a Iso-Seq revelou numerosos novos genes e transcritos que não estavam cobertos pelo transcriptoma de referência, destacando a sua superioridade na exploração da complexidade do transcriptoma.
Promover a descoberta de novos genes e novos transcritos: A capacidade do Iso-Seq de gerar sequências completas oferece uma vantagem distinta na descoberta de novos genes e transcritos. Na investigação da soja, os dados do Iso-Seq cobriram mais de 80% dos locais de genes identificados pelo RNA-Seq e descobriram muitos genes novos. Além disso, o Iso-Seq tem sido utilizado para detectar a expressão de pseudogenes em mamíferos, lançando luz sobre o papel dos pseudogenes nas dinâmicas de desenvolvimento.
Descoberta e anotação de genes
a) Identificação de novos genes e isoformas
A descoberta de genes é uma tarefa fundamental na investigação genómica. O software moderno de bioinformática capacita os investigadores a identificar de forma eficiente genes a partir de sequências genómicas, especialmente em procariotos como bactérias, arqueias e vírus, onde o processo é relativamente simples e preciso.
As tecnologias de inteligência artificial, particularmente os algoritmos de aprendizagem profunda, desempenham um papel crucial na anotação do genoma. Estes algoritmos melhoram a precisão e a velocidade da previsão de genes. Por exemplo, ao integrar informações estatísticas com comparações a sequências codificantes conhecidas, o algoritmo de genoma duplo pode localizar com precisão novas regiões de genes.
Análise da expressão diferencial de lncRNA (Zhang et al., 2022)
b) Refinamento de modelos de genes
A anotação genética envolve não apenas a localização dos genes, mas também a definição precisa das suas estruturas internas, como íntrons e éxons. Este processo geralmente requer a integração de vários métodos computacionais, incluindo comparações de sequências com bases de dados de genes conhecidos e a otimização dos resultados de anotação utilizando algoritmos de aprendizagem automática. A anotação em todo o genoma é especialmente vital após a conclusão do sequenciamento do genoma para novas espécies, pois fornece uma base para a pesquisa funcional subsequente.
Serviços que pode estar interessado em
Quer saber mais sobre os detalhes do Iso-seq? Confira estes artigos:
Genómica comparativa
a) Análise interespécies das estruturas genéticas
A genómica comparativa envolve a comparação de sequências genómicas entre diferentes espécies para descobrir relações evolutivas e elementos conservados. Esta abordagem não só ajuda a identificar semelhanças e diferenças entre espécies, mas também contribui para a compreensão da expansão e contração de famílias de genes. Por exemplo, ao analisar as regiões codificantes dos genes BPI em várias espécies, os investigadores podem explorar a sua diversidade genética e disparidades funcionais entre diferentes organismos.
b) Perspectivas evolutivas
A genómica comparativa oferece uma ferramenta poderosa para compreender a evolução das espécies. Ao analisar a proteína TCTP em diferentes espécies, os investigadores elucidaram a sua diferenciação funcional e trajetória evolutiva. Mecanismos de replicação genética, como crossover, inversão e multiplicação de cromossomas, também desempenham um papel significativo na evolução, facilitando o surgimento de novas funções. Ao comparar dados genómicos de diferentes espécies, os investigadores podem explorar o impacto da seleção genómica na variação de traços.
A descoberta de genes, anotação e genómica comparativa são amplamente aplicadas na investigação moderna em ciências da vida. Em áreas como medicina, agricultura e ciências ambientais, os investigadores podem compreender melhor os padrões de expressão génica, as variações genéticas relacionadas com doenças e a base genética de características complexas através da anotação do genoma e da análise comparativa. Com o avanço da computação de alto desempenho e das tecnologias de computação em nuvem, o processamento de dados genómicos em grande escala tornou-se mais eficiente, impulsionando ainda mais a investigação nessas áreas. Estes aspetos da investigação em genómica não só impulsionam o progresso da ciência básica, mas também fornecem um apoio crucial para o diagnóstico clínico, desenvolvimento de medicamentos e aplicações em biotecnologia.
A L1-lncRNA LINC01876 é um transcrito específico do ser humano (Raquel et al., 2023)
A. Estudos de splicing alternativo
a) Identificação de variantes de splicing
A splicing alternativo é um processo pelo qual um único gene gera múltiplas isoformas de mRNA através de diferentes padrões de splicing, aumentando assim a diversidade da expressão gênica. Tecnologias de sequenciação de alto rendimento, como RNA-Seq, fornecer um meio robusto para estudar de forma abrangente a splicing alternativa. O rMATS, por exemplo, é um método estatístico utilizado para detectar e quantificar a splicing alternativa diferencial em dados de RNA-Seq repetitivos. Ele pode lidar com amostras emparelhadas, como estudos de caso-controle, e levar em conta a variação individual. Ferramentas como o IsoformSwitchAnalyzeR também podem prever variantes de splicing ao calcular mudanças nos locais de splicing.
b) Implicações funcionais de isoformas alternativas
A splicing alternativo não só adiciona complexidade ao transcriptoma, mas também pode influenciar a função das proteínas. Algumas isoformas alternativas podem possuir funções biológicas específicas, como a regulação da expressão génica. Na investigação do câncer, demonstrou-se que o splicing alternativo contribui para o desenvolvimento da doença ao alterar a estrutura e a função das proteínas. Além disso, estudos revelaram que os eventos de splicing alternativo são altamente específicos de tecido e podem impactar significativamente a função celular.
A splicing alternativo está desregulado em várias regiões cerebrais afetadas em modelos de rato SCA com expansão de CAG (Hannah et al., 2024)
B. Perfilamento do transcriptoma
a) Análise quantitativa da expressão de isoformas
Uma aplicação chave da análise do transcriptoma é a avaliação quantitativa dos níveis de expressão de isoformas. Isso geralmente depende de dados de RNA-Seq e é alcançado através da identificação de leituras em locais de splicing. O algoritmo MISO, por exemplo, pode medir os níveis de expressão relativa de diferentes isoformas resultantes de eventos de skipping de éxons. Uma variedade de recursos computacionais e métodos estatísticos foram desenvolvidos para calcular a diversidade do transcriptoma e das isoformas.
b) Uso diferencial de isoformas em diferentes condições
A splicing alternativo apresenta diferenças significativas na utilização de isoformas sob diferentes condições. Durante o desenvolvimento, por exemplo, a abundância de eventos de splicing alternativo aumenta substancialmente. Alguns estudos também descobriram que o splicing alternativo sofre alterações significativas em estados de doença, como o câncer, o que pode oferecer novos biomarcadores para o diagnóstico e tratamento da doença.
Mapa de calor dos 50 genes diferencialmente expressos entre os estágios iniciais e tardios do desenvolvimento da semente em S. tora (Kang et al., 2020)
A splicing alternativo e a análise do transcriptoma são ferramentas essenciais na investigação biológica moderna. Elas não apenas revelam a complexidade da expressão génica, mas também fornecem uma nova perspetiva para compreender a função dos genes e os mecanismos das doenças. Ao combinar sequenciação de alto débito Com a tecnologia de ferramentas de bioinformática avançadas, os investigadores podem realizar análises mais abrangentes de splicing alternativo e das suas alterações sob várias condições, promovendo assim o desenvolvimento da investigação básica e clínica.
Aplicações bem-sucedidas de Iso-Seq em estudos publicados
Pesquisa do transcriptoma em plantas: A tecnologia Iso-Seq demonstrou vantagens notáveis nos estudos do transcriptoma das plantas. Através do PacBio Iso-Seq, os investigadores podem gerar transcritos de comprimento completo, evitando os problemas associados à reconstrução do transcriptoma causados pelos comprimentos de leitura curtos do RNA-Seq tradicional. Isso permite que o Iso-Seq tenha um bom desempenho na anotação de genes e na descoberta de novos genes. identificação de RNA não codificante longo (lncRNA)e deteção de isómeros de emenda.
Resumo dos dados Iso-Seq (Liu et al., 2022)
Melhoria da anotação do genoma: No estudo de plantas modelo como Arabidopsis thaliana, a reanálise da anotação do genoma do TAIR10 utilizando a tecnologia Iso-Seq recuperou com sucesso quase 60% do modelo de gene e identificou novos loci de genes. Este resultado destaca a capacidade da Iso-Seq de melhorar significativamente a precisão e a completude da anotação do genoma.
Análise do transcriptoma de plantas não-modelo: A pesquisa sobre Halogeton glomeratus demonstrou que a tecnologia Iso-Seq pode fornecer dados completos do transcriptoma e revelar os complexos mecanismos moleculares das respostas das plantas ao stress salino. Isto é de grande importância para o melhoramento de culturas tolerantes ao sal.
Aplicação na investigação do cancro: A tecnologia Iso-Seq é amplamente utilizada na investigação do cancro. Ao sequenciar RNA de comprimento completo, pode revelar a heterogeneidade das células tumorais e os padrões de expressão génica. Por exemplo, a combinação do kit de RNA de comprimento completo Kinnex com a tecnologia Iso-Seq permite que os investigadores obtenham dados de transcriptoma de cancro de alta qualidade, oferecendo novas perspetivas para o tratamento do cancro.
Biotecnologia agrícola: Na investigação sobre o trigo, a integração da tecnologia TeloPrime com a sequenciação Iso-Seq permitiu aos investigadores construir uma biblioteca de anotação do genoma hexaploide do trigo de alta qualidade. Isto fornece um apoio crucial para futuras investigações sobre a função dos genes do trigo e para a melhoramento.
Predição das funções do isoforma Iso-Seq em G. purpurascens (Abdul et al., 2024)
Impacto na investigação biomédica e na melhoramento de plantas
As aplicações do Iso-Seq na investigação biomédica e na melhoria de plantas tiveram um impacto significativo nestes campos. Na investigação biomédica, o Iso-Seq tem o potencial de identificar novos biomarcadores e alvos terapêuticos para uma variedade de doenças, incluindo cancro, distúrbios neurológicos e doenças autoimunes. Ao fornecer uma imagem mais completa e precisa do transcriptoma, o Iso-Seq pode ajudar os investigadores a compreender os mecanismos moleculares subjacentes ao desenvolvimento e progressão da doença.
Investigação biomédica: Na investigação biomédica, o Iso-Seq tem o potencial de identificar novos biomarcadores e alvos terapêuticos para várias doenças, incluindo cancro, distúrbios neurológicos e doenças autoimunes. Ao fornecer uma visão mais completa e precisa do transcriptoma, o Iso-Seq ajuda os investigadores a compreender os mecanismos moleculares subjacentes ao desenvolvimento e progressão da doença. O sequenciamento de RNA de comprimento total permite uma identificação mais precisa de variantes de splicing relacionadas com a doença, genes de fusão e locais de mutação, o que é benéfico para compreender os mecanismos da doença e fornecer suporte de dados para a medicina personalizada.
Melhoramento de plantas: No melhoramento de plantas, a tecnologia Iso-Seq ajuda os investigadores a compreender melhor as redes regulatórias genéticas das plantas, fornecendo dados abrangentes do transcriptoma. Na investigação do algodão, a análise das mudanças dinâmicas do transcriptoma sob diferentes stress abióticos revelou os mecanismos de resposta do algodão à seca, salinidade e outros stress, fornecendo importantes marcadores moleculares para o melhoramento.
Iso-Seq preenche lacunas em transcritos que codificam proteínas de armazenamento de sementes (Zhang et al., 2024)
Melhorar a precisão da anotação do genoma: A tecnologia Iso-Seq melhora significativamente a precisão da anotação do genoma ao gerar transcritos de comprimento completo. Na investigação sobre soja (Glycine max), o Iso-Seq revelou mais de 80% dos loci gênicos e detectou numerosas variações alélicas, estabelecendo a base para a melhoria genética da soja e a pesquisa de genes funcionais.
Promover o desenvolvimento da genómica funcional de plantas: A aplicação da tecnologia Iso-Seq avançou significativamente o desenvolvimento da genómica funcional de plantas. Na investigação do arroz, a combinação de dados de RNA-Seq de leituras curtas e Iso-Seq permitiu aos investigadores construir um mapa de expressão génica mais abrangente, fornecendo uma referência importante para a melhoramento molecular do arroz.
Promover a proteção da biodiversidade agrícola: A tecnologia Iso-Seq também desempenha um papel crucial na proteção da biodiversidade agrícola. Na investigação sobre mangas, a análise do mapeamento de associação genómica utilizando a tecnologia Iso-Seq ajuda os investigadores a compreender melhor a base genética da qualidade do fruto e da resistência ao stress, fornecendo uma base científica para a melhoria genética da manga.
Iso-Seq representa um avanço formidável nos domínios da genómica e da transcriptómica, oferecendo capacidades sem igual para a identificação de novos genes e isoformas, o aprimoramento de modelos de genes e a análise detalhada das estruturas genéticas em diversas espécies. Na genómica, o Iso-Seq facilita a descoberta de novos elementos genéticos e melhora a precisão das anotações genéticas.
Na esfera da transcriptómica, fornece informações cruciais sobre os mecanismos de splicing alternativo e os cenários regulatórios da expressão génica. Além disso, o Iso-Seq tem sido cada vez mais aplicado à investigação em plantas, oncologia e biotecnologia agrícola, onde revela caminhos complexos de regulação génica, elucida características tumorais e ajuda na construção de anotações genómicas de alta fidelidade.
Olhando para o futuro, a integração do Iso-Seq com conjuntos de dados ómicos adicionais promete gerar insights biológicos abrangentes. As suas potenciais aplicações clínicas, particularmente nas áreas de diagnóstico de doenças e intervenções terapêuticas, parecem promissoras. Além disso, a utilidade do Iso-Seq na promoção de uma agricultura sustentável representa um avanço significativo. Assim, o Iso-Seq está bem posicionado para fazer contribuições substanciais ao campo da investigação científica no futuro próximo.
Referências: