Sequenciação de Transcritos de Comprimento Total (Iso-Seq)
A CD Genomics tem uma vasta experiência na oferta do serviço Iso-Seq, produzindo transcritos completos sem montagem. Um rigoroso controlo de qualidade é realizado após cada procedimento para garantir resultados abrangentes e precisos.
O que é Iso-Seq?
A sequenciação de isoformas (Iso-Seq) é uma sequenciação de alto rendimento tecnologia desenvolvida pela PacBio, aproveitando a tecnologia de Molécula Única em Tempo Real (SMRT). Ao contrário de fragmentos Sequenciação de RNA métodos que requerem reassemblagem, o Iso-Seq sequencia diretamente transcritos de cDNA de comprimento completo, abrangendo a região não traduzida 5' (5' UTR) até à cauda de poliadenilação 3' (polyA). Esta abordagem permite uma análise mais precisa do conjunto de genes-alvo ou do transcriptoma completo, fornecendo informações que são, de outra forma, difíceis de obter através de métodos tradicionais. Sequenciação de Nova Geração (NGS) técnicas.
A Introdução do Iso-Seq
Em organismos eucarióticos, um único gene pode codificar um número surpreendente de proteínas após a splicing alternativa, cada uma com uma função biológica distinta. Existem genes humanos conhecidos que têm funções muito diferentes dependendo de qual variante de splicing é expressa. Com a splicing alternativa a ser tão crítica para a função do genoma.
RNA-Seq de leitura curta trabalhos ao cortar fisicamente os isoformas de transcritos em pedaços menores e reassemblando, deixando possibilidades para montagem incorreta ou captura incompleta da plena diversidade de isoformas dos genes de interesse. É importante capturar transcritos de comprimento total. Ao tirar proveito de Sequenciação de leituras longas PacBio SMRT A tecnologia de sequenciação de isoformas (Iso-Seq) pode facilmente cobrir o transcrito completo desde a extremidade 5' até a cauda poli-A 3', sem a necessidade de fragmentação para obter sequências de cDNA de comprimento completo, o que é útil para identificar novos transcritos e novos intrões, permitindo assim identificar com precisão isoformas, locais de splicing alternativo, expressão de genes de fusão e expressão alélica.
Comparado com a plataforma Illumina, a análise PacBio pode detectar facilmente moléculas de RNA policistrónicas muito longas (chamadas transcritos complexos) e revelar uma ampla variedade de sobreposições transcripcionais novas entre genes adjacentes e distantes situados em paralelo. É útil para levantar a possibilidade de estudar uma rede genómica que exerce um controlo conjunto na expressão génica e na replicação.
Nós também fornecemos Sequenciação de Transcritos de Comprimento Total com Nanoporos serviços. Para mais detalhes, por favor visite a página relevante.
Principais Características e Vantagens do Iso-Seq
- Aquisição direta de sequências de transcritos completos, permitindo uma reflexão mais precisa da informação do transcriptoma para as espécies sequenciadas.
- Deteção de múltiplas formas de splicing alternativo, revelando locais de splicing adicionais e eventos de splicing alternativo.
- Descoberta de novos genes funcionais, aumentando a anotação do genoma.
- Facilitação da análise precisa de genes de fusão, genes homólogos, superfamílias de genes ou alelos.
- Alta precisão, continuidade e completude das sequências de transcritos.
- Integrado com a segunda geração sequenciação do transcriptoma, permitindo a quantificação precisa tanto a nível de gene como de transcrito.
- Alta adaptabilidade das espécies, permitindo a análise com ou sem um genoma de referência.
Aplicações do Iso-Seq
- Anotação Genómica: Realizar uma anotação precisa de novos genomas, fornecendo informações de transcritos de alta qualidade.
- Análise do Transcriptoma: Investigar a diversidade de transcritos em vários tecidos ou tipos celulares, elucidando a complexidade da expressão génica.
- Investigação de Doenças: Identificar fusões genéticas específicas e eventos de splicing alternativo em estudos de cancro e doenças genéticas.
- Biotecnologia Agrícola: Aplicar na investigação em genómica de culturas para melhorar as estratégias de melhoramento de variedades de culturas.
Fluxo de Trabalho Iso-Seq
A CD Genomics utiliza a tecnologia PacBio SMRT para Sequenciação de Transcritos de Comprimento Completo (Iso-Seq). Este método avançado envolve a extração de RNA de alta qualidade, a síntese de cDNA de comprimento completo, a construção de bibliotecas de cDNA e a realização de sequenciação de alta fidelidade para capturar sequências completas de transcritos, garantindo uma análise do transcriptoma abrangente e precisa.

Especificações de Serviço
Requisitos de Amostra
|
|
Clique |
Estratégia de Sequenciamento
|
| Análise Bioinformática
Fornecemos múltiplas análises de bioinformática personalizadas: Transcritosoma sem Referência Análise de dados padrão
Análise de dados padrão
|
Pipeline de Análise

Entregáveis
- Os dados de sequenciamento originais
- Resultados experimentais
- Relatório de análise de dados
- Detalhes em Iso-Seq para a sua escrita (personalização)
Sequenciação de longa leitura permite a identificação simples de transcritos alternadamente transcritos ou processados, unidades de transcrição policistrónicas e outras longas sequências de cDNA. Com experiência e dedicação, a avançada plataforma PacBio SMRT e os serviços da CD Genomics serão o seu melhor companheiro em Iso-Seq. Por favor, contacte-nos para mais informações e um orçamento detalhado.
Resultados da Demonstração
Os resultados parciais estão mostrados abaixo:

Perguntas Frequentes sobre Iso-Seq
1. No campo da transcriptómica, o que se refere a isoforma e transcrito, e quais são as suas diferenças?
Uma isoforma denota moléculas de RNA que são transcritas do mesmo locus gênico, mas exibem variações estruturais. Em contraste, um transcrito de RNA é uma cópia da molécula de RNA produzida durante a transcrição do gene. Essencialmente, ambos os termos descrevem a mesma entidade - moléculas de RNA. No entanto, a ênfase difere: a isoforma destaca as diferenças estruturais nas moléculas de RNA, como as regiões TSS, CDS e UTR, enquanto o transcrito foca no processamento pós-transcricional que as moléculas de RNA sofreram, como quais exões foram unidos.
2. Quais são as características dos transcritos alvo da sequenciação Iso-Seq?
- Estrutura Típica: Os transcritos de mRNA eucariótico geralmente consistem em um cap 5', UTR 5', CDS, UTR 3' e cauda poliA. O Iso-Seq aproveita a poliA ou sequências específicas para enriquecer mRNA ou direcionar RNAs de genes específicos.
Figura 1 Estrutura típica do mRNA.
- Distribuição de Comprimento: Os comprimentos dos transcritos variam predominantemente entre 1 a 3 quilobases. Por exemplo, mais de 99% dos transcritos humanos são mais curtos do que 10 quilobases, o que permite que o Iso-Seq alcance facilmente o sequenciamento de comprimento total.
- Complexidade: Após a transcrição, um gene pode sofrer splicing alternativo para produzir múltiplos transcritos com diferentes funções biológicas. Distinguir com precisão estas pequenas diferenças estruturais entre os transcritos tem apresentado desafios significativos para as técnicas anteriores ao Iso-Seq.
3. Quais são os tipos de designs SMRTbell para bibliotecas Iso-Seq suportadas pelo PacBio?
Atualmente, as bibliotecas de sequenciamento Iso-Seq suportadas pela PacBio incluem vários tipos de designs SMRTbell:
Figura 2 Design do SMRTbell.
Estes designs permitem aplicações flexíveis: ao adicionar opcionalmente códigos de barras, o Iso-Seq suporta tanto sequenciação de amostras únicas como sequenciação multiplexada; ao utilizar diferentes primers para a transcrição reversa, facilita tanto a sequenciação de todo o transcriptoma como a sequenciação direcionada de conjuntos específicos de genes.
4. Quais são os passos básicos envolvidos na pré-processamento de dados do Iso-seq e quais são os seus objetivos?
A pré-processamento de dados Iso-Seq é realizado através dos componentes das ferramentas SMRT ccs, lima e IsoSeq3. Os passos incluem:
- Correção de erros de sequenciamento aleatórios em subleituras sob o modo de sequenciamento ccs para obter leituras HiFi de alta qualidade.
- (Para sequenciação multiplexada) Dividir amostras utilizando códigos de barras e remover sequências de primers de códigos de barras.
- Identificação e remoção de caudas poliA e concatenados.
- Agrupamento e desduplicação de leituras para gerar sequências consensuais.
Estudos de Caso Iso-Seq
Utilizando PacBio Iso-Seq para a Descoberta de Novos Transcritos e Genes em Respostas a Estresses Abióticos em Oryza sativa L..
Revista: Jornal Internacional de Ciências Moleculares
Fator de impacto: 6,208
Publicado: 31 de outubro de 2020
Fundo
A mudança climática global agrava as condições de stress abiótico, impactando negativamente os rendimentos das culturas. O arroz, um alimento básico para mais de metade da população mundial, possui uma vasta diversidade genética. No entanto, os estudos atuais baseiam-se no genoma de referência japonica, podendo perder informações genéticas cruciais de outras subespécies. Para abordar esta questão, os autores utilizaram a tecnologia PacBio SMRT Iso-Seq para sequenciar e reconstruir transcriptomas parciais de várias subespécies de arroz, permitindo a descoberta de novos genes para a tolerância ao stress sem a necessidade de um genoma de referência existente.
Materiais e Métodos
Preparação de Amostras
- Material vegetal
- Arroz
- Extração de RNA
Sequenciação
- RNA-Seq
- De novo reconstrução do transcriptoma
- PacBio Iso-Seq
- Análise de InDel
- análise BUSCO
- Análise filogenética
- Anotação funcional
- Análise de expressão gênica diferencial
Resultados
Os autores selecionaram dez cultivares de arroz, isolando RNA de plantas cultivadas em diversas condições. O sequenciamento na plataforma PacBio produziu entre 15,49 e 24,51 gigabases por cultivar. Usando o IsoSeq3, obtiveram entre 37.535 e 54.594 transcrições completas de alta qualidade por cultivar, após filtrar sequências específicas de plantas e remover contaminantes.
Tabela 1. Amostragem para sequenciação de isoformas PacBio.

Durante a preparação da biblioteca, produtos de RNA degradados 5′ podem levar a isoformas redundantes que carecem de informações completas da sequência 5′. Três métodos - cogent, cDNA cupcake e TAMA - foram testados para colapsar essas redundâncias. Enquanto cDNA cupcake e TAMA utilizam um genoma de referência, cogent reconstrói um genoma codificante para o colapso. Todos os métodos reduziram significativamente o número de isoformas, com cogent a mostrar mais transcritos não correspondentes. Após o colapso, os comprimentos dos transcritos aumentaram e a singularidade das isoformas melhorou, particularmente com TAMA apresentando a maior proporção de isoformas únicas por locus gênico. A análise filogenética baseada em SNPs destacou clusters distintos por subespécies, enfatizando as diferenças genéticas entre cultivares aus, indica e japonica.
Figura 1. Análise da avaliação BUSCO de transcrições não colapsadas (a) e colapsadas (b).
Figura 2. Árvores filogenéticas construídas com SNPhylo.
O estudo utilizou o TAMA para colapsar transcrições HQ e cogentes para as não mapeadas, resultando em 10.511 a 15.011 loci genéticos e 14.255 a 20.803 modelos de isoformas únicas por cultivar. Cerca de um terço dos loci genéticos e metade dos modelos de transcritos corresponderam à referência Nipponbare. A anotação funcional revelou 60% a 70% de ORFs completos e destacou processos biológicos principais. No entanto, uma parte notável dos transcritos permaneceu não anotada, podendo originar-se de espécies selvagens de Oryza.
Figura 3. Fração de quadros de leitura abertos (ORFs) previstos utilizando o TransDecoder.
Para identificar transcritos comuns e específicos entre cultivares, foi utilizado um cultivar de cada subespécie (N22, IR64, Nipponbare) como base de dados de blast. Cerca de 9.000 transcritos foram comuns a todos os cultivares, com 652 únicos para N22 e 2426 para IR64. A análise de expressão gênica diferencial em N22 revelou 56 genes específicos de aus responsivos a estresses combinados de seca e calor, incluindo o gene B12288, que está regulado para cima e compartilha homologia com genes responsivos à seca em outras espécies de Oryza e Arabidopsis thaliana.
Figura 4. Alinhamento de sequência múltipla de cinco Oryza Proteínas de desidrina RAB21.
Conclusão
Os autores sequenciaram os transcriptomas de dez cultivares de arroz utilizando o PacBio Sequel, resultando em 37.500 a 54.600 isoformas de alta qualidade por cultivar. As suas reconstruções de novo incluíram cerca de 40% de isoformas novas em comparação com Nipponbare. Para a cultivar aus N22, tolerante à seca e ao calor, identificaram 56 genes diferencialmente expressos em sementes em desenvolvimento sob condições de campo, oferecendo uma forma económica de identificar genes de tolerância ao stress ausentes em montagens genómicas padrão.
Referência
- Schaarschmidt S, Fischer A, Lawas LM, et al. Utilizando PacBio iso-seq para a descoberta de novos transcritos e genes em respostas a stress abiótico em Oryza sativa L.. Revista Internacional de Ciências Moleculares. 2020, 21(21):8148.
Publicações Relacionadas
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
As comunidades bacterianas de Cassiopea nos Florida Keys partilham principais táxons bacterianos com os microbiomas de corais.
Diário: bioRxiv
Ano: 2024
Produção de uma Proteína Semelhante a Bacteriocina PEG 446 a partir de Clostridium tyrobutyricum NRRL B-67062
Revista: Probióticos e Proteínas Antimicrobianas
Ano: 2024
Desentrelaçando o Papel dos Patobiontes das Espécies de Bacteroides nas Doenças Inflamatórias Intestinais
Revista: bioRxiv
Ano: 2023
Um recurso genómico a nível de cromossoma para estudar os mecanismos de virulência e a evolução do patógeno da ferrugem do café Hemileia vastatrix.
Diário: bioRxiv
Ano: 2022
Streptomyces buecherae sp. nov., um actinobactéria isolada de várias espécies de morcegos
Jornal: Antonie Van Leeuwenhoek
Ano: 2020
Ver mais artigos publicados pelos nossos clientes.