Sequenciação de Transcritos de Comprimento Total (Iso-Seq)

A CD Genomics tem uma vasta experiência na oferta do serviço Iso-Seq, produzindo transcrições completas sem montagem. Um rigoroso controlo de qualidade é realizado após cada procedimento para garantir resultados abrangentes e precisos.

O que é Iso-Seq?

A sequenciação de isoformas (Iso-Seq) é uma sequenciação de alto rendimento tecnologia desenvolvida pela PacBio, aproveitando a tecnologia de Molecula Única em Tempo Real (SMRT). Ao contrário de fragmentos Sequenciação de RNA métodos que requerem reassemblagem, o Iso-Seq sequencia diretamente transcritos de cDNA de comprimento completo, abrangendo a região não traduzida 5' (5' UTR) até à cauda de poliadenilação 3' (polyA). Esta abordagem permite uma análise mais precisa do conjunto de genes-alvo ou do transcriptoma completo, fornecendo informações que são de outra forma difíceis de obter através de métodos tradicionais. Sequenciação de Nova Geração (NGS) técnicas.

A Introdução do Iso-Seq

Em organismos eucarióticos, um único gene pode codificar um número surpreendente de proteínas após o splicing alternativo, cada uma com uma função biológica distinta. Existem genes humanos conhecidos que têm funções muito diferentes dependendo de qual variante de splicing é expressa. Com o splicing alternativo a ser tão crítico para a função do genoma.

RNA-Seq de leitura curta trabalhos ao cortar fisicamente os isoformas de transcritos em pedaços menores e reassemblando, deixando possibilidades de montagem incorreta ou captura incompleta da totalidade da diversidade de isoformas dos genes de interesse. É importante capturar transcritos de comprimento total. Ao aproveitar-se de Sequenciação de leituras longas PacBio SMRT A tecnologia de sequenciação de isoformas (Iso-Seq) pode facilmente cobrir o transcrito completo desde a extremidade 5' até a cauda 3'-poly A, sem a necessidade de fragmentação para obter sequências de cDNA de comprimento completo, o que é útil para identificar novos transcritos e novos íntrons, permitindo assim identificar com precisão isoformas, locais de splicing alternativo, expressão de genes de fusão e expressão alélica.

Comparado com a plataforma Illumina, a análise PacBio pode detectar facilmente moléculas de RNA policistrónicas muito longas (chamadas transcritos complexos) e revelar uma ampla variedade de sobreposições transcricionais novas entre genes adjacentes e distantes situados em paralelo. Isso é útil para levantar a possibilidade de estudar uma rede genómica que exerce controlo conjunto sobre a expressão génica e a replicação.

Nós também fornecemos Sequenciação de Transcritos de Comprimento Total por Nanoporos serviços. Para mais detalhes, por favor visite a página relevante.

Principais Características e Vantagens do Iso-Seq

  • Aquisição direta de sequências de transcritos completos, permitindo uma reflexão mais precisa da informação do transcriptoma para as espécies sequenciadas.
  • Deteção de múltiplas formas de splicing alternativo, revelando locais de splicing adicionais e eventos de splicing alternativo.
  • Descoberta de novos genes funcionais, aumentando a anotação do genoma.
  • Facilitação da análise precisa de genes de fusão, genes homólogos, superfamílias de genes ou alelos.
  • Alta precisão, continuidade e completude das sequências de transcritos.
  • Integrado com a segunda geração sequenciação do transcriptoma, permitindo a quantificação precisa a níveis de gene e de transcrito.
  • Alta adaptabilidade das espécies, permitindo análise com ou sem um genoma de referência.

Aplicações do Iso-Seq

  • Anotação Genómica: Realizar uma anotação precisa de novos genomas, fornecendo informações de transcritos de alta qualidade.
  • Análise do Transcriptoma: Investigar a diversidade de transcritos em vários tecidos ou tipos celulares, elucidando a complexidade da expressão génica.
  • Investigação de Doenças: Identificar fusões genéticas específicas e eventos de splicing alternativo em estudos de câncer e doenças genéticas.
  • Biotecnologia Agrícola: Aplicar na investigação em genómica de culturas para melhorar as estratégias de melhoramento de variedades de culturas.

Fluxo de Trabalho Iso-Seq

A CD Genomics utiliza a tecnologia PacBio SMRT para Sequenciação de Transcritos de Comprimento Total (Iso-Seq). Este método avançado envolve a extração de RNA de alta qualidade, a síntese de cDNA de comprimento total, a construção de bibliotecas de cDNA e a realização de sequenciação de alta fidelidade para capturar sequências completas de transcritos, garantindo uma análise do transcriptoma abrangente e precisa.

The Workflow of Iso-Seq.

Especificações do Serviço

Sample Requirements Requisitos de Amostra
  • RNA total ≥ 2 μg, Quantidade Mínima: 600 ng, Concentração ≥30 ng/µL
  • RIN>8, 28S/18S≥1,5
  • OD260/280 ~2.0, OD260/230: 2.0-2.2
  • Todas as amostras de RNA são validadas quanto à pureza e quantidade.
Nota: Os montantes de amostra são apresentados apenas para referência. Para informações detalhadas, por favor contacte-nos com os seus pedidos personalizados.

Clique
Estratégia de Sequenciamento
  • Plataformas PacBio
  • Tipo de biblioteca > 4K
  • 6~10 G/por amostra
Bioinformatics Analysis Análise Bioinformática
Fornecemos várias análises de bioinformática personalizadas:
Transcritoma sem Referência
Análise de dados padrão
  • Análise de Isoformas de Comprimento Total, incluindo Correção de Isoformas de Comprimento Total, Classificação, Redução de Redundância.
  • Anotação do transcriptoma, incluindo Ontologia Genética, via KEGG, KOG ou COG, Swissport.
  • Análise das estruturas genéticas, incluindo splicing alternativo, LncRNA, SSR, CDS
Análise de dados avançada
  • Mapa de Referência
  • Análise do nível de expressão génica
  • Análise de genes diferencialmente expressos
  • Análise de enriquecimento KEGG do transcriptoma diferencialmente expresso
  • Mapa de calor de genes diferencialmente expressos
  • … (mais disponível mediante pedido)
Transcritosoma com Referência
Análise de dados padrão
  • Análise de Isoformas de Comprimento Total, incluindo mapeamento do Genoma de Referência, correção de Isoformas de Comprimento Total, Classificação, Redução de Redundância.
  • Anotação do transcriptoma, incluindo Ontologia Genética, via KEGG, KOG ou COG, Swissport.
  • Análise das estruturas genéticas, incluindo splicing alternativo, LncRNA, SSR, CDS, previsão de transcriptoma novo, identificação de genes de fusão.
Análise de dados avançada
  • Mapa para Referência
  • Análise do nível de expressão génica
  • Análise de genes diferencialmente expressos
  • Análise de enriquecimento KEGG do transcriptoma diferencialmente expresso.
  • Mapa de calor de genes diferencialmente expressos
  • … (mais informações disponíveis mediante solicitação)
Nota: Os dados recomendados e os conteúdos da análise exibidos são apenas para referência. Para informações detalhadas, por favor contacte-nos com os seus pedidos personalizados.

Pipeline de Análise

The Data Analysis Pipeline of Iso-Seq.

Entregáveis

  • Os dados de sequenciação originais
  • Resultados experimentais
  • Relatório de análise de dados
  • Detalhes em Iso-Seq para a sua escrita (personalização)

Sequenciação de leitura longa permite a identificação direta de transcritos alternadamente transcritos ou processados, unidades de transcrição policistrónicas e outras longas sequências de cDNA. Com experiência e dedicação, a avançada plataforma PacBio SMRT e os serviços da CD Genomics serão o seu melhor companheiro em Iso-Seq. Por favor, contacte-nos para mais informações e um orçamento detalhado.

Os resultados parciais estão mostrados abaixo:

The Iso-Seq Results Display Figure.

1. No campo da transcriptómica, o que se refere a isoforma e transcrito, e quais são as suas diferenças?

Uma isoforma denota moléculas de RNA que são transcritas do mesmo locus génico, mas exibem variações estruturais. Em contraste, um transcrito de RNA é uma cópia da molécula de RNA produzida durante a transcrição do gene. Essencialmente, ambos os termos descrevem a mesma entidade - moléculas de RNA. No entanto, a ênfase difere: a isoforma destaca as diferenças estruturais nas moléculas de RNA, como as regiões TSS, CDS e UTR, enquanto o transcrito foca no processamento pós-transcricional que as moléculas de RNA sofreram, como quais exões foram unidos.

2. Quais são as características dos transcritos alvo da sequenciação Iso-Seq?

  • Estrutura Típica: Os transcritos de mRNA eucariótico geralmente consistem em um cap 5', UTR 5', CDS, UTR 3' e cauda poliA. O Iso-Seq aproveita a poliA ou sequências específicas para enriquecer mRNA ou direcionar RNAs de genes específicos.

Figure 1 Standard mRNA Structure.Figura 1 Estrutura típica do mRNA.

  • Distribuição de Comprimento: Os comprimentos dos transcritos variam predominantemente entre 1 a 3 quilobases. Por exemplo, mais de 99% dos transcritos humanos são mais curtos que 10 quilobases, o que permite que o Iso-Seq alcance facilmente o sequenciamento de comprimento total.
  • Complexidade: Após a transcrição, um gene pode passar por splicing alternativo para produzir múltiplos transcritos com diferentes funções biológicas. Distinguir com precisão essas pequenas diferenças estruturais entre os transcritos tem apresentado desafios significativos para as técnicas anteriores ao Iso-Seq.

3. Quais são os tipos de designs SMRTbell para bibliotecas Iso-Seq suportadas pelo PacBio?

Atualmente, as bibliotecas de sequenciamento Iso-Seq suportadas pela PacBio incluem vários tipos de designs SMRTbell:

Figure 1 Standard mRNA Structure.Figura 2 Design do SMRTbell.

Estes designs permitem aplicações flexíveis: ao adicionar códigos de barras opcionalmente, o Iso-Seq suporta tanto sequenciação de amostras únicas como sequenciação multiplexada; ao usar diferentes primers para a transcrição reversa, facilita tanto a sequenciação de todo o transcriptoma como a sequenciação direcionada de conjuntos específicos de genes.

4. Quais são os passos básicos envolvidos na pré-processamento de dados do Iso-seq e quais são os seus objetivos?

A pré-processamento dos dados Iso-Seq é realizado através dos componentes das ferramentas SMRT ccs, lima e IsoSeq3. Os passos incluem:

  • Correção de erros de sequenciamento aleatórios em subleituras sob o modo de sequenciamento ccs para obter leituras HiFi de alta qualidade.
  • (Para sequenciação multiplexada) Divisão de amostras utilizando códigos de barras e remoção das sequências de primers de códigos de barras.
  • Identificação e remoção de caudas poliA e concatenados.
  • Agrupamento e deduplicação de leituras para gerar sequências de consenso.

Utilizando PacBio Iso-Seq para a Descoberta de Novos Transcritos e Genes Relacionados com Respostas a Estresses Abióticos em Oryza sativa L..

Revista: Jornal Internacional de Ciências Moleculares

Fator de impacto: 6,208

Publicado: 31 de outubro de 2020

Fundo

A mudança climática global agrava as condições de estresse abiótico, impactando negativamente os rendimentos das culturas. O arroz, um alimento básico para mais de metade da população mundial, possui uma vasta diversidade genética. No entanto, os estudos atuais baseiam-se no genoma de referência japonica, podendo perder informações genéticas cruciais de outras subespécies. Para resolver isso, os autores utilizaram o PacBio SMRT Iso-Seq para sequenciar e reconstruir transcritos parciais de várias subespécies de arroz, permitindo a descoberta de novos genes para tolerância ao estresse sem a necessidade de um genoma de referência existente.

Materiais e Métodos

Preparação de Amostras

  • Material vegetal
  • Arroz
  • Extração de RNA

Sequenciação

  • RNA-Seq
  • De novo reconstrução do transcriptoma
  • PacBio Iso-Seq

Análise de Dados

  • Análise de InDel
  • Análise BUSCO
  • Análise filogenética
  • Anotação funcional
  • Análise de expressão gênica diferencial

Resultados

Os autores selecionaram dez cultivares de arroz, isolando RNA de plantas cultivadas em diversas condições. O sequenciamento na plataforma PacBio produziu entre 15,49 e 24,51 gigabases por cultivar. Usando o IsoSeq3, obtiveram entre 37.535 e 54.594 transcritos completos de alta qualidade por cultivar, após filtrar sequências específicas de plantas e remover contaminantes.

Tabela 1. Amostragem para sequenciação de isoformas PacBio.

Durante a preparação da biblioteca, produtos de RNA degradados 5′ podem levar a isoformas redundantes que carecem de informação completa da sequência 5′. Três métodos - cogent, cDNA cupcake e TAMA - foram testados para colapsar essas redundâncias. Enquanto cDNA cupcake e TAMA utilizam um genoma de referência, o cogent reconstrói um genoma codificante para o colapso. Todos os métodos reduziram significativamente o número de isoformas, com o cogent a mostrar mais transcritos não correspondentes. Após o colapso, os comprimentos dos transcritos aumentaram e a singularidade das isoformas melhorou, particularmente com o TAMA apresentando a maior proporção de isoformas únicas por locus gênico. A análise filogenética baseada em SNPs destacou clusters distintos por subespécies, enfatizando as diferenças genéticas entre cultivares aus, indica e japonica.

Figure 1. BUSCO assessment of uncollapsed (a) and collapsed (b) transcripts. (Schaarschmidt et al., 2020) Figura 1. Análise da avaliação BUSCO de transcrições não colapsadas (a) e colapsadas (b).

Figure 2. Phylogenetic trees generated with SNPhylo. (Schaarschmidt et al., 2020)Figura 2. Árvores filogenéticas construídas com SNPhylo.

O estudo utilizou o TAMA para colapsar transcrições HQ e cogentes para as não mapeadas, resultando em 10.511 a 15.011 loci genéticos e 14.255 a 20.803 modelos de isoformas únicas por cultivar. Cerca de um terço dos loci genéticos e metade dos modelos de transcritos corresponderam à referência Nipponbare. A anotação funcional revelou 60% a 70% de ORFs completos e destacou processos biológicos principais. No entanto, uma parte notável dos transcritos permaneceu não anotada, podendo originar-se de espécies selvagens de Oryza.

Figure 3. Proportion of predicted open reading frames (ORFs) identified using TransDecoder. (Schaarschmidt et al., 2020)Figura 3. Fração de quadros de leitura abertos (ORFs) previstos usando o TransDecoder.

Para identificar transcritos comuns e específicos entre cultivares, foi utilizado um cultivar de cada subespécie (N22, IR64, Nipponbare) como base de dados BLAST. Cerca de 9.000 transcritos foram comuns a todas as cultivares, com 652 únicos para N22 e 2426 para IR64. A análise de expressão gênica diferencial em N22 revelou 56 genes específicos de aus responsivos ao estresse combinado de seca e calor, incluindo o gene B12288, que está regulado para cima e compartilha homologia com genes responsivos à seca em outras espécies de Oryza e Arabidopsis thaliana.

Figure 4. Alignment of five Oryza RAB21 dehydrin proteins. (Schaarschmidt et al., 2020)Figura 4. Alinhamento de sequência múltipla de cinco Oryza Proteínas de desidrina RAB21.

Conclusão

Os autores sequenciaram os transcriptomas de dez cultivares de arroz utilizando o PacBio Sequel, obtendo entre 37.500 a 54.600 isoformas de alta qualidade por cultivar. As suas reconstruções de novo incluíram cerca de 40% de isoformas novas em comparação com Nipponbare. Para a cultivar aus N22, tolerante à seca e ao calor, identificaram 56 genes diferencialmente expressos em sementes em desenvolvimento sob condições de campo, oferecendo uma forma económica de identificar genes de tolerância ao stress ausentes em montagens genómicas padrão.

Referência

  1. Schaarschmidt S, Fischer A, Lawas LM, et al. Utilizando PacBio iso-seq para a descoberta de novos transcritos e genes em respostas a stress abiótico em Oryza sativa L.. Revista Internacional de Ciências Moleculares. 2020, 21(21):8148.

Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:

As comunidades bacterianas de Cassiopea nos Florida Keys partilham principais táxons bacterianos com os microbiomas de coral.

Revista: bioRxiv

Ano: 2024

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e ficarei feliz em ajudar com a tradução.

Produção de uma proteína semelhante a bacteriocina PEG 446 a partir de Clostridium tyrobutyricum NRRL B-67062

Revista: Probióticos e Proteínas Antimicrobianas

Ano: 2024

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei o prazer de traduzi-lo.

Desentrelaçando o Papel dos Patobiontes das Espécies de Bacteroides nas Doenças Inflamatórias Intestinais

Revista: bioRxiv

Ano: 2023

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e eu ficarei feliz em ajudar com a tradução.

Um recurso genómico a nível de cromossoma para estudar os mecanismos de virulência e a evolução do patógeno da ferrugem do café Hemileia vastatrix.

Revista: bioRxiv

Ano: 2022

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e eu farei a tradução.

Streptomyces buecherae sp. nov., um actinobactéria isolada de várias espécies de morcegos

Jornal: Antonie Van Leeuwenhoek

Ano: 2020

Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e ficarei feliz em ajudar com a tradução.

Ver mais artigos publicados pelos nossos clientes.

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Recursos em Destaque
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo