A CD Genomics tem uma vasta experiência na oferta do serviço Iso-Seq, produzindo transcrições completas sem montagem. Um rigoroso controlo de qualidade é realizado após cada procedimento para garantir resultados abrangentes e precisos.
O que é Iso-Seq?
A sequenciação de isoformas (Iso-Seq) é uma sequenciação de alto rendimento tecnologia desenvolvida pela PacBio, aproveitando a tecnologia de Molecula Única em Tempo Real (SMRT). Ao contrário de fragmentos Sequenciação de RNA métodos que requerem reassemblagem, o Iso-Seq sequencia diretamente transcritos de cDNA de comprimento completo, abrangendo a região não traduzida 5' (5' UTR) até à cauda de poliadenilação 3' (polyA). Esta abordagem permite uma análise mais precisa do conjunto de genes-alvo ou do transcriptoma completo, fornecendo informações que são de outra forma difíceis de obter através de métodos tradicionais. Sequenciação de Nova Geração (NGS) técnicas.
A Introdução do Iso-Seq
Em organismos eucarióticos, um único gene pode codificar um número surpreendente de proteínas após o splicing alternativo, cada uma com uma função biológica distinta. Existem genes humanos conhecidos que têm funções muito diferentes dependendo de qual variante de splicing é expressa. Com o splicing alternativo a ser tão crítico para a função do genoma.
RNA-Seq de leitura curta trabalhos ao cortar fisicamente os isoformas de transcritos em pedaços menores e reassemblando, deixando possibilidades de montagem incorreta ou captura incompleta da totalidade da diversidade de isoformas dos genes de interesse. É importante capturar transcritos de comprimento total. Ao aproveitar-se de Sequenciação de leituras longas PacBio SMRT A tecnologia de sequenciação de isoformas (Iso-Seq) pode facilmente cobrir o transcrito completo desde a extremidade 5' até a cauda 3'-poly A, sem a necessidade de fragmentação para obter sequências de cDNA de comprimento completo, o que é útil para identificar novos transcritos e novos íntrons, permitindo assim identificar com precisão isoformas, locais de splicing alternativo, expressão de genes de fusão e expressão alélica.
Comparado com a plataforma Illumina, a análise PacBio pode detectar facilmente moléculas de RNA policistrónicas muito longas (chamadas transcritos complexos) e revelar uma ampla variedade de sobreposições transcricionais novas entre genes adjacentes e distantes situados em paralelo. Isso é útil para levantar a possibilidade de estudar uma rede genómica que exerce controlo conjunto sobre a expressão génica e a replicação.
Nós também fornecemos Sequenciação de Transcritos de Comprimento Total por Nanoporos serviços. Para mais detalhes, por favor visite a página relevante.
Principais Características e Vantagens do Iso-Seq
- Aquisição direta de sequências de transcritos completos, permitindo uma reflexão mais precisa da informação do transcriptoma para as espécies sequenciadas.
- Deteção de múltiplas formas de splicing alternativo, revelando locais de splicing adicionais e eventos de splicing alternativo.
- Descoberta de novos genes funcionais, aumentando a anotação do genoma.
- Facilitação da análise precisa de genes de fusão, genes homólogos, superfamílias de genes ou alelos.
- Alta precisão, continuidade e completude das sequências de transcritos.
- Integrado com a segunda geração sequenciação do transcriptoma, permitindo a quantificação precisa a níveis de gene e de transcrito.
- Alta adaptabilidade das espécies, permitindo análise com ou sem um genoma de referência.
Aplicações do Iso-Seq
- Anotação Genómica: Realizar uma anotação precisa de novos genomas, fornecendo informações de transcritos de alta qualidade.
- Análise do Transcriptoma: Investigar a diversidade de transcritos em vários tecidos ou tipos celulares, elucidando a complexidade da expressão génica.
- Investigação de Doenças: Identificar fusões genéticas específicas e eventos de splicing alternativo em estudos de câncer e doenças genéticas.
- Biotecnologia Agrícola: Aplicar na investigação em genómica de culturas para melhorar as estratégias de melhoramento de variedades de culturas.
Fluxo de Trabalho Iso-Seq
A CD Genomics utiliza a tecnologia PacBio SMRT para Sequenciação de Transcritos de Comprimento Total (Iso-Seq). Este método avançado envolve a extração de RNA de alta qualidade, a síntese de cDNA de comprimento total, a construção de bibliotecas de cDNA e a realização de sequenciação de alta fidelidade para capturar sequências completas de transcritos, garantindo uma análise do transcriptoma abrangente e precisa.

Especificações do Serviço
Requisitos de Amostra
|
|
Clique |
Estratégia de Sequenciamento
|
| Análise Bioinformática
Fornecemos várias análises de bioinformática personalizadas: Transcritoma sem Referência Análise de dados padrão
Análise de dados padrão
|
Pipeline de Análise

Entregáveis
- Os dados de sequenciação originais
- Resultados experimentais
- Relatório de análise de dados
- Detalhes em Iso-Seq para a sua escrita (personalização)
Sequenciação de leitura longa permite a identificação direta de transcritos alternadamente transcritos ou processados, unidades de transcrição policistrónicas e outras longas sequências de cDNA. Com experiência e dedicação, a avançada plataforma PacBio SMRT e os serviços da CD Genomics serão o seu melhor companheiro em Iso-Seq. Por favor, contacte-nos para mais informações e um orçamento detalhado.
Os resultados parciais estão mostrados abaixo:

1. No campo da transcriptómica, o que se refere a isoforma e transcrito, e quais são as suas diferenças?
Uma isoforma denota moléculas de RNA que são transcritas do mesmo locus génico, mas exibem variações estruturais. Em contraste, um transcrito de RNA é uma cópia da molécula de RNA produzida durante a transcrição do gene. Essencialmente, ambos os termos descrevem a mesma entidade - moléculas de RNA. No entanto, a ênfase difere: a isoforma destaca as diferenças estruturais nas moléculas de RNA, como as regiões TSS, CDS e UTR, enquanto o transcrito foca no processamento pós-transcricional que as moléculas de RNA sofreram, como quais exões foram unidos.
2. Quais são as características dos transcritos alvo da sequenciação Iso-Seq?
- Estrutura Típica: Os transcritos de mRNA eucariótico geralmente consistem em um cap 5', UTR 5', CDS, UTR 3' e cauda poliA. O Iso-Seq aproveita a poliA ou sequências específicas para enriquecer mRNA ou direcionar RNAs de genes específicos.
Figura 1 Estrutura típica do mRNA.
- Distribuição de Comprimento: Os comprimentos dos transcritos variam predominantemente entre 1 a 3 quilobases. Por exemplo, mais de 99% dos transcritos humanos são mais curtos que 10 quilobases, o que permite que o Iso-Seq alcance facilmente o sequenciamento de comprimento total.
- Complexidade: Após a transcrição, um gene pode passar por splicing alternativo para produzir múltiplos transcritos com diferentes funções biológicas. Distinguir com precisão essas pequenas diferenças estruturais entre os transcritos tem apresentado desafios significativos para as técnicas anteriores ao Iso-Seq.
3. Quais são os tipos de designs SMRTbell para bibliotecas Iso-Seq suportadas pelo PacBio?
Atualmente, as bibliotecas de sequenciamento Iso-Seq suportadas pela PacBio incluem vários tipos de designs SMRTbell:
Figura 2 Design do SMRTbell.
Estes designs permitem aplicações flexíveis: ao adicionar códigos de barras opcionalmente, o Iso-Seq suporta tanto sequenciação de amostras únicas como sequenciação multiplexada; ao usar diferentes primers para a transcrição reversa, facilita tanto a sequenciação de todo o transcriptoma como a sequenciação direcionada de conjuntos específicos de genes.
4. Quais são os passos básicos envolvidos na pré-processamento de dados do Iso-seq e quais são os seus objetivos?
A pré-processamento dos dados Iso-Seq é realizado através dos componentes das ferramentas SMRT ccs, lima e IsoSeq3. Os passos incluem:
- Correção de erros de sequenciamento aleatórios em subleituras sob o modo de sequenciamento ccs para obter leituras HiFi de alta qualidade.
- (Para sequenciação multiplexada) Divisão de amostras utilizando códigos de barras e remoção das sequências de primers de códigos de barras.
- Identificação e remoção de caudas poliA e concatenados.
- Agrupamento e deduplicação de leituras para gerar sequências de consenso.
Utilizando PacBio Iso-Seq para a Descoberta de Novos Transcritos e Genes Relacionados com Respostas a Estresses Abióticos em Oryza sativa L..
Revista: Jornal Internacional de Ciências Moleculares
Fator de impacto: 6,208
Publicado: 31 de outubro de 2020
Fundo
A mudança climática global agrava as condições de estresse abiótico, impactando negativamente os rendimentos das culturas. O arroz, um alimento básico para mais de metade da população mundial, possui uma vasta diversidade genética. No entanto, os estudos atuais baseiam-se no genoma de referência japonica, podendo perder informações genéticas cruciais de outras subespécies. Para resolver isso, os autores utilizaram o PacBio SMRT Iso-Seq para sequenciar e reconstruir transcritos parciais de várias subespécies de arroz, permitindo a descoberta de novos genes para tolerância ao estresse sem a necessidade de um genoma de referência existente.
Materiais e Métodos
Preparação de Amostras
- Material vegetal
- Arroz
- Extração de RNA
Sequenciação
- RNA-Seq
- De novo reconstrução do transcriptoma
- PacBio Iso-Seq
- Análise de InDel
- Análise BUSCO
- Análise filogenética
- Anotação funcional
- Análise de expressão gênica diferencial
Resultados
Os autores selecionaram dez cultivares de arroz, isolando RNA de plantas cultivadas em diversas condições. O sequenciamento na plataforma PacBio produziu entre 15,49 e 24,51 gigabases por cultivar. Usando o IsoSeq3, obtiveram entre 37.535 e 54.594 transcritos completos de alta qualidade por cultivar, após filtrar sequências específicas de plantas e remover contaminantes.
Tabela 1. Amostragem para sequenciação de isoformas PacBio.

Durante a preparação da biblioteca, produtos de RNA degradados 5′ podem levar a isoformas redundantes que carecem de informação completa da sequência 5′. Três métodos - cogent, cDNA cupcake e TAMA - foram testados para colapsar essas redundâncias. Enquanto cDNA cupcake e TAMA utilizam um genoma de referência, o cogent reconstrói um genoma codificante para o colapso. Todos os métodos reduziram significativamente o número de isoformas, com o cogent a mostrar mais transcritos não correspondentes. Após o colapso, os comprimentos dos transcritos aumentaram e a singularidade das isoformas melhorou, particularmente com o TAMA apresentando a maior proporção de isoformas únicas por locus gênico. A análise filogenética baseada em SNPs destacou clusters distintos por subespécies, enfatizando as diferenças genéticas entre cultivares aus, indica e japonica.
Figura 1. Análise da avaliação BUSCO de transcrições não colapsadas (a) e colapsadas (b).
Figura 2. Árvores filogenéticas construídas com SNPhylo.
O estudo utilizou o TAMA para colapsar transcrições HQ e cogentes para as não mapeadas, resultando em 10.511 a 15.011 loci genéticos e 14.255 a 20.803 modelos de isoformas únicas por cultivar. Cerca de um terço dos loci genéticos e metade dos modelos de transcritos corresponderam à referência Nipponbare. A anotação funcional revelou 60% a 70% de ORFs completos e destacou processos biológicos principais. No entanto, uma parte notável dos transcritos permaneceu não anotada, podendo originar-se de espécies selvagens de Oryza.
Figura 3. Fração de quadros de leitura abertos (ORFs) previstos usando o TransDecoder.
Para identificar transcritos comuns e específicos entre cultivares, foi utilizado um cultivar de cada subespécie (N22, IR64, Nipponbare) como base de dados BLAST. Cerca de 9.000 transcritos foram comuns a todas as cultivares, com 652 únicos para N22 e 2426 para IR64. A análise de expressão gênica diferencial em N22 revelou 56 genes específicos de aus responsivos ao estresse combinado de seca e calor, incluindo o gene B12288, que está regulado para cima e compartilha homologia com genes responsivos à seca em outras espécies de Oryza e Arabidopsis thaliana.
Figura 4. Alinhamento de sequência múltipla de cinco Oryza Proteínas de desidrina RAB21.
Conclusão
Os autores sequenciaram os transcriptomas de dez cultivares de arroz utilizando o PacBio Sequel, obtendo entre 37.500 a 54.600 isoformas de alta qualidade por cultivar. As suas reconstruções de novo incluíram cerca de 40% de isoformas novas em comparação com Nipponbare. Para a cultivar aus N22, tolerante à seca e ao calor, identificaram 56 genes diferencialmente expressos em sementes em desenvolvimento sob condições de campo, oferecendo uma forma económica de identificar genes de tolerância ao stress ausentes em montagens genómicas padrão.
Referência
- Schaarschmidt S, Fischer A, Lawas LM, et al. Utilizando PacBio iso-seq para a descoberta de novos transcritos e genes em respostas a stress abiótico em Oryza sativa L.. Revista Internacional de Ciências Moleculares. 2020, 21(21):8148.
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
As comunidades bacterianas de Cassiopea nos Florida Keys partilham principais táxons bacterianos com os microbiomas de coral.
Revista: bioRxiv
Ano: 2024
Produção de uma proteína semelhante a bacteriocina PEG 446 a partir de Clostridium tyrobutyricum NRRL B-67062
Revista: Probióticos e Proteínas Antimicrobianas
Ano: 2024
Desentrelaçando o Papel dos Patobiontes das Espécies de Bacteroides nas Doenças Inflamatórias Intestinais
Revista: bioRxiv
Ano: 2023
Um recurso genómico a nível de cromossoma para estudar os mecanismos de virulência e a evolução do patógeno da ferrugem do café Hemileia vastatrix.
Revista: bioRxiv
Ano: 2022
Streptomyces buecherae sp. nov., um actinobactéria isolada de várias espécies de morcegos
Jornal: Antonie Van Leeuwenhoek
Ano: 2020
Ver mais artigos publicados pelos nossos clientes.