O que é o sequenciamento de genoma completo de novo de plantas e animais?
Sequenciação de genoma completo de novo de plantas e animais refere-se à montagem de um genoma completo sem depender de qualquer sequência de referência existente. Esta abordagem é essencial ao trabalhar com espécies que não possuem um genoma de referência, têm genomas mal montados ou apresentam características genómicas complexas, como alta heterozigosidade, poliploidia ou extensas regiões repetitivas.
Em vez de alinhar leituras de sequenciamento a um genoma conhecido, a montagem de novo reconstrói o genoma do zero—como resolver um enorme quebra-cabeças usando apenas os fragmentos de sequência gerados por plataformas de sequenciamento de alto rendimento. O resultado é um plano genético de alta resolução que pode ser utilizado para anotação funcional, análise comparativa, melhoramento molecular e estudos evolutivos.
Na CD Genomics, fornecemos serviços de sequenciação de novo de ponta a ponta para uma ampla gama de espécies de plantas e animais. Ao integrar leituras curtas da Illumina, leituras longas HiFi da PacBio, leituras ultra-longas da Nanopore e dados de interação de cromatina Hi-C, entregamos assemblagens de genomas a nível de cromossoma pronto para investigação e publicação subsequentes.
Quando Deve Utilizar Sequenciação de Genoma De Novo?
O sequenciamento de genoma de novo é a estratégia preferida quando não existe um genoma de referência de alta qualidade — ou quando os referenciais existentes não podem satisfazer os seus objetivos de investigação. Aqui estão os casos de uso mais comuns:
✅ Sem Genoma de Referência Disponível
Para espécies recém-descobertas ou pouco estudadas, o sequenciamento de novo permite que os investigadores gerem uma referência completa do zero.
✅ Referência Incompleta ou Fragmentada
Muitos genomas disponíveis publicamente estão desatualizados, mal montados ou fragmentados ao nível do andaime. A montagem de novo fornece continuidade a nível de cromossoma para pesquisa de alta resolução.
✅ Genomas Complexos: Poliploidia, Heterozigosidade, Repetições
Os genomas de plantas e animais frequentemente contêm altos níveis de duplicação, variação estrutural ou elementos repetitivos. Abordagens de novo utilizando sequenciação de leitura longa e mapeamento Hi-C superar estes desafios.
✅ Construção do Pan-Génoma
Quando um único genoma de referência não consegue capturar a diversidade genética de uma espécie, a construção de um pan-genoma através da montagem de novo de múltiplos indivíduos revela variação específica da população.
✅ Descoberta de Características e Reprodução Molecular
Assembleias de alta qualidade fornecem a base para GWAS, mapeamento de QTLe edição do genoma—especialmente em investigação agrícola, de aquicultura e de pecuária.
Dica Profissional:
O sequenciamento de novo não é apenas para espécies novas. Muitas vezes é o melhor forma de atualizar um genoma de baixa contiguidade a uma qualidade pronta para publicação, especialmente quando combinado com dados de HiFi e Hi-C.
Visão Geral da Estratégia Tecnológica: Comparação de Plataformas para Montagem de Genomas
| Plataforma | Papel na Assembleia | Cobertura Típica | Forças | Recomendado Para |
|---|---|---|---|---|
| Illumina / DNBSEQ™ | Inquérito genómico, correção de erros | 30–50× | Alta precisão, baixo custo, essencial para o perfilamento de k-mers. | Análise inicial da complexidade do genoma |
| PacBio HiFi | Montagem de novo a nível de contig | 30–60× | Precisão ultra-alta (Q20+), excelente para genomas ricos em repetições ou poliplóides. | Genomas de plantas/animais com alta heterozigose |
| Oxford Nanopore (ONT) | Fecho de lacunas, montagem de leituras ultra-longas | 50–100× | Leituras ultra-longas (>100 kb), ideais para montagens telómero a telómero (T2T) | Genomas que requerem continuidade completa ou quase completa |
| Hi-C | Estruturação em escala de cromossoma | 100–150× | Constrói pseudomoléculas de cromossomas, corrige montagens erradas. | Ancoragem final de cromossomas e QC |
| Leituras Ligadas 10x Genomics | Resolução de repetição, faseamento (opcional) | ~60× | Fases de loci heterozigóticos, suportam a separação de haplótipos. | Espécies diploides ou altamente heterozigóticas |
| Mapeamento Óptico BioNano | Deteção de variações estruturais grandes (opcional) | NA | Deteta SVs, estrutura montagens complexas | Genomas muito grandes ou estruturalmente complexos |
Estratégia de Sequenciamento Recomendada para Genomas De Novo de Plantas e Animais
Para a maioria dos projetos de genoma de novo de plantas e animais, recomendamos a seguinte estratégia integrada. Esta combinação de quatro plataformas oferece montagens a nível de cromossoma com alta continuidade e suporte de anotação de genes em um único fluxo de trabalho.
| Passo | Plataforma | Cobertura | Propósito |
|---|---|---|---|
| 1. Inquérito Genómico | Illumina WGS | 50× | Análise de K-mer para estimativa do tamanho do genoma, taxa de heterozigose e conteúdo de repetições — orienta a estratégia subsequente. |
| 2. Montagem de Contigs | PacBio HiFi WGS | 30× | Leituras longas de alta precisão (Q20+) (15–20 kb) para a espinha dorsal do contig primário, abrangendo repetições e resolvendo haplótipos. |
| 3. Ancoragem de Cromossomas | Sequenciação Hi-C | 100× | Captura da conformação da cromatina para ordenar contigs em pseudomoléculas em escala de cromossoma; taxa de ancoragem típica >95% |
| 4. Suporte à Anotação de Genes | RNA-seq | — | Evidência do transcriptoma para previsão da estrutura genética e validação da anotação funcional |
Sobre o Sequenciamento Hi-C: Hi-C (Captura de Conformação de Cromossomas de Alta Vazão) captura interações de cromatina de longo alcance através da ligação cruzada do DNA in situ, digestão e religação de fragmentos espacialmente próximos. Os dados resultantes das interações de cromatina permitem que contigs montados a partir de leituras longas sejam ordenados, orientados e ancorados em pseudomoléculas em escala de cromossoma. Este passo é crítico para alcançar montagens em nível de cromossoma de qualidade para publicação, especialmente para genomas com grandes regiões repetitivas onde os algoritmos de montagem sozinhos não conseguem resolver a arquitetura cromossómica.
Sistema de sequenciação acBio Revio. Imagem cortesia da PacBio.
Comparação de contiguidade de montagem: a estratégia multi-plataforma recomendada fornece um N50 de contig a nível de cromossoma em comparação com abordagens de plataforma única.
Insight sobre Estratégia Híbrida:
As montagens mais bem-sucedidas combinam leituras curtas + leituras longas + Hi-C. Adaptamos a combinação de plataformas com base no tamanho do genoma, ploidia e nos seus objetivos de investigação.
Fluxo de Trabalho do Serviço de Sequenciamento de Genoma De Novo: Desde a Amostra até a Montagem em Escala de Cromossoma
Controlo de Qualidade da Amostra
- Avaliação de integridade através de PFGE ou Femto Pulse
- Verificações de pureza (razões OD, Qubit e remoção de contaminação de RNA)
Inquérito do Genoma (Illumina)
- Sequenciação de leitura curta (~100X de cobertura)
- Análise de K-mer para tamanho do genoma, conteúdo de repetições, heterozigose
- Guias para a estratégia de leitura longa e Hi-C a jusante
Sequenciação de Longa Leitura (PacBio HiFi ou Oxford Nanopore)
- Montagem de novo de alta contiguidade de contigs primários
- Plataformas selecionadas com base nas propriedades do genoma-alvo
- Cobertura de 30–100X dependendo da plataforma
Estruturas de Suporte e Ancoragem de Cromossomas (Sequenciação Hi-C)
- Captura interacções de cromatina a longa distância
- Âncoras contigs a pseudo-cromossomas
- Permite a montagem do genoma em escala de cromossoma
Polimento e Correção de Erros
- Polimento de leituras curtas para correção de SNPs/indels
- Preenchimento de lacunas e resolução de repetições
- BUSCO e verificações de qualidade baseadas em alinhamento
Anotação do Genoma (Adicional Opcional)
- Predição da estrutura do gene (ab initio e baseada em evidências)
- Mascaramento de região repetida
- Anotação funcional (GO, KEGG, Pfam)

Análise Bioinformática
O nosso pipeline de bioinformática genómica integra montagem de alto rendimento, anotação e análise comparativa—personalizado para espécies de plantas e animais. Quer esteja a trabalhar com um genoma diploide, poliploide ou altamente repetitivo, fornecemos soluções escaláveis e precisas para decifrar a complexidade.


Fluxo de trabalho

Requisitos de Amostras e Normas de Qualidade
| Tipo de Amostra | Montante Necessário | Critérios de Pureza | Notas Especiais |
|---|---|---|---|
| Tecido animal fresco ou congelado | ≥ 1,5 μg gDNA (≥50 kb de comprimento médio) | OD260/280: 1,8–2,0; OD260/230: ≥2,0 | Evite amostras contaminadas com sangue; não realizar ciclos de congelamento-descongelamento. |
| Folhas ou caules de plantas | ≥ 2 μg gDNA (≥50 kb de comprimento médio) | O mesmo que acima. | Evite a contaminação por polissacarídeos e polifenóis; prefira tecidos jovens e tenros. |
| Células cultivadas (por exemplo, peixes, insetos) | ≥ 1,5 μg gDNA | Igual ao acima | Para insetos, remova o exoesqueleto de quitina antes da extração. |
| tecido cruzado Hi-C | ≥ 1 g de tecido fresco ou ~5 milhões de células | OD não aplicável (reticulado) | A ligação cruzada e a fixação devem seguir o nosso protocolo de preparação Hi-C. |
Critérios Gerais de QC:
- DNA de alto peso molecular: >50 kb preferido para plataformas de leitura longa (PacBio HiFi, Oxford Nanopore)
- Sem contaminação de RNA, proteína ou metabolitos secundários.
- Concentração: ≥50 ng/μL (Qubit); Integridade: Confirmada por gel de campo pulsado ou Femto Pulse
Precisa de ajuda com a extração de ADN?
A CD Genomics oferece serviços de extração de ponta a ponta adaptados a genomas de plantas e animais, utilizando purificação por esferas magnéticas para minimizar a fragmentação e contaminantes. Contacte-nos para saber mais.
Entregáveis
A CD Genomics fornece entregas abrangentes e bem organizadas para cada projeto de sequenciação de genoma completo de plantas ou animais de novo. Os nossos pacotes de dados são adaptados para uma análise posterior sem interrupções e prontidão para publicação.
✅ Entregas Padrão
| Tipo de Ficheiro / Conteúdo | Descrição |
|---|---|
| Dados de Sequenciamento Bruto | Ficheiros FASTQ da PacBio HiFi, Nanopore, Illumina e/ou plataformas Hi-C |
| Resultados da Assembleia | Contigs e andaimes do genoma em formato FASTA |
| Relatório de Métricas de Montagem | Resumo do tamanho do genoma, N50, conteúdo de GC, completude (BUSCO, etc.) |
| Anotação do Genoma (Opcional) | Ficheiros GFF3/GTF, tabelas de anotação funcional, visualização da estrutura genética |
| Mapa de Interacção Hi-C | Matrizes de contacto e gráficos de montagem de andaimes (se Hi-C estiver incluído) |
| Gráficos de Circos e Synteny | Sumários visuais da arquitetura do genoma e análise comparativa |
| Relatório Resumido de Bioinformática | Métodos detalhados, versões de software e descrições de pipeline. |
✅ Adicionais Opcionais (Atualizações de Projeto)
Para projetos que requerem análise de dados avançada ou resultados personalizados, a CD Genomics oferece as seguintes opções de atualização:
| Opção de Atualização | Descrição |
|---|---|
| Montagem a Nível de Cromossoma | Alcançado através de Hi-C ou BioNano scaffolding, fornecendo pseudomoléculas em escala de cromossoma. |
| Anotação do Genoma Funcional | Inclui previsão de genes, enriquecimento GO/KEGG, elementos repetidos e anotações de TE. |
| Pacote de Genómica Comparativa | Inclui sintenia de genoma completo, agrupamento de ortólogos e estimativa de distância evolutiva. |
| Construção do Pan-Genoma | Integração de montagem de múltiplas amostras, deteção de variantes estruturais e conjuntos de genes partilhados/únicos. |
| Integração do Epigenoma | Complemento para mapas de metilação ou modificação de histonas (requer preparação de amostra compatível) |
| Formatação de Dados Prontos para GWAS | Inclui chamada de SNP/INDEL, formatação VCF e ficheiros de estrutura populacional para pipelines de GWAS. |
Resumo do Projeto em Destaque
| Tipo de Espécie | Tamanho do Genoma | Contagem de Contigs | Contig N50 | Taxa de Ancoragem Hi-C |
|---|---|---|---|---|
| Planta A | 1,02 Gb | 626 | 7,15 Mb | 95,4% |
| Planta B | 793,46 Mb | 347 | 34,19 Mb | 96,1% |
| Animal Aquático A | 979,98 Mb | 513 | 5,36 Mb | 97,89% |
| Animal Aquático B | 827,62 Mb | 170 | 9,88 Mb | 99,51% |
| Mamífero | 3,3 Gb | 2.658 | 79,41 Mb | 98,58% |
| Inseto | 979,98 Mb | 513 | 5,37 Mb | 97,89% |
Estes genomas de alta contiguidade demonstram o robusto pipeline de montagem da CD Genomics em diversas espécies — desde genomas de plantas complexas até montagens a nível de cromossoma em mamíferos e organismos aquáticos.
Resultados da Demonstração
Abaixo estão os tipos de dados representativos gerados durante um projeto típico de sequenciação de genoma de novo de plantas ou animais, utilizando a estratégia recomendada de Illumina + PacBio HiFi + Hi-C. Os resultados variarão conforme a espécie e o escopo do projeto.
Figura 1: Distribuição de K-mers (Inquérito Genómico)
Gráfico de frequência de K-mer a partir de dados de leitura curta da Illumina (~50×), utilizado para estimar o tamanho do genoma, a taxa de heterozigose e o conteúdo de repetições antes da sequenciação de leitura longa.
Figura 2: Mapa de Calor de Interacção de Cromatina Hi-C
Mapa de contacto Hi-C em todo o genoma (100×) utilizado para ordenar e orientar contigs em pseudomoléculas em escala de cromossoma. O forte sinal diagonal confirma a correta montagem.
Figura 3: Avaliação de Completude do BUSCO
Percentagem de genes BUSCO completos, fragmentados, duplicados e em falta. Montagens de qualidade de referência normalmente alcançam >95% de pontuações BUSCO completas.
Figura 4: Comparação de Contiguidade de Montagem
Comparação do N50 de contigs entre diferentes estratégias de sequenciação. A abordagem híbrida que combina PacBio HiFi + Hi-C produz consistentemente a maior continuidade para genomas de plantas e animais.
Referência
- Hotaling, et al. Leituras longas altamente precisas são cruciais para realizar o potencial da genómica da biodiversidade. BMC Genómica. 2023. Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça o conteúdo que deseja traduzir.
Perguntas Frequentes sobre Sequenciação de Genoma Completo de Plantas/Animais de Novo
O que é o Sequenciamento de Genoma Completo de Novo de Plantas ou Animais?
É uma abordagem sem referência para reconstruir o genoma completo de uma espécie do zero. Este método é essencial para espécies que não possuem um genoma de referência fiável ou aquelas com variações estruturais complexas.
Quando devo escolher o sequenciamento de genoma de novo em vez de resequenciamento?
Resposta:
Escolha a sequenciação de novo quando:
- Não existe um genoma de referência de alta qualidade.
- A sua espécie possui uma diversidade ou complexidade genómica significativa.
- O seu objetivo é construir um pan-genoma ou melhorar a qualidade do referencial atual.
Quais plataformas de sequenciação são utilizadas no seu serviço?
Utilizamos uma estratégia híbrida que combina:
- Illumina (para inquérito baseado em k-mer e polimento)
- PacBio HiFi / Oxford Nanopore (para geração de contigs de leituras longas)
- Hi-C (para montagem a nível de cromossoma)
Esta abordagem em camadas maximiza a continuidade e a precisão da montagem.
Qualidade de amostra é necessária?
Os requisitos típicos incluem:
- gDNA de alto peso molecular
- OD260/280 = 1,8–2,0
- OD260/230 ≥ 2,0
- ≥10–15 μg de DNA total, dependendo da plataforma
Fornecemos diretrizes de submissão detalhadas mediante solicitação.
Quais entregas irei receber?
Os entregáveis incluem:
- Genoma montado de alta qualidade (FASTA)
- Relatório de métricas de montagem e qualidade
- Ficheiros de predição de genes e anotação funcional
- Sumários visuais (por exemplo, mapas circulares do genoma, gráficos de sintecnia)
Você oferece análise posterior?
Sim. A CD Genomics oferece opções avançadas de bioinformática, incluindo:
- Agrupamento de ortólogos
- Reconstrução filogenética
- Análise da expansão da família de genes
- Avaliação da sintenia e colinearidade do genoma
Estudos de Caso de Sequenciação de Genoma Completo de Novo de Plantas/Animais
Destaque de Publicação do Cliente
Estudo de Caso: Decifrar os Mecanismos de Metilação m6A em Arabidopsis Usando Sequenciação de Novo do Genoma Completo
Diário: Novo Fitologista
Fator de Impacto8.3
Publicado2017
DOI: 10.1111/nph.14586
Fundo
Como organismo modelo para genética de plantas, Arabidopsis thaliana tem sido fundamental na descoberta de mecanismos regulatórios epigenéticos. Entre estes, N6-metiladenosina (m6A) A modificação do mRNA desempenha um papel fundamental no crescimento, desenvolvimento e respostas ao stress das plantas. No entanto, os componentes moleculares que impulsionam esta modificação — e a sua conservação funcional em plantas superiores — continuam a ser incompreendidos.
Este estudo teve como objetivo identificar os fatores genéticos essenciais para metilação de RNA m6A em Arabidopsis ao integrar sequenciação de genoma completo de novo com genómica funcional direcionadaUm foco central foi colocado na compreensão do papel do HAKAI, um conservado ligase de ubiquitina E3, dentro da maquinaria de metilação.
Materiais e Métodos
Análise do Genoma e Triagem de Mutantes:
- Mutantes de Arabidopsis thaliana com suspeitas de defeitos na metilação m6A foram selecionados a partir de bibliotecas de inserção de T-DNA.
- O DNA genómico foi extraído e sequenciado de novo utilizando plataformas de leitura curta da Illumina e de leitura longa da ONT, alcançando alta contiguidade e cobertura.
- Os eventos de interrupção gênica foram mapeados e validados.
Perfilagem de m6A:
- O RNA total foi isolado de linhas mutantes e de tipo selvagem.
- A quantificação de m6A foi realizada utilizando LC-MS/MS e m6A-seq baseado em imunoprecipitação.
Validação Funcional:
- Ensaios de complementação foram utilizados para verificar a função do gene.
- A RNA-seq foi aplicada para avaliar as consequências transcriptómicas da perda de HAKAI.
Resultados
O sequenciamento de genoma completo de novo permitiu a identificação precisa de inserções de T-DNA que perturbam HAKAI, um gene que codifica uma ligase de ubiquitina E3 do domínio RING. A perda funcional de HAKAI reduziu significativamente os níveis globais de metilação m6A, comparável a mutantes de escritores m6A conhecidos como por exemplo MTA e FIP37.
Principais Conclusões:
- A perda de HAKAI levou a defeitos na dominância apical, no tempo de floração e na viabilidade do embrião, fenocopiando outros mutantes de componentes centrais de m6A.
- A análise do transcriptoma revelou desregulação em vias de sinalização hormonal e desenvolvimento chave.
- A complementação do gene HAKAI restaurou tanto os níveis de metilação m6A como o desenvolvimento normal.
Conclusão
Este estudo demonstrou que HAKAI é um componente crítico do complexo de metilação m6A. em plantas, atuando ao lado de metiltransferases canónicas. O uso de sequenciação de genoma completo de novo permitiu o mapeamento preciso de interrupções genéticas e foi essencial para validar hipóteses funcionais em contextos geneticamente complexos.
O caso destaca como sequenciação do genoma completo de plantas de novo, emparelhado com ferramentas epitranscriptómicas e transcriptómicas, pode desvendar mecanismos regulatórios conservados. A CD Genomics apoia estudos semelhantes ao oferecer soluções integradas. montagem do genoma, análise de metilação, e genómica funcional pipelines para epigenética vegetal e além.
Publicações Relacionadas
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
Combinações de Bacteriófagos São Eficazes contra Multidrogo-Resistentes Pseudomonas aeruginosa e Aumentar a Sensibilidade aos Antibióticos Carbapenémicos
Diário: Vírus
Ano2024
Sequência do genoma, genes de resistência a antibióticos e plasmídeos em uma variante monofásica de Salmonella typhimurium isolado de carne de porco de retalho
Diário: Anúncios de Recursos em Microbiologia
Ano: 2024
Genes de Salmonella enterica Serovar Enteritidis Envolvido na Formação de Biofilme
Diário: Microbiologia Aplicada
Ano2024
Sequência completa do genoma do probiótico Bifidobacterium adolescentis cepa iVS-1
Diário: Anúncios de Recursos em Microbiologia
Ano: 2023
Ver mais artigos publicados pelos nossos clientes.
