O que é o sequenciamento de genoma completo de de novo de plantas e animais?
Sequenciação de genomas inteiros de plantas e animais de novo refere-se à montagem de um genoma completo sem depender de qualquer sequência de referência existente. Esta abordagem é essencial ao trabalhar com espécies que não possuem um genoma de referência, têm genomas mal montados ou exibem características genómicas complexas, como alta heterozigosidade, poliploidia ou extensas regiões repetitivas.
Em vez de alinhar leituras de sequenciamento a um genoma conhecido, a montagem de novo reconstrói o genoma do zero—como resolver um enorme quebra-cabeças usando apenas os fragmentos de sequência gerados por plataformas de sequenciamento de alto rendimento. O resultado é um plano genético de alta resolução que pode ser utilizado para anotação funcional, análise comparativa, melhoramento molecular e estudos evolutivos.
Na CD Genomics, fornecemos serviços de sequenciação de novo de ponta a ponta para uma ampla gama de espécies de plantas e animais. Ao integrar leituras curtas da Illumina, leituras longas HiFi da PacBio, leituras ultra-longas da Nanopore e dados de interação de cromatina Hi-C, entregamos assemblagens de genomas a nível de cromossoma pronto para investigação e publicação subsequente.
Quando Deve Usar Sequenciação Genómica De Novo?
O sequenciamento de genoma de novo é a estratégia preferida quando não existe um genoma de referência de alta qualidade - ou quando os referências existentes não podem satisfazer os seus objetivos de investigação. Aqui estão os casos de uso mais comuns:
✅ Nenhum Genoma de Referência Disponível
Para espécies recém-descobertas ou pouco estudadas, o sequenciamento de novo permite aos investigadores gerar uma referência completa a partir do zero.
✅ Referência Incompleta ou Fragmentada
Muitos genomas disponíveis publicamente estão desatualizados, mal montados ou fragmentados ao nível do andaime. A montagem de novo fornece continuidade a nível de cromossoma para pesquisa de alta resolução.
✅ Genomas Complexos: Poliploidia, Heterozigosidade, Repetições
Os genomas de plantas e animais frequentemente contêm altos níveis de duplicação, variação estrutural ou elementos repetitivos. Abordagens de novo utilizando sequenciação de leitura longa e mapeamento Hi-C superar estes desafios.
✅ Construção do Pan-genoma
Quando um único genoma de referência não consegue capturar a diversidade genética de uma espécie, a construção de um pan-genoma através da montagem de novo de múltiplos indivíduos revela variações específicas da população.
✅ Descoberta de Características e Melhoramento Molecular
Assembleias de alta qualidade fornecem a base para GWAS, mapeamento de QTLe edição do genoma—especialmente em investigação agrícola, de aquicultura e de pecuária.
Dica Profissional:
O sequenciamento de novo não é apenas para espécies novas. Muitas vezes é o melhor forma de atualizar um genoma de baixa contiguidade a uma qualidade pronta para publicação, especialmente quando combinado com dados HiFi e Hi-C.
Visão Geral da Estratégia Tecnológica: Comparação de Plataformas para Montagem de Genomas
| Plataforma | Papel na Assembleia | Cobertura Típica | Forças | Recomendado Para |
|---|---|---|---|---|
| Illumina / DNBSEQ™ | Inquérito do genoma, correção de erros | 30–50× | Alta precisão, baixo custo, essencial para o perfilamento de k-mers. | Análise inicial da complexidade do genoma |
| PacBio HiFi | Montagem de novo a nível de contig | 30–60× | Precisão ultra-alta (Q20+), excelente para genomas ricos em repetições ou poliploides. | Genomas de plantas/animais com alta heterozigosidade |
| Oxford Nanopore (ONT) | Fechamento de lacunas, montagem de leituras ultra-longas | 50–100× | Leituras ultra-longas (>100 kb), ideais para montagens telómero-a-telómero (T2T) | Genomas que requerem continuidade completa ou quase completa. |
| Hi-C | Escoramento em escala de cromossoma | 100–150× | Constrói pseudomoléculas de cromossomas, corrige montagens incorretas. | Ancoragem final de cromossomas e QC |
| Leituras Ligadas 10x Genomics | Resolução de repetição, faseamento (opcional) | ~60× | Fases de locos heterozigóticos, suportam a separação de haplótipos. | Espécies diploides ou altamente heterozigóticas |
| Mapeamento Óptico BioNano | Deteção de variações estruturais grandes (opcional) | NA | Deteta SVs, andaimes de montagens complexas. | Genomas muito grandes ou estruturalmente complexos |
Insight sobre Estratégia Híbrida:
As montagens mais bem-sucedidas combinam leituras curtas + leituras longas + Hi-C. Adaptamos a combinação de plataformas com base no tamanho do genoma, ploidia e nos seus objetivos de investigação.
Fluxo de Trabalho do Serviço de Sequenciamento de Genoma De Novo: Desde a Amostra até a Montagem em Escala de Cromossoma
Controlo de Qualidade da Amostra
- Avaliação de integridade através de PFGE ou Femto Pulse
- Verificações de pureza (razões OD, Qubit e remoção de contaminação de RNA)
Inquérito do Genoma (Illumina)
- Sequenciação de leitura curta (~100X de cobertura)
- Análise de K-mer para tamanho do genoma, conteúdo de repetições, heterozigose
- Guias para a estratégia de long-read e Hi-C a montante
Sequenciação de Longas Leituras (PacBio HiFi ou Oxford Nanopore)
- Montagem de novo de alta contiguidade de contigs primários
- Plataformas selecionadas com base nas propriedades do genoma-alvo
- Cobertura de 30–100X dependendo da plataforma
Estrutura de Suporte e Ancoragem de Cromossomas (Sequenciação Hi-C)
- Captura interacções de cromatina a longa distância
- Âncoras contigs a pseudo-cromossomas
- Permite a montagem do genoma em escala de cromossoma.
Polimento e Correção de Erros
- Polimento de leituras curtas para correção de SNPs/indels
- Preenchimento de lacunas e resolução de repetições
- BUSCO e verificações de qualidade baseadas em alinhamento
Anotação do Genoma (Opcional Adicional)
- Predição da estrutura do gene (ab initio e baseada em evidências)
- Mascaramento de região repetida
- Anotação funcional (GO, KEGG, Pfam)

Análise Bioinformática
O nosso pipeline de bioinformática genómica integra montagem de alto rendimento, anotação e análise comparativa—personalizado para espécies de plantas e animais. Esteja você a trabalhar com um genoma diploide, poliploide ou altamente repetitivo, fornecemos soluções escaláveis e precisas para decifrar a complexidade.


Fluxo de trabalho

Requisitos de Amostra e Normas de Qualidade
| Tipo de Amostra | Montante Necessário | Critérios de Pureza | Notas Especiais |
|---|---|---|---|
| Tecido animal fresco ou congelado | ≥ 1,5 μg gDNA (≥50 kb de comprimento médio) | OD260/280: 1,8–2,0; OD260/230: ≥2,0 | Evite amostras contaminadas com sangue; não realizar ciclos de congelamento-descongelamento. |
| Folhas ou caules de plantas | ≥ 2 μg gDNA (≥50 kb de comprimento médio) | O mesmo que acima | Evite a contaminação por polissacarídeos e polifenóis; prefira tecidos jovens e tenros. |
| Células cultivadas (por exemplo, peixes, insetos) | ≥ 1,5 μg gDNA | Igual ao acima | Para insetos, remova o exoesqueleto de quitina antes da extração. |
| tecido cruzado Hi-C | ≥ 1 g de tecido fresco ou ~5 milhões de células | OD não aplicável (entrelaçado) | A ligação cruzada e a fixação devem seguir o nosso protocolo de preparação Hi-C. |
Critérios Gerais de QC:
- DNA de alto peso molecular: >50 kb preferido para plataformas de leitura longa (PacBio HiFi, Oxford Nanopore)
- Sem contaminação de RNA, proteína ou metabolitos secundários.
- Concentração: ≥50 ng/μL (Qubit); Integridade: Confirmada por gel de campo pulsado ou Femto Pulse
Precisa de ajuda com a extração de ADN?
A CD Genomics oferece serviços de extração de ponta a ponta, adaptados a genomas de plantas e animais, utilizando purificação por esferas magnéticas para minimizar a fragmentação e contaminantes. Contacte-nos para saber mais.
Entregáveis
A CD Genomics fornece entregas abrangentes e bem organizadas para cada projeto de sequenciação de genoma completo de plantas ou animais de novo. Os nossos pacotes de dados são adaptados para uma análise posterior sem interrupções e prontidão para publicação.
✅ Entregas Padrão
| Tipo de Ficheiro / Conteúdo | Descrição |
|---|---|
| Dados de Sequenciação Bruta | Ficheiros FASTQ de plataformas PacBio HiFi, Nanopore, Illumina e/ou Hi-C |
| Resultados da Assembleia | Contigs e andaimes do genoma em formato FASTA |
| Relatório de Métricas de Montagem | Resumo do tamanho do genoma, N50, conteúdo de GC, completude (BUSCO, etc.) |
| Anotação do Genoma (Opcional) | Arquivos GFF3/GTF, tabelas de anotação funcional, visualização da estrutura genética |
| Mapa de Interacção Hi-C | Matrizes de contacto e gráficos de montagem de andaimes (se Hi-C estiver incluído) |
| Gráficos de Circos e Synteny | Sumários visuais da arquitetura do genoma e análise comparativa |
| Relatório Resumido de Bioinformática | Métodos detalhados, versões de software e descrições de pipeline. |
✅ Adicionais Opcionais (Atualizações de Projeto)
Para projetos que requerem análise de dados avançada ou resultados personalizados, a CD Genomics oferece as seguintes opções de atualização:
| Opção de Atualização | Descrição |
|---|---|
| Montagem a Nível de Cromossoma | Alcançado através de Hi-C ou BioNano scaffolding, fornecendo pseudomoléculas em escala de cromossoma. |
| Anotação do Genoma Funcional | Inclui previsão de genes, enriquecimento GO/KEGG, elementos repetidos e anotações de TE. |
| Pacote de Genómica Comparativa | Inclui sintegia de genoma completo, agrupamento de ortólogos e estimativa de distância evolutiva. |
| Construção do Pan-Genoma | Integração de montagem multi-amostra, deteção de variantes estruturais e conjuntos de genes partilhados/únicos |
| Integração do Epigenoma | Complemento para mapas de metilação ou modificação de histonas (requer preparação de amostra compatível) |
| Formatação de Dados Prontos para GWAS | Inclui chamada de SNP/INDEL, formatação VCF e ficheiros de estrutura populacional para pipelines de GWAS. |
Resumo do Projeto em Destaque
| Tipo de Espécie | Tamanho do Genoma | Contagem de Contigs | Contig N50 | Taxa de Ancoragem Hi-C |
|---|---|---|---|---|
| Planta A | 1,02 Gb | 626 | 7,15 Mb | 95,4% |
| Planta B | 793,46 Mb | 347 | 34,19 Mb | 96,1% |
| Animal Aquático A | 979,98 Mb | 513 | 5,36 Mb | 97,89% |
| Animal Aquático B | 827,62 Mb | 170 | 9,88 Mb | 99,51% |
| Mamífero | 3,3 Gb | 2.658 | 79,41 Mb | 98,58% |
| Inseto | 979,98 Mb | 513 | 5,37 Mb | 97,89% |
Estes genomas de alta contiguidade demonstram o robusto pipeline de montagem da CD Genomics em diversas espécies — desde genomas de plantas complexas até montagens a nível de cromossoma em mamíferos e organismos aquáticos.
Os resultados parciais estão mostrados abaixo:
Distribuição da qualidade da base.
Distribuição de conteúdo base.
Número de SNP partilhado entre amostras.
Distribuição dos tipos de mutação SNP.
Estatísticas em gráfico de setores das anotações SNP.
Número de InDel partilhado entre amostras.
Distribuição do comprimento de InDel tanto a nível do genoma completo como nas regiões CDS.
Estatísticas de gráfico de setores das anotações InDel.
Perguntas Frequentes (FAQs)
O que é o Sequenciamento de Genoma Completo de Novo de Plantas ou Animais?
É uma abordagem sem referência para reconstruir o genoma completo de uma espécie do zero. Este método é essencial para espécies que não possuem um genoma de referência fiável ou aquelas com variações estruturais complexas.
Quando devo escolher o sequenciamento de genoma de novo em vez de re-sequenciamento?
Resposta:
Escolha a sequenciação de novo quando:
- Não existe um genoma de referência de alta qualidade.
- A sua espécie possui uma diversidade ou complexidade genómica significativa.
- O seu objetivo é construir um pan-genoma ou melhorar a qualidade do referência atual.
Quais plataformas de sequenciação são utilizadas no seu serviço?
Utilizamos uma estratégia híbrida que combina:
- Illumina (para inquérito baseado em k-mer e polimento)
- PacBio HiFi / Oxford Nanopore (para geração de contigs de leitura longa)
- Hi-C (para estruturação a nível de cromossoma)
Esta abordagem em camadas maximiza a continuidade e a precisão da montagem.
Qualidade da amostra é necessária?
Os requisitos típicos incluem:
- gDNA de alto peso molecular
- OD260/280 = 1,8–2,0
- OD260/230 ≥ 2,0
- ≥10–15 μg de DNA total dependendo da plataforma
Fornecemos diretrizes de submissão detalhadas mediante solicitação.
Quais serão os entregáveis que receberei?
Os entregáveis incluem:
- Genoma montado de alta qualidade (FASTA)
- Relatório de métricas e qualidade de montagem
- Ficheiros de previsão de genes e anotação funcional
- Sumários visuais (por exemplo, mapas de círculo do genoma, gráficos de sintecnia)
Você oferece análise de downstream?
Sim. A CD Genomics oferece opções avançadas de bioinformática, incluindo:
- Agrupamento de ortólogos
- Reconstrução filogenética
- Análise da expansão da família de genes
- Avaliação da sintenia e colinearidade genómica
Destaque de Publicação do Cliente
Estudo de Caso: Decifrar os Mecanismos de Metilação m6A em Arabidopsis Usando Sequenciação de Novo de Todo o Genoma
Diário: Novo Fitologista
Fator de Impacto8.3
Publicado: 2017
DOI: 10.1111/nph.14586
Fundo
Como organismo modelo para a genética das plantas, Arabidopsis thaliana tem sido fundamental na descoberta de mecanismos regulatórios epigenéticos. Entre estes, N6-metiladenosina (m6A) A modificação do mRNA desempenha um papel fundamental no crescimento, desenvolvimento e respostas ao stress das plantas. No entanto, os componentes moleculares que impulsionam esta modificação — e a sua conservação funcional em plantas superiores — continuam a ser incompletamente compreendidos.
Este estudo teve como objetivo identificar os fatores genéticos essenciais para metilação de RNA m6A em Arabidopsis ao integrar sequenciação de genoma completo de novo com genómica funcional direcionadaUm foco central foi colocado na compreensão do papel do HAKAI, um conservado ligase de ubiquitina E3, dentro da maquinaria de metilação.
Materiais e Métodos
Análise do Genoma e Triagem de Mutantes:
- Mutantes de Arabidopsis thaliana com suspeitas de defeitos na metilação m6A foram selecionados a partir de bibliotecas de inserção de T-DNA.
- O DNA genómico foi extraído e sequenciado de novo utilizando plataformas de leitura curta da Illumina e de leitura longa da ONT, alcançando alta continuidade e cobertura.
- Os eventos de interrupção genética foram mapeados e validados.
Perfilagem de m6A:
- O RNA total foi isolado de linhas mutantes e de tipo selvagem.
- A quantificação de m6A foi realizada utilizando LC-MS/MS e m6A-seq baseado em imunoprecipitação.
Validação Funcional:
- Ensaios de complementação foram utilizados para verificar a função do gene.
- A RNA-seq foi aplicada para avaliar as consequências transcriptómicas da perda de HAKAI.
Resultados
O sequenciamento de genoma completo de novo permitiu a identificação precisa de inserções de T-DNA que perturbam HAKAI, um gene que codifica uma ligase E3 de ubiquitina do domínio RING. A perda funcional de HAKAI reduziu significativamente os níveis globais de metilação m6A, comparável a mutantes de escritores m6A conhecidos como por exemplo MTA e FIP37.
Principais Conclusões:
- A perda de HAKAI levou a defeitos na dominância apical, no tempo de floração e na viabilidade do embrião, fenocopiando outros mutantes de componentes centrais de m6A.
- A análise do transcriptoma revelou desregulação em vias chave de desenvolvimento e sinalização hormonal.
- A complementação do gene HAKAI restaurou tanto os níveis de metilação m6A como o desenvolvimento normal.
Conclusão
Este estudo demonstrou que HAKAI é um componente crítico do complexo de metilação m6A. em plantas, atuando ao lado de metiltransferases canónicas. O uso de sequenciação de genoma completo de novo permitiu o mapeamento preciso de interrupções genéticas e foi essencial para validar hipóteses funcionais em contextos geneticamente complexos.
O caso destaca como sequenciação de genoma completo de plantas de novo, emparelhado com ferramentas epitranscriptómicas e transcriptómicas, pode desvendar mecanismos regulatórios conservados. A CD Genomics apoia estudos semelhantes ao oferecer soluções integradas. montagem do genoma, análise de metilaçãoe genómica funcional pipelines para epigenética de plantas e além.
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
Combinações de Bacteriófagos São Eficazes contra Multirresistentes Pseudomonas aeruginosa e Aumentar a Sensibilidade aos Antibióticos Carbapenémicos
Diário: Vírus
Ano2024
Sequência do genoma, genes de resistência a antibióticos e plasmídeos em uma variante monofásica de Salmonella typhimurium isolado de carne de porco de retalho
Diário: Anúncios de Recursos de Microbiologia
Ano2024
Genes de Salmonella enterica Serovar Enteritidis Envolvido na Formação de Biofilme
Diário: Microbiologia Aplicada
Ano2024
Sequência completa do genoma do probiótico Bifidobacterium adolescentis cepa iVS-1
Diário: Anúncios de Recursos em Microbiologia
Ano2023
Ver mais artigos publicados pelos nossos clientes.
