O que é o sequenciamento de genoma completo de novo?
O sequenciamento de genoma completo de novo é o processo de montagem de um genoma completo a partir do zero — sem depender de qualquer sequência de referência pré-existente. Ao contrário do resequenciamento, que alinha as leituras a um genoma conhecido, a montagem de novo reconstrói o genoma diretamente a partir de fragmentos de sequenciamento, tornando-se o método preferido para espécies que não possuem um genoma de referência ou para projetos que exigem uma visão imparcial do conteúdo genómico.
A CD Genomics oferece serviços abrangentes de sequenciação de genomas de novo, cobrindo todo o espectro de complexidade biológica — desde genomas virais, bacterianos e fúngicos até genomas de grandes plantas e animais. A nossa abordagem multi-plataforma integra leituras curtas da Illumina, leituras longas HiFi da PacBio, leituras ultra-longas da Oxford Nanopore e dados de interação de cromatina Hi-C para fornecer montagens que variam desde qualidade de rascunho padrão até resolução sem lacunas de telómero a telómero (T2T), incluindo a construção de pan-genomas quando a diversidade a nível populacional é necessária.
Sequenciação De Novo em Todos os Tipos de Organismos
O sequenciamento de genomas de novo não é um serviço de tamanho único. Diferentes grupos de organismos apresentam desafios distintos em termos de tamanho do genoma, ploidia, conteúdo de repetições e heterozigosidade. O nosso portfólio de serviços está estruturado para abordar estas diferenças com estratégias experimentais e analíticas personalizadas.

Sequenciação de Genoma Completo de Novo de Microrganismos (Viral / Bacteriano / Fúngico)
Os genomas microbianos variam de alguns kilobases (vírus) a dezenas de megabases (fungos). O nosso fluxo de trabalho de de novo microbiano combina leituras longas da ONT ou PacBio para montagem contígua com leituras curtas da Illumina para polimento, se desejado. Esta abordagem híbrida produz consistentemente cromossomas completos e circulares e plasmídeos totalmente montados.
- Genomas virais — Montagem sem referência para vírus de DNA e RNA. Veja o nosso serviço de sequenciação de genoma viral.
- Genomas bacterianos — Montagem completa de cromossomas e plasmídeos com deteção de metilação. Visite sequenciação de genoma completo de bactéria de novo.
- Genomas fúngicos — Desde leveduras até fungos filamentosos, incluindo regiões ricas em repetições. Explore o nosso serviço de sequenciação de genoma completo de fungos de novo.
Sequenciação de Genoma Completo de De Novo de Plantas e Animais
Os genomas de plantas e animais são maiores e mais complexos, envolvendo frequentemente poliploidia, alta heterozigosidade e grandes frações de elementos repetitivos. O nosso fluxo de trabalho padrão integra o levantamento do genoma (Illumina, ~50×), backbone de leitura longa (PacBio HiFi, 30–60×), escoramento Hi-C (≥100×) e, opcionalmente, o fecho de lacunas ultra-longas da ONT. Esta estratégia fornece rotineiramente montagens a nível de cromossoma em culturas, gado, vida selvagem e espécies aquáticas. Veja a nossa dedicada sequenciação de genoma completo de novo de plantas e animais página.
Montagem do Genoma Telómero a Telómero (T2T)
Quando as montagens de referência padrão ainda contêm lacunas não resolvidas — em centrómeros, telómeros, duplicações segmentares ou arranjos de DNA ribossómico — a montagem T2T do genoma é o próximo passo. A montagem T2T visa a reconstrução sem lacunas de cada cromossoma de uma extremidade à outra. O Projeto BioGenome da Terra define a qualidade T2T como zero lacunas de sequência com uma precisão de base QV > 60.
A Nossa Sinergia Tecnológica
| Componente | Papel | Plataforma |
|---|---|---|
| Âncora de precisão | Estrutura de alta fidelidade com precisão de nível base | PacBio HiFi (15–20 kb, Q20+) |
| Construtor de pontes | Leituras ultra-longas que abrangem centrómeros e arranjos de rDNA | ONT ultra-longo (N50 > 100 kb) |
| Arquiteto de andaimes | Ordenação de cromossomas e validação estrutural | Hi-C ou Pore-C |
A combinação da precisão HiFi com a ultra-longa contiguidade ONT tem-se mostrado eficaz mesmo em genomas poliploides complexos. Uma revisão de 2024 em Genética da Natureza (Garg et al., doi:10.1038/s41588-024-01830-7destaca como as estratégias T2T estão agora a ser aplicadas a culturas com alta ploidia e grandes frações de repetição, transformando a resolução da genómica vegetal.
O nosso portfólio de serviços T2T inclui três níveis: Vertebrados T2T (genomas grandes em escala de Gb), Planta T2T (culturas poliploides e genomas ricos em repetições), e Bacteriano T2T (cromossomas circulares fechados sem lacunas). Para informações detalhadas, consulte o nosso serviço de sequenciação telómero-a-telómero.

Análise do Pan Genoma
Um único genoma de referência captura o conteúdo genético de um indivíduo, mas não pode representar a plena diversidade genética de uma espécie. A análise do pan-genoma aborda isso ao construir um repertório genético abrangente através de múltiplos indivíduos ou estirpes.
Os pan-genomas consistem em:
- Genoma central — Genes presentes em todos os indivíduos, tipicamente responsáveis por funções biológicas essenciais.
- Genoma variável (acessório) — Genes presentes em um subconjunto de indivíduos, frequentemente codificando traços adaptativos, fatores de virulência ou funções específicas de estirpe.
O nosso fluxo de trabalho do pan-genoma suporta abordagens tanto lineares como baseadas em grafos:
- Assemblagem de novo de múltiplos indivíduos utilizando a mesma estratégia multi-plataforma.
- Classificação do genoma central/acessório
- Análise de variação de presença-ausência de genes (PAV)
- Análise filogenética baseada no conteúdo genético
- Construção de pan-genoma baseada em grafos opcional para conjuntos de dados complexos
É necessário um mínimo de duas amostras, mas tamanhos de amostra maiores (dezenas a centenas) proporcionam uma cobertura cada vez mais abrangente. Visite o nosso serviço de análise do pan-genoma para mais detalhes.

Estratégia de Tecnologia e Plataforma
A escolha da plataforma de sequenciação adequada para um projeto de genoma de novo depende do tamanho do genoma, da complexidade e da qualidade de montagem desejada. A tabela abaixo resume os papéis complementares de cada plataforma no nosso fluxo de trabalho.
| Plataforma | Tipo de Leitura | Comprimento Típico | Precisão | Papel Principal na Montagem De Novo |
|---|---|---|---|---|
| Illumina | Pares curtos de extremidade | 150 pb × 2 | >Q30 | Inquérito do genoma, polimento, validação de variantes |
| PacBio HiFi | Consenso circular | 15–20 kb | >Q20 (99,9%) | Espinha dorsal do contig primário, resolução de haplótipos |
| Oxford Nanopore | Leituras longas nativas | 10–100+ kb | Varia conforme o chamador de base. | Fecho de lacunas, repetição de spanning, deteção de SV |
| Hi-C | Captura da conformação da cromatina | PE150 | >Q30 | Ancoragem e estruturação de cromossomas |
Para a maioria dos projetos de de novo em plantas e animais, uma estratégia híbrida que combina HiFi (30–60×) com Hi-C (≥100×) fornece montagens em escala de cromossomos com valores de N50 de contig superiores a 10 Mb. A adição de leituras ultra-longas da ONT (40–100×) permite uma resolução T2T. Para genomas microbianos, uma abordagem híbrida mais simples de ONT + Illumina é tipicamente suficiente para gerar montagens completas e fechadas.
Fluxo de Trabalho de Sequenciação de Genoma De Novo
O nosso fluxo de trabalho de ponta a ponta é projetado para manter a rastreabilidade das amostras e o controlo de qualidade em cada etapa, desde a receção da amostra até à entrega final dos dados.

1. Amostra de QC
Avaliação de integridade via PFGE ou Femto Pulse. Verificações de pureza (OD260/280, OD260/230, quantificação por Qubit). Remoção de RNA e quantificação de DNA.
2. Inquérito do Genoma (Illumina)
Sequenciação de leitura curta com cobertura de ~50× para análise de k-mer. A saída inclui estimativa do tamanho do genoma, taxa de heterozigose, conteúdo de repetições e conteúdo de GC.
3. Sequenciação de Longas Leituras
Preparação de bibliotecas e sequenciação PacBio HiFi (30–60×) e/ou ONT ultra-longa. Seleção da plataforma com base na complexidade do genoma e no âmbito do projeto.
4. Montagem e Andaimes
Assemblagem de novo usando hifiasm ou equivalente. Leituras Hi-C para escoramento a nível de cromossoma com 3D-DNA ou pipelines equivalentes.
5. Polimento e Fecho de Lacunas
Polimento de leituras curtas para correção a nível base. Leituras ultra-longas ONT para resolver lacunas remanescentes. Refinamento iterativo até que a qualidade alvo seja atingida.
6. Avaliação da Qualidade
BUSCO pontuação de completude, métricas de contiguidade (N50), estimativa de QV baseada em k-mer (Merqury) e LAI para genomas de plantas. Validação do mapa de contacto Hi-C.
7. Anotação do Genoma (Opcional)
Mascaramento de repetição, previsão da estrutura genética, anotação funcional (GO, KEGG, Pfam, InterPro) e identificação de RNA não codificante.
Análise Bioinformática
O nosso pipeline de bioinformática é projetado para fornecer dados genómicos acionáveis, não apenas sequências brutas.
Os entregáveis padrão incluem:
- Relatório de inquérito genómico — Análise de K-mer com estimativas de tamanho, heterozigose e repetições
- Montagem de novo — Formato FASTA com haplótipos primários e alternativos, se aplicável
- Avaliação da qualidade da montagem — Contig N50, scaffold N50, completude BUSCO, pontuação QV, LAI (plantas)
- Anotação do genoma — Elementos repetidos, previsão da estrutura do gene, anotação funcional (GO, KEGG, Pfam, InterPro)
- Validação Hi-C — Verificação do mapa de contacto e ancoragem de cromossomas
- Relatório de QC abrangente
Análises adicionais opcionais:
- Genómica comparativa — agrupamento de ortólogos, expansão/contração de famílias de genes, filogenia, sinetia
- Construção do pan-genoma — classificação do genoma central/acessório, análise de PAV, representação baseada em grafos
- Montagem e fase resolvidas por haplótipos
- Análise epigenética — deteção de metilação 5mC (PacBio HiFi ou ONT nativo)

Requisitos de Amostra
A qualidade adequada da amostra é a base de uma montagem de genoma de novo bem-sucedida, especialmente para sequenciação de long-read e Hi-C.
| Tipo de Amostra | Entrada Recomendada | Concentração | Pureza (OD260/280) | Notas |
|---|---|---|---|---|
| gDNA de alto peso molecular | ≥1–5 µg | ≥30 ng/µL | 1,8–2,0 | Tecido fresco preferido para projetos de leitura longa; sem degradação. |
| Tecido (para extração) | ≥100 mg de peso fresco | — | — | Congelado instantaneamente em azoto líquido; evitar RNAlater para DNA de alto peso molecular. |
| Sangue Total (vertebrado) | ≥2 mL | — | — | Anticoagulante EDTA; armazenar a 4°C, enviar em pacotes frios. |
| Pelote de cultura microbiana | ≥10⁸ células (bactérias) ≥10⁷ células (fungos) |
— | — | Congelado a snap ou em solução de preservação de DNA |
| amostra Hi-C | Mesma fonte que o DNA principal | — | — | Requer tecido fresco entrelaçado; não é possível usar ADN arquivado. |
Todas as amostras passam por controlo de qualidade interno ao serem recebidas. Também oferecemos serviços de extração de DNA para projetos onde a preparação da amostra é uma preocupação.
Entregáveis
A CD Genomics fornece entregas abrangentes e organizadas para cada projeto de sequenciação de genoma de novo, adaptadas para uma análise e publicação subsequentes sem interrupções.
| Entregável | Descrição |
|---|---|
| Dados de sequenciação brutos | Ficheiros FASTQ por plataforma e biblioteca |
| Ficheiros de montagem | Montagem do genoma em formato FASTA (haplótipos primários + alternativos, se aplicável) |
| Relatório de qualidade de montagem | métricas N50, completude BUSCO, pontuação QV, LAI (plantas), validação Hi-C |
| Anotação do genoma | Arquivo de anotação GFF3 (repetição, estrutura do gene, anotação funcional) |
| Relatório de análise comparativa | Opcional — tabelas de ortólogos, filogenia, blocos de sintecnia, resultados de PAV |
| Documentação do projeto | Resumo dos métodos, registos de software e parâmetros, guia de utilização de dados. |
Por que escolher a CD Genomics para sequenciação de genoma de novo
Desde plataformas de sequenciação avançadas até à entrega de dados de alta qualidade, a CD Genomics oferece uma solução eficiente, de ponta a ponta, adaptada a diversas necessidades de sequenciação de genomas de novo.
- Cobertura de espectro completo — Desde genomas virais e bacterianos até complexas assembleias de plantas e animais. Um fornecedor, um ponto de contacto.
- Estratégia multicanal — Illumina, PacBio HiFi, Oxford Nanopore e Hi-C disponíveis internamente. Combinações de plataformas adaptadas a cada genoma.
- Histórico comprovado — Projetos de genoma de novo concluídos em diversas espécies, cumprindo os padrões de referência EBP (6.C.Q40 ou superior).
- capacidade T2T — Serviço T2T dedicado utilizando a sinergia HiFi + ultra-longa ONT para vertebrados, plantas e bactérias.
- Serviço de ponta a ponta — Amostragem de QC, preparação de biblioteca, sequenciação, montagem, anotação e análise opcional de pan-genoma sob um único fluxo de trabalho.
A CD Genomics está comprometida em apoiar as suas descobertas genómicas com serviços de sequenciação de genoma de novo fiáveis e abrangentes.

Sequenciação de Genoma De Novo: Desde Qualquer Espécie até uma Montagem Pronta para Publicação
Resultados da Demonstração
Abaixo estão os tipos de dados representativos gerados durante um típico projeto de sequenciação de genoma de novo. Os resultados variarão consoante a espécie e o âmbito do projeto.
Figura 1: Distribuição de K-mer (Inquérito Genómico)
Gráfico de frequência de K-mer a partir de dados de leituras curtas, utilizado para estimar o tamanho do genoma, heterozigose e conteúdo de repetições. Esta análise orienta a seleção da plataforma subsequente e os alvos de cobertura.
Figura 2: Mapa de Calor de Interação de Cromatina Hi-C
Mapa de contacto Hi-C em todo o genoma utilizado para ordenar e orientar contigs em andaimes em escala de cromossoma. O forte sinal diagonal indica uma estruturação correta.
Figura 3: Avaliação de Completude do BUSCO
Percentagem de genes BUSCO completos, fragmentados, duplicados e em falta. Montagens de qualidade de referência normalmente atingem >95% de pontuações BUSCO completas.
Figura 4: Comparação de Contiguidade de Montagem
Comparação ilustrativa dos valores de contig N50 entre estratégias. Abordagens híbridas que combinam PacBio HiFi com Hi-C produzem consistentemente a maior continuidade. (Referência: Hotaling et al., BMC Genómica, 2023)
Referência
- Hotaling, et al. Leituras longas altamente precisas são cruciais para realizar o potencial da genómica da biodiversidade. BMC Genómica. 2023. Desculpe, mas não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, copie e cole aqui para que eu possa traduzir.
Perguntas Frequentes sobre Sequenciamento de Genoma De Novo
1. Que tipos de organismos pode sequenciar utilizando sequenciação de genoma completo de novo?
Fornecemos sequenciação de novo para vírus, bactérias, fungos, plantas e animais — desde pequenos genomas microbianos (alguns kb) até grandes genomas de vertebrados e plantas (escala de gigabases). As estratégias da plataforma são adaptadas a cada grupo de organismos.
2. Qual é a diferença entre a montagem de novo padrão e a montagem de genoma T2T?
A montagem padrão de novo normalmente resolve >95% do genoma, mas deixa lacunas em regiões repetitivas, como centrômeros, telômeros e DNA ribossomal. A montagem T2T fecha essas lacunas usando leituras ultra-longas, produzindo um genoma sem lacunas com todos os cromossomas do telômero ao telômero. O Projeto BioGenome da Terra (EBP) define a qualidade T2T como zero lacunas com QV > 60.
3. Quantas amostras são necessárias para a análise do pan-genoma?
É necessário um mínimo de dois indivíduos, mas tamanhos de amostra maiores (tipicamente 10–100+) proporcionam uma cobertura mais abrangente da diversidade genética da espécie. O número ideal depende da estrutura populacional, da diversidade genética e dos objetivos da pesquisa.
4. Que plataformas de sequenciação utiliza para a montagem de genomas de novo?
Usamos Illumina (leituras curtas para inquérito e polimento), PacBio HiFi (leitura de alta precisão para montagem de backbone), Oxford Nanopore (leituras ultra-longas para fecho de lacunas e resolução de repetições), e Hi-C (andares em escala de cromossoma). A combinação de plataformas é personalizada para cada projeto.
5. Quais métricas de qualidade são utilizadas para avaliar montagens genómicas?
As métricas padrão incluem N50 de contig, N50 de scaffold (contiguidade), completude BUSCO (conteúdo genético, visando >90–95% completo), pontuação QV (precisão da base, visando ≥Q40 de acordo com os padrões EBP), LAI (para genomas de plantas) e validação do mapa de contato Hi-C (correção estrutural).
6. Quais são os requisitos de amostra para sequenciação de genoma de novo?
Para projetos de de novo padrão, recomenda-se gDNA de alto peso molecular com OD260/280 de 1,8–2,0 e mínima degradação. As quantidades de entrada variam de ≥1 µg (leitura curta) a ≥5 µg (leitura longa). O tecido fresco é preferido para a extração de DNA HMW. Consulte a seção de Requisitos de Amostra acima para diretrizes detalhadas.
7. Consegue montar genomas poliploides ou altamente heterozigóticos?
Sim. A nossa abordagem baseada em PacBio HiFi é especificamente concebida para resolver genomas complexos. As leituras HiFi fornecem a precisão necessária para a separação de haplótipos em poliploides, e uma cobertura mais elevada (≥60×) é aplicada a espécies com heterozigosidade ou ploidia elevadas. Uma revisão de 2024 em Genética da Natureza (doi:10.1038/s41588-024-01830-7) documentos de assemblagens T2T bem-sucedidas em culturas poliploides utilizando estas mesmas estratégias.
8. Que análise de bioinformática está incluída no serviço de sequenciação de novo?
A bioinformática padrão inclui inquérito genómico (análise de k-mer), montagem de novo, avaliação da qualidade da montagem e anotação estrutural/funcional. Os módulos opcionais incluem genómica comparativa (família de genes, sintenia, filogenia), construção de pan-genoma, montagem resolvida por haplótipos e análise epigenética.
Estudo de Caso: Genoma de Telómero a Telómero de Fragaria vesca
Destaque de Publicação em Acesso Aberto
O genoma telómero-a-telómero de Fragaria vesca revela a evolução genómica de Fragaria e a origem do morango octoploide cultivado.
Diário: Pesquisa em Horticultura
Fator de Impacto: 8.7
Publicado: 2023
Fundo
Fragaria vesca (a morango silvestre) é um sistema modelo para o desenvolvimento de frutos, interações planta-patógeno e genómica funcional. Apesar da sua importância, as montagens genómicas anteriores careciam de continuidade, com lacunas em regiões repetitivas e centrómeros não resolvidos, limitando os estudos genómicos estruturais e funcionais.
Métodos
O estudo utilizou sequenciação de leitura longa PacBio HiFi combinada com captura de conformação da cromatina Hi-C. A montagem empregou hifiasm para a geração de contigs primários e 3D-DNA para a construção de andaimes guiada por Hi-C, seguida de curadoria manual para fechar as lacunas restantes.
Resultados
- Montagem final T2T: 220,8 Mb em todos os 7 cromossomas como contigs únicos.
- Todos os 14 telómeros e 7 centrómeros identificados com precisão.
- BUSCO completude: 98,2%
- Zero lacunas em todos os cromossomas
Conclusão
Este genoma T2T fornece uma referência sem lacunas para a genómica de Fragaria, permitindo uma análise precisa da estrutura do centrómero, da biologia do telómero e das dinâmicas evolutivas. A estratégia de montagem demonstra que a resolução T2T é alcançável para genomas de plantas utilizando PacBio HiFi e Hi-C — a mesma abordagem que aplicamos no nosso serviço de sequenciação T2T.
Figura 1 de Sun P, et al. Horticulture Research, 2023. Ideogramas dos cromossomas da montagem T2T de Fragaria vesca.
Referência
- Sun P, et al. O genoma telómero-a-telómero de Fragaria vesca revela a evolução genómica de Fragaria e a origem do morango octoploide cultivado. Pesquisa em Horticultura. 2023. Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça o conteúdo que deseja traduzir.
Publicações Relacionadas
Aqui estão publicações de projetos que utilizam sequenciação de genoma de novo e serviços genómicos relacionados:
Uma montagem de novo de sequências de conjuntos de dados genómicos da mosca-da-raiz da beterraba açucarada Tetanops myopaeformis.
Revista: Dados em Breve
Ano: 2024
Combinações de Bacteriófagos São Eficazes contra Pseudomonas aeruginosa Multirresistente e Aumentam a Sensibilidade a Antibióticos Carbapenémicos
Revista: Vírus
Ano: 2024
Influências genéticas e ambientais nas distribuições de três polimorfismos de inversão cromossómica em Anopheles gambiae
Revista: PLOS Genetics
Ano: 2025
O legado genético da fragmentação e sobreexploração na planta medicinal ameaçada Aquilaria sinensis
Revista: Scientific Reports
Ano: 2020
Geração de uma estirpe altamente atenuada de Pseudomonas aeruginosa para a produção comercial de alginato
Revista: Biotecnologia Microbiana
Ano: 2020
Análise do Genoma e Estudos de Replicação do Vírus Espumoso Símio do Macaco Verde Africano, Serotipo 3, Estirpe FV2014
Revista: Vírus
Ano: 2020
Mapeamento de Alta Densidade e Análise de Genes Candidatos de Pl18 e Pl20 em Girassol através de Resequenciamento do Genoma Completo
Revista: Jornal Internacional de Ciências Moleculares
Ano: 2020
A identificação de fatores necessários para a metilação de mRNA m6A em Arabidopsis revela um papel para a ligase de ubiquitina E3 conservada HAKAI.
Revista: New Phytologist
Ano: 2017
Ver mais artigos publicados pelos nossos clientes.
