
Comece com o Nível de Montagem que a Sua Pesquisa Realmente Necessita.
Muitas páginas de montagem de genomas começam por comparar plataformas de sequenciação. Na prática, o melhor ponto de partida é o nível de montagem. Um genoma microbiano, um primeiro rascunho para uma espécie não modelo, um genoma de planta a nível de cromossoma e um genoma animal resolvido por haplótipos não necessitam do mesmo plano.
Antes de recomendar um fluxo de trabalho, ajudamo-lo a definir o que a montagem final deve suportar. Um projeto para descoberta de genes pode necessitar de uma estratégia de montagem e anotação diferente de um projeto focado em mapeamento de características, variação estrutural, construção de pan-genoma ou genómica populacional.
Montagem em nível de rascunho ou contig para recursos genómicos iniciais
Uma montagem a nível de rascunho ou contig pode ser adequada quando o seu objetivo é um recurso de referência inicial, descoberta ampla de genes, reconstrução de genomas microbianos ou análise comparativa preliminar. Pode ser útil quando o genoma é compacto, a questão de pesquisa não requer uma ordenação a escala de cromossomos, ou o projeto é concebido como um primeiro passo antes de uma análise mais aprofundada.
Este nível pode fornecer um ponto de partida prático, mas pode não suportar totalmente a análise de ligação, a interpretação estrutural em escala de cromossoma ou a resolução de repetições complexas.
Montagem a nível de cromossoma para estudos de ligação, traços e comparativos
A montagem a nível de cromossoma é frequentemente necessária quando a posição genómica é importante. Isto inclui mapeamento de características, investigação de melhoramento, evolução de cromossomas, análise de sintecnia, genómica comparativa e muitos projetos de genoma de plantas ou animais.
A scaffolding Hi-C pode ajudar a ordenar e orientar contigs montados em andaimes em escala de cromossoma. Para projetos em que a montagem final suportará mapeamento ou trabalho comparativo a montante, a estrutura em nível de cromossoma pode ser mais valiosa do que uma montagem fragmentada com alta precisão local, mas organização de longo alcance limitada.
Montagem resolvida por haplótipos para genomas heterozigóticos ou poliploides
Para organismos altamente heterozigóticos, cruzados, híbridos ou poliploides, uma única representação colapsada pode ocultar estruturas importantes específicas de alelos ou haplótipos. Nestes casos, uma montagem resolvida por haplótipos ou em fase pode ser útil.
Esta estratégia pode ser importante para a reprodução de plantas e animais, descoberta de genes específicos de alelos, análise de variações estruturais e projetos onde subgenomas ou cromossomas homólogos necessitam de uma interpretação cuidadosa.
Montagem semelhante ao T2T quando repetições, centrómeros e telómeros importam
Uma estratégia semelhante ao T2T pode ser considerada quando lacunas não resolvidas, repetições longas, regiões centroméricas, regiões teloméricas ou regiões estruturais complexas são centrais para o estudo. Este é geralmente um tipo de projeto de maior exigência, pois depende fortemente da qualidade da amostra, do comprimento da leitura, da estratégia de montagem e da revisão manual ou personalizada.
Nem todos os projetos necessitam de uma montagem semelhante a T2T. Ajudamo-lo a decidir se este nível de resolução é necessário para a sua questão de investigação ou se uma montagem a nível de cromossoma ou uma montagem faseada seria mais prática.
Combine a Estratégia de Sequenciação com a Complexidade Genómica
Uma vez que o nível de montagem alvo está claro, a estratégia de sequenciação torna-se mais fácil de desenhar. Diferentes genomas requerem diferentes camadas de evidência. O tamanho do genoma, o conteúdo de repetições, a ploidia, a heterozigosidade, o risco de contaminação e a qualidade da amostra afetam todos o plano final de montagem.
Quando o PacBio HiFi é o âncora de precisão.
Sequenciação SMRT da PacBio podem apoiar projetos de montagem de genomas que exigem evidências de leituras longas com alta precisão de consenso. As leituras HiFi da PacBio são frequentemente valiosas para a montagem de genomas de novo porque combinam a estrutura de leituras longas com alta precisão por leitura.
PacBio HiFi pode ser especialmente útil quando o projeto necessita de uma qualidade de consenso fiável, uma forte recuperação do espaço gênico e uma base limpa para a anotação.
Quando as leituras ultra-longas do Nanopore ajudam a ligar repetições
Sequenciação por nanoporo pode ser útil quando o genoma contém repetições longas, grandes regiões estruturais ou lacunas que requerem evidências de maior extensão. Para alguns genomas complexos, leituras ultra-longas podem ajudar a ligar regiões que leituras mais curtas não conseguem resolver.
Os dados de nanopore também podem ser considerados em estratégias ou projetos semelhantes ao T2T, onde o comprimento da leitura é uma grande vantagem.
Quando o Hi-C é necessário para a construção de andaimes em escala de cromossomas.
Serviço de Sequenciamento Hi-C fornece informações de contacto de longo alcance que podem ajudar a ordenar e orientar contigs em andaimes de escala cromossómica. É especialmente relevante quando a montagem final necessita de uma estrutura a nível cromossómico.
Hi-C não é simplesmente uma decoração opcional. Quando o objetivo da pesquisa depende da organização em escala de cromossomas, o Hi-C ou outra abordagem de suporte de longo alcance pode ser uma parte fundamental da estratégia.
Quando a polimento de leituras curtas ou evidências híbridas ainda ajudam
A sequenciação de leituras curtas ainda pode ter valor em projetos de montagem. Pode apoiar o polimento, a correção local, a revisão de contaminação, a avaliação de variantes ou a análise complementar, dependendo do design do projeto.
Uma estratégia híbrida pode ser útil quando um tipo de dado não responde a todas as perguntas. O objetivo não é incluir todas as tecnologias, mas combinar as camadas de evidência que se adequam ao genoma e ao objetivo subsequente.
O que Analisamos Antes de Recomendar um Plano de Montagem
Um bom plano de montagem começa com a revisão de riscos. Não queremos recomendar um fluxo de trabalho de alta gama que a amostra não consiga suportar, ou um fluxo de trabalho mínimo que não consiga responder à questão de pesquisa a montante.
Espécies, tamanho do genoma, ploidia e heterozigosidade
Primeiro, revemos o organismo e qualquer informação genómica disponível. Detalhes úteis incluem o tamanho estimado do genoma, ploidia, conteúdo de repetições conhecido, heterozigosidade esperada, genomas de referência relacionados e se a espécie é domesticada, selvagem, híbrida, consanguínea, não consanguínea ou poliploide.
Estes detalhes ajudam a determinar se o projeto pode precisar de uma montagem de novo padrão, de uma estruturação a nível de cromossoma, de uma montagem resolvida por haplótipos ou de uma estratégia mais avançada.
Qualidade do DNA HMW e risco de amostra
A qualidade do DNA de alto peso molecular é um dos fatores mais importantes na montagem de genomas de leitura longa. O tipo de tecido, o método de preservação, a dificuldade de extração, o tamanho dos fragmentos de DNA, contaminantes, polissacarídeos, polifenóis, contaminação microbiana e a idade da amostra podem afetar a construção da biblioteca e a continuidade da montagem.
Para amostras difíceis, revisamos a viabilidade antes de definir a estratégia de montagem.
Dados de sequenciação existentes ou montagens preliminares
Alguns projetos começam com dados existentes. Pode já ter leituras curtas, leituras PacBio, leituras Nanopore, dados Hi-C ou uma montagem de rascunho fragmentada.
Nestes casos, podemos ajudar a avaliar se os dados podem ser reutilizados, melhorados, estruturados, aprimorados, anotados ou integrados em um fluxo de trabalho de montagem revisto.
Objetivos a montante que afetam o design de montagem
Os objetivos a jusante devem moldar o plano de montagem. Um genoma destinado à anotação de genes pode necessitar de prioridades diferentes de um destinado à variação estrutural, análise de pan-genoma, associação genoma-largura, genómica populacional ou desenvolvimento de marcadores de melhoramento.
Revisamos estes objetivos cedo para que a montagem seja projetada como um recurso genómico utilizável, não apenas como um ficheiro FASTA.
Opções de Estratégia de Montagem do Genoma Comparadas
A melhor estratégia de montagem do genoma depende tanto do genoma quanto do objetivo da pesquisa. A tabela abaixo resume as opções comuns e como ajudamos a posicioná-las.
| Estratégia | Caso de uso mais adequado | Sensibilidade à amostra de requisitos | Ajuste da complexidade do genoma | Considerações de QC | Preparação a jusante |
|---|---|---|---|---|---|
| Montagem de rascunho de leituras curtas | Genomas compactos, triagem precoce, projetos microbianos simples ou recursos preliminares. | Moderado; fragmentos de DNA mais curtos podem ser aceitáveis dependendo do projeto. | Limitado para repetições altas, genomas grandes e estruturas complexas. | Necessita de revisão de cobertura, verificação de contaminação e revisão da completude da montagem. | Pode apoiar a descoberta básica de genes ou a análise microbiana, mas é limitado para estruturas complexas a montante. |
| Assemblagem HiFi da PacBio | Montagem de novo precisa, recuperação do espaço gênico, construção de genoma de referência, projetos prontos para faseamento. | Requer DNA de alta qualidade adequada. | Forte para muitos genomas de plantas, animais, fungos e não-modelo. | Avaliar N50 contíguo, BUSCO, QV, completude, contaminação e faseamento, se aplicável. | Base sólida para anotação, genómica comparativa e muitos projetos de genoma de referência. |
| Montagem de leituras longas ou ultra-longas de nanopore | Regiões ricas em repetições, regiões estruturais longas, fecho de lacunas, estratégias semelhantes ao T2T. | Altamente sensível à qualidade do ADN de alto peso molecular e ao comprimento dos fragmentos. | Forte quando o comprimento da leitura longa é crítico | Avaliar o comprimento da leitura, cobertura, qualidade do consenso, resolução de repetições e estratégia de polimento. | Útil para estruturas complexas, resolução de lacunas e arquitetura genómica de longo alcance. |
| Estruturação Hi-C | Montagem a nível de cromossoma, ligação, sintenia, melhoramento, genómica comparativa | Requer material adequado para a preparação da biblioteca Hi-C. | Forte para ordenar e orientar contigs em andaimes de escala cromossómica. | Avaliar a qualidade do mapa de contactos, a precisão do andaime, erros de junção e atribuição cromossómica. | Importante para trabalho subsequente a nível de cromossomas. |
| Montagem híbrida | Projetos que necessitam de precisão complementar, continuidade, polimento ou evidência a longo prazo. | Depende de todos os tipos de dados incluídos. | Flexível para projetos complexos ou de alto valor | Requer uma integração cuidadosa e controlo de qualidade entre plataformas. | Forte quando a assembleia deve suportar múltiplos usos a jusante. |
| Montagem resolvida por haplótipos | Organismos heterozigóticos, híbridos, cruzados ou poliploides. | Requer uma forte qualidade de dados e cobertura suficiente. | Forte quando a interpretação específica de alelos ou consciente do subgenoma é importante | Avaliar a precisão de fase, separação de haplótipos, duplicação e completude. | Útil para reprodução, análise específica de alelos, SV e interpretação de genomas complexos. |
| montagem semelhante ao T2T | Centromeros, telómeros, repetições longas, lacunas não resolvidas, recursos de referência premium | Muito sensível à qualidade da amostra, comprimento da leitura e design dos dados. | Forte para regiões repetitivas difíceis quando apoiado por dados. | Avaliar o encerramento de lacunas, resolução de repetições, QV, revisão manual e consistência estrutural. | Útil para projetos de referência de alta gama e pesquisa centrada na repetição. |
| Montagem de genomas microbianos, fúngicos ou compactos | Genomas de estirpes bacterianas, fúngicas, virais, plasmídicas ou engenheiradas | Frequentemente menos exigentes do que genomas eucarióticos grandes, mas o controlo de contaminação é importante. | Adequado para genomas compactos; a estratégia depende de plasmídeos, repetições e estrutura do genoma. | Avaliar a circularização, contaminação, plasmídeos, completude e qualidade da anotação. | Útil para caracterização de estirpes, genómica comparativa e investigação em biologia sintética. |
Fluxo de Trabalho de Ponta a Ponta desde a Revisão da Amostra até o Recurso Genómico Utilizável
Desde a revisão de viabilidade da amostra até o design de sequenciamento, montagem, controlo de qualidade, anotação e ficheiros prontos para processamento posterior.

Um projeto de montagem de genoma passa por vários pontos de controlo técnicos e de decisão. Construímos o fluxo de trabalho em torno do nível final de montagem e do objetivo de investigação subsequente.
Revisamos o organismo, tipo de amostra, método de preservação, qualidade esperada do DNA e fatores de risco. Para a montagem de leituras longas, o DNA de alto peso molecular é frequentemente crítico. Quando o risco da amostra é elevado, discutimos opções antes de iniciar o sequenciamento.
Com base no nível de montagem alvo, recomendamos os tipos de dados necessários. Isso pode incluir PacBio HiFi, Oxford Nanopore, Hi-C, polimento de leituras curtas ou um design híbrido. O plano de sequenciação deve corresponder à complexidade do genoma em vez de seguir um modelo fixo.
O fluxo de trabalho de montagem pode incluir a montagem de contigs, polimento, separação de haplótipos, construção de andaimes, ordenação e orientação baseada em Hi-C, revisão de lacunas e refinamento semelhante ao T2T quando apropriado.
Quando incluído no projeto, apoiamos a anotação repetida, a previsão de genes, a anotação funcional e a bioinformática a montante. A saída final pode incluir ficheiros de montagem, ficheiros de anotação, relatórios de QC, resumos visuais e documentação do projeto.
Requisitos de Amostra e Informações de Entrada do Projeto
A qualidade da amostra tem um efeito direto na estratégia de montagem do genoma. A montagem por leituras longas, a construção de andaimes a nível de cromossoma, projetos conscientes de haplótipos e fluxos de trabalho semelhantes ao T2T podem exigir um planeamento diferente de amostras e dados.
Os requisitos finais dependem da espécie, tamanho do genoma, ploidia, tipo de tecido, método de preservação, escolha da plataforma e nível de montagem alvo. Antes da confirmação do projeto, a nossa equipa analisa as informações abaixo e recomenda o fluxo de trabalho mais adequado.
| Tipo de amostra ou entrada | O que revisamos | Foco na qualidade | Informações do projeto necessárias | Pontos de controlo típicos de QC | Notas |
|---|---|---|---|---|---|
| Tecido fresco ou congelado para ADN de alto peso molecular | Tipo de tecido, preservação, rendimento esperado de ADN, risco de contaminação | Fragmentos longos de ADN adequados para bibliotecas de leitura longa | Espécies, estimativa do tamanho do genoma, ploidia, objetivo subsequente | Integridade do DNA, pureza, concentração, tamanho dos fragmentos, revisão de contaminação. | Os requisitos finais dependem da espécie, tamanho do genoma, nível de montagem e estratégia da plataforma. |
| Amostras de organismos vegetais, animais, fúngicos ou não modelo | Amostra de origem, dificuldade do tecido, inibidores, referências relacionadas, conteúdo de repetição esperado. | Viabilidade para montagem de novo, a nível de cromossoma, ou montagem faseada | Espécies, fonte da amostra, tamanho estimado do genoma, ploidia, nível de montagem alvo | Revisão da adequação da amostra, revisão da qualidade do DNA, revisão do risco de contaminação. | Tecido complexo ou rico em inibidores pode exigir uma revisão especial antes da seleção do fluxo de trabalho. |
| Dados de sequenciação existentes | Ficheiros FASTQ/BAM, plataforma, cobertura, comprimento da leitura, rótulos de amostra, montagem anterior | Compatibilidade com reassemblagem, polimento, andaimes ou anotação. | Plataforma de sequenciação, alvo do genoma, ficheiros de montagem anteriores, objetivo da análise | Integridade de ficheiros, leitura de QC, revisão de cobertura, revisão de viabilidade de montagem | Pode apoiar o resgate, a melhoria, a reanálise ou a anotação a montante quando a qualidade dos dados for adequada. |
| Ficheiros de montagem de rascunho | Montagem FASTA, estatísticas, estado de anotação, preocupações com contaminação, necessidades de scaffolding. | Potencial de melhoria e adequação a montante | Montagem FASTA, QC existente, informações sobre espécies, nível de melhoria desejado. | Revisão de contiguidade, revisão de BUSCO, verificação de contaminação, revisão da viabilidade do andaime | Pode ser melhorado através de polimento, andaimes, anotação ou bioinformática personalizada, dependendo dos dados. |
Como Ler a QC da Montagem do Genoma Sem Confiar Demasiado no N50
O N50 é amplamente utilizado, mas não deve ser a única métrica usada para avaliar uma montagem de genoma. Um N50 elevado pode refletir contigs ou scaffolds longos, mas não significa automaticamente que a montagem está completa, precisa, corretamente estruturada ou é útil para todas as análises subsequentes.
| métrica de QC | O que ajuda a avaliar | O que não responde completamente. |
|---|---|---|
| Contig N50 | Continuidade da montagem antes da andaime | Completude, correção, contaminação ou recuperação de genes |
| Andaime N50 | Continuidade de andaimes de longo alcance | Se os andaimes estão corretamente ordenados e orientados. |
| BUSCO | Completude do espaço genético utilizando genes conservados | Resolução de repetição, correção estrutural ou precisão do genoma completo |
| QV | Estimativa de precisão do consenso | Estrutura de longo alcance, qualidade de fase ou utilidade da anotação |
| Comparação do tamanho do genoma | Se o tamanho da montagem corresponde à expectativa | Se a sequência está completa ou corretamente montada. |
| Revisão de contaminação | Risco de sequência não alvo ou amostra mista | Interpretação biológica ou precisão da anotação por si só |
| Revisão do mapa de contacto Hi-C | Consistência de andaimes a nível de cromossoma | Precisão a nível base ou completude do gene |
| Resumo da anotação | Prontidão para previsão de genes e interpretação funcional | Se a estrutura da montagem está totalmente correta. |
O N50 pode ajudar a descrever a continuidade da montagem, mas não mede tudo. Uma montagem com um N50 elevado ainda pode ter contaminação, junções incorretas, genes ausentes, repetições colapsadas ou uma preparação de anotação deficiente.
BUSCO ajuda a avaliar a completude de genes conservados, enquanto o QV pode fornecer uma estimativa de precisão de consenso quando aplicável. Estas métricas ajudam a complementar o N50, especialmente quando a montagem irá apoiar a descoberta de genes, genómica comparativa ou investigação orientada para publicação.
O melhor quadro de QC depende do que a montagem deve suportar. Um genoma utilizado para anotação de genes, análise de pan-genoma, variação estrutural ou mapeamento de características pode necessitar de diferentes verificações. Ajudamos a interpretar o QC no contexto do objetivo da pesquisa.
Anotação e Análise Posterior Tornam a Montagem Utilizável
Uma montagem de genoma torna-se mais valiosa quando está ligada à anotação e à análise subsequente. Para muitas equipas de investigação, o objetivo final não é apenas um ficheiro FASTA. É um recurso genómico utilizável.
Anotação do genoma e predição de genes
Podemos apoiar. Serviço de Anotação Genómica e Predição de Genes para projetos que requerem modelos de genes, sequências codificantes, sequências de proteínas, anotação funcional e resumos de anotação.
Isto é especialmente importante para organismos não modelo, espécies com recursos de anotação limitados e projetos focados na descoberta de genes.
Anotação repetida e anotação funcional
A anotação repetida ajuda a caracterizar elementos transponíveis, regiões repetitivas e o conteúdo de repetições que podem influenciar a estratégia de montagem e a interpretação subsequente. A anotação funcional pode ajudar a conectar genes preditos com bases de dados conhecidas, vias metabólicas, famílias de genes ou funções biológicas.
Genómica comparativa, pan-genoma, SV e suporte populacional
Quando a assembleia apoiar estudos a jusante, podemos ajudar a planear análises adicionais através de Análise de Dados Genómicos, Pan Genoma, Chamadas de Variação, e Genética de Populações serviços.
Estes módulos podem suportar genómica comparativa, expansão de famílias de genes, construção de pan-genomas, análise de variação estrutural, genómica populacional e investigação relacionada com a reprodução.
Ficheiros que a sua equipa pode reutilizar para futuros estudos
- FASTA de montagem
- Ficheiros de anotação GFF ou GTF
- Ficheiros de anotação repetidos
- FASTA de proteínas e FASTA de CDS
- Relatórios BUSCO e resumos QV
- Saídas de scaffolding Hi-C
- Tabelas de genómica comparativa
- Arquivos de pan-genoma ou prontos para SV
- Relatório do projeto
Escolha uma Estratégia Baseada na Questão de Pesquisa, Não no Nome da Tecnologia
Uma boa estratégia de montagem começa com a questão de pesquisa. Ajudamo-lo a decidir qual recurso genómico é necessário e quais tipos de dados podem apoiá-lo.
Se o seu objetivo é um primeiro genoma de referência.
Uma estratégia de referência de novo pode ser adequada quando não existe uma referência próxima ou quando precisa de um novo recurso genómico para uma espécie não modelo. Em muitos casos, Serviço de Sequenciamento de Genoma Completo De Novo ou Sequenciação de Genoma Completo de Novo de Plantas/Animais pode apoiar este objetivo.
Se o seu objetivo é mapeamento de características ou apoio à reprodução.
A montagem a nível de cromossoma pode ser mais útil quando a posição genómica é importante. A scaffolding Hi-C pode apoiar o mapeamento de traços, análise de ligação, genómica comparativa e investigação relacionada com a reprodução.
Se o seu objetivo é uma interpretação consciente de poliploides ou haplótipos.
A montagem resolvida por haplótipos pode ser necessária quando o organismo é altamente heterozigoto, cruzado, híbrido ou poliploide. Esta estratégia pode ajudar a preservar a estrutura específica de alelos ou subgenomas quando suportada por dados.
Se o seu objetivo é o pan-genoma, SV ou genómica populacional.
Se a montagem apoiar a construção de pan-genomas, análise de variação estrutural ou genómica populacional, ajudamos a planear a montagem e os resultados subsequentes em conjunto. O objetivo é evitar construir uma montagem que pareça aceitável no papel, mas que não seja adequada para o próximo passo de análise.
Referências
- Benchmarking de ferramentas Hi-C para a construção de scaffolds de genomas de plantas obtidos a partir de leituras PacBio HiFi e ONT
- Montagem telómero-a-telómero de cromossomas diploides com Verkko
- Montagem escalável de telómero a telómero para genomas diploides e poliploides com gráfico duplo
- Comparação de montagem em escala de cromossoma do Genoma de Referência Coreano KOREF a partir do PromethION e PacBio com informações de mapeamento Hi-C.
- Benchmarking de ferramentas Hi-C para estruturação de genomas de plantas obtidos a partir de leituras PacBio HiFi e ONT — registo PMC
Conformidade / Isenção de responsabilidade
A CD Genomics fornece este serviço apenas para Uso em Investigação (RUO). Este serviço não se destina a diagnóstico clínico, interpretação médica direta, gestão de pacientes, orientação de tratamento, testes diretos ao consumidor ou reivindicações de descoberta garantidas.
Resultados da Demonstração
Os resultados da demonstração ajudam a sua equipa a entender o que um projeto de montagem pode entregar. Estes exemplos mostram tipos de resultados, não conclusões biológicas fixas.

Resumo da continuidade da montagem e da estruturação dos cromossomas
Esta saída pode mostrar estatísticas de contigs, estatísticas de andaimes, visualizações de andaimes em escala de cromossoma e um resumo do mapa de contactos Hi-C quando a montagem Hi-C está incluída.

Painel de revisão de BUSCO, QV e contaminação
Esta saída resume a completude da montagem, a qualidade do consenso e a revisão da contaminação de forma compacta.

Visualização de anotações e saída pronta para downstream
Esta saída pode mostrar resumos de anotação de genes, faixas de anotação de repetições, saídas de famílias de genes e ficheiros preparados para análise comparativa ou a nível populacional.
Perguntas Frequentes
1. O que é uma Solução de Estratégia de Montagem de Genoma?
É uma abordagem de serviço focada na investigação que o ajuda a escolher e executar o plano de montagem do genoma adequado com base na sua espécie, qualidade da amostra, complexidade do genoma, nível de montagem e objetivos subsequentes.
2. Como posso saber qual o nível de montagem que o meu projeto necessita?
O nível adequado depende da questão de pesquisa. A descoberta inicial de genes pode necessitar de uma montagem em rascunho ou a nível de contig, enquanto o mapeamento de características, a sintecnia e a pesquisa de melhoramento muitas vezes beneficiam de uma montagem a nível de cromossoma. Estratégias resolvidas por haplótipos ou semelhantes a T2T podem ser consideradas para genomas complexos ou regiões ricas em repetições.
3. Quando é que a montagem do rascunho é suficiente?
A montagem preliminar pode ser suficiente para genomas compactos, desenvolvimento inicial de referências, descoberta preliminar de genes ou projetos onde a posição em escala de cromossoma não é central. Pode não ser suficiente para ligação, variação estrutural, evolução cromossómica ou trabalho de pan-genoma.
4. Quando devo escolher a montagem a nível de cromossoma?
A montagem a nível de cromossoma é útil quando a posição genómica, a estrutura de longo alcance, o mapeamento de traços, a sintecnia ou a genómica comparativa são importantes. Métodos de scaffolding como o Hi-C ou relacionados podem ser utilizados para apoiar este nível.
5. Quando é que a montagem resolvida por haplótipos é importante?
A montagem resolvida por haplótipos pode ser importante para organismos heterozigóticos, não consanguíneos, híbridos ou poliploides. Ajuda a preservar informações específicas de alelos ou haplótipos quando os dados e o design do projeto o suportam.
6. Quando é que a montagem semelhante ao T2T vale a pena considerar?
Uma estratégia semelhante ao T2T pode valer a pena considerar quando os centrómeros, telómeros, grandes repetições, lacunas não resolvidas ou a qualidade de referência do genoma de alta qualidade são centrais para a questão de pesquisa. É mais exigente e deve ser planeada com cuidado.
7. Como é que o PacBio e o Nanopore diferem na montagem de genomas?
As leituras HiFi da PacBio são frequentemente valorizadas pela montagem de leituras longas com alta precisão. As leituras longas ou ultra-longas da Nanopore podem ser úteis para abranger repetições longas e regiões complexas. Muitos projetos beneficiam-se da escolha de uma ou da combinação de tecnologias com base no genoma e no objetivo da pesquisa.
8. Por que é que o Hi-C é útil para a montagem a nível de cromossoma?
Hi-C fornece informações de contacto de longo alcance que podem ajudar a ordenar e orientar contigs em andaimes a escala de cromossoma. É especialmente útil quando a análise subsequente depende da estrutura a nível de cromossoma.
9. Por que não devo confiar apenas no N50?
N50 descreve a continuidade, mas não mede completamente a completude, precisão, contaminação, risco de montagem incorreta ou prontidão da anotação. Uma revisão de QC robusta deve combinar múltiplas métricas.
10. Que informações de amostra são necessárias antes de recomendar uma estratégia?
Informação útil inclui espécies, estimativa do tamanho do genoma, ploidia, tipo de amostra, método de preservação, qualidade do DNA, heterozigosidade esperada, genomas de referência relacionados, dados de sequenciação existentes e objetivos de investigação subsequentes.
11. Podem os dados de sequenciação existentes ou as montagens preliminares ser melhorados?
Sim. Dados existentes ou montagens em rascunho podem apoiar o polimento, a estruturação, a remontagem, a anotação, a revisão de contaminação ou a análise posterior quando a qualidade dos dados for adequada.
12. Que entregáveis posso esperar de um projeto de montagem de genoma?
Os entregáveis podem incluir arquivos FASTA de montagem, resumos de QC, estatísticas N50, relatórios BUSCO, estimativas de QV, revisão de contaminação, arquivos de anotação, anotação de repetições, saídas de scaffolding Hi-C, arquivos prontos para visualização em navegador genómico e relatórios de projeto.
13. Os resultados da montagem do genoma podem apoiar a anotação, o pan-genoma, as variações estruturais (SV) ou a genómica populacional?
Sim. Quando planeada corretamente, a montagem do genoma pode apoiar a anotação, a genómica comparativa, a análise do pan-genoma, a análise de variações estruturais e a genómica populacional. Estas necessidades posteriores devem ser consideradas antes de o plano de montagem ser finalizado.
14. Este serviço destina-se a uso clínico ou diagnóstico?
Não. Este serviço é projetado apenas para projetos de montagem de genoma e bioinformática com foco em pesquisa.
Caso de Literatura: A Estruturação Hi-C Altera a Forma como as Montagens Genómicas São Avaliadas
Destaque de Pesquisa Publicada
Diário: Fronteiras em Bioinformática
Publicado: 2024
Fundo
A montagem do genoma a nível de cromossoma muitas vezes requer mais do que a geração de contigs. As leituras Hi-C podem ajudar a ordenar e orientar grandes regiões genómicas em andaimes, tornando-as úteis para projetos que necessitam de uma estrutura a escala de cromossoma.
Métodos
O estudo gerou duas montagens de de novo de Arabidopsis thaliana a partir dos mesmos dados de PacBio HiFi e Oxford Nanopore. Em seguida, as montagens foram organizadas utilizando 3D-DNA, SALSA2 e YaHS.
As montagens suportadas foram avaliadas utilizando contiguidade, completude, precisão e correção estrutural. Este design é relevante porque compara não apenas tipos de dados de sequenciação, mas também a montagem posterior e a interpretação da qualidade.
Resultados
- O estudo relatou que as ferramentas de scaffolding Hi-C apresentaram diferentes características de desempenho nas montagens avaliadas.
- O YaHS teve o melhor desempenho nessa análise.
- A lição mais ampla é importante para o planeamento de projetos: a qualidade da montagem a nível de cromossoma depende não apenas da plataforma de sequenciação, mas também do método de scaffolding, da revisão de QC e da correção estrutural.
Um benchmark de andaimes Hi-C ilustra porque a montagem do genoma a nível de cromossoma deve ser avaliada pela continuidade, completude, precisão e correção estrutural, em vez de apenas uma métrica.
Conclusão
Este caso apoia a ideia central por trás da nossa Solução de Estratégia de Montagem do Genoma. O planeamento da montagem do genoma não deve parar na escolha entre PacBio, Nanopore ou Hi-C. Uma estratégia sólida também considera o nível de montagem, o método de escoramento, métricas de QC, anotação e usabilidade posterior.
