Bioinformática para WGS de Baixa Profundidade: Implementação de cn.mops e Pipelines

A sequenciação de genoma completo de baixo custo (low-pass WGS) é atraente para o perfilamento de número de cópias porque troca profundidade por amplitude. Mas para um arquiteto de pipeline de bioinformática, "CNV de baixo custo" não é um único método—é um conjunto de decisões sobre agrupamento, correção de viés, segmentação/chamadae padronização de entregáveis.

Este recurso é escrito para projetos RUO onde os seus objetivos são tipicamente:

  • Sinal de profundidade de leitura estável com baixa cobertura
  • Falsos positivos controlados (especialmente "sobre-segmentação")
  • Compatibilidade de pipeline com ferramentas internas existentes (entradas/saídas, compilações de referência, reprodutibilidade)

Ao longo do texto, o cn.mops é utilizado como um exemplo concreto, mas a maior parte das orientações é independente do chamador e aplica-se de forma ampla a pipelines de CNV com profundidade de leitura.

Blueprint de Pipeline (RUO) — o que irá construir e o que irá receber
Um pipeline CNV de baixa passagem robusto pode ser implementado como um modelo determinístico: FASTQ → BAM/CRAM alinhado → contagens agrupadas → sinal normalizado → segmentação/chamadas → entregáveis padronizadosA "definição de pronto" não é apenas uma lista de segmentos; é um pacote reproduzível: (1) um tabela de segmentos (BED/TSV) mais uma tabela de anotação de genes opcional, (2) um auditável Relatório de QC (leitura humana + leitura de máquina), e (3) um executar manifesto capturar referência de construção, máscaras/listas negras chamáveis, parâmetros de binagem, versões de chamadores e hashes de parâmetros. Este modelo torna a reanálise interna e a integração do pipeline previsíveis—mesmo quando a cobertura é baixa e a variância é alta.

1. Por Que a Chamada de CNV de Baixa Frequência é Difícil (e Como os Pipelines a Resolvem)

1.1 Baixa profundidade → alta variância: como o ruído se apresenta no espaço de profundidade de leitura

A CNV de profundidade de leitura baseia-se numa ideia simples: se uma região genómica tiver menos leituras do que o esperado, pode ser uma deleção; se tiver mais, pode ser uma duplicação. O WGS de baixa cobertura quebra a parte "esperada".

Com baixa cobertura, o seu sinal é dominado por contar ruído e variância amostral:

  • Caixas esparsasmuitos bins têm leituras perto de zero, o que infla a variância e desestabiliza a segmentação.
  • Frequência de outliers: bins extremos baixos/altos tornam-se comuns o suficiente para criar pontos de interrupção espúrios, a menos que os filtre explicitamente.
  • Risco de cauda na segmentaçãoOs algoritmos podem "explicar o ruído" criando muitos segmentos pequenos (sobre-segmentação), que parecem detalhados, mas muitas vezes resultam em um fardo de falsos positivos.

Conclusão operacional: em regimes de passa-baixa, a segmentação é não um passo final—é um consumidor de uma pista estabilizada e corrigida de viés.

1.2 Fontes de viés: GC, mapeabilidade, repetições, efeitos de lote

Mesmo com amostragem perfeita, efeitos sistemáticos muitas vezes dominam o CNV de passa-baixa:

  • viés de GCA cobertura depende do conteúdo de GC (química da biblioteca, amplificação, sequenciação). O viés residual de GC muitas vezes aparece como "ondulação" em todo o genoma.
  • MapeabilidadeAlinhamentos ambíguos em regiões de baixa complexidade criam contagens inconsistentes e sinais falsos.
  • Repetições/duplicações segmentaresOs bins ricos em repetições têm alta variância e podem gerar pontos de ruptura artefatuais.
  • Efeitos de loteMudanças no método de biblioteca, fluxo de células/lados, comprimento de leitura, versão do alinhador ou construção de referência podem alterar os perfis de cobertura.

Noise Sources Map (Library → Alignment → Binning → Segmentation)Figura 1. Mapa de Fontes de Ruído (Biblioteca → Alinhamento → Agrupamento → Segmentação).
O que procurar: Curvatura impulsionada por GC, riscas de baixa mapeabilidade, picos associados a repetições e deslocamentos entre amostras consistentes com lote.
Onde consertar: aplicar correção de GC, aplicar um máscara de mapeabilidade, excluir regiões com problemas conhecidos através de um lista negra/máscara chamávele manter modelagem homogénea em lote para chamadores de múltiplas amostras (por exemplo, cn.mops).
Como usar: inspecione estes sinais antes da segmentação— a maioria das "CNVs misteriosas" a baixa profundidade são evitáveis a montante.

1.3 Objetivos do pipeline: estabilizar o sinal, controlar falsos positivos, padronizar entregáveis

Um pipeline CNV de baixa passagem robusto deve ser projetado em torno de três objetivos:

  1. Estabilização de sinal
    Tornar a cobertura por bin comparável em todo o genoma (correção de GC, filtragem de mapeabilidade, tratamento de outliers).
  2. Controlo de falsos positivos
    Previna a sobre-segmentação escolhendo tamanhos de bin e restrições de segmentação que reflitam uma resolução realista.
  3. Entregas padronizadas
    Assegure que as equipas a montante possam reexecutar ou integrar resultados: os formatos de ficheiro, metadados de referência, parâmetros e QC devem ser explícitos.

Nota de contexto do ensaio (RUO): a sequenciação genómica de baixo alcance é uma opção numa caixa de ferramentas RUO mais ampla. Dependendo das limitações do projeto, as equipas podem também avaliar alternativas como Sequenciação do Exoma Completo para questões restritas ao exoma ou abordagens direcionadas como Sequenciação de Região Alvo quando o objetivo é a interrogação focada em vez do perfil genómico abrangente.

2. Blocos Centrais do Pipeline (Orientado para a Implementação)

2.1 Requisitos de entrada: FASTQ → BAM/CRAM alinhado (quais QC são obrigatórios)

Entradas mínimas

  • FASTQ de extremidades pareadas (recomendado) ou FASTQ de extremidade única
  • Folha de amostra/metadados (método de biblioteca, comprimento de leitura, plataforma, identificadores de lane/lote)
  • Construção de referência alvo e os recursos da região chamável nos quais você padroniza.

Saídas de alinhamento (base de compatibilidade)

  • BAM ou CRAM mais índice (BAI/CSI para BAM; CRAI para CRAM)
  • Resumo de QC de alinhamento (por amostra + agregações de lote)

Verificações de QC obrigatórias (portões de engenharia, não "opcionais")

  • Leituras mapeadas / leituras utilizáveisgarantir que os bins não sejam dominados por zeros após a filtragem
  • Taxa de duplicação: duplicados aumentam a variância sem adicionar informação em baixa frequência
  • Taxa de mapeamentomapeamento baixo muitas vezes correlaciona-se com artefatos impulsionados por repetições e segmentos espúrios
  • Inserir distribuição de tamanhosA multimodalidade inesperada pode estar associada a viés de GC e cobertura desigual.
  • Adaptador/ajuste de qualidade: melhora a consistência do mapeamento e reduz a dispersão a nível de bin

Se precisar de artefatos de alinhamento upstream padronizados (BAM/CRAM + QC) para fluxos de trabalho RUO, Sequenciação do Genoma Completo CD Genomics e Sequenciação de Nova Geração os serviços podem ser utilizados como entradas consistentes.

2.2 Estratégia de agrupamento: compromissos de tamanho do agrupamento (resolução vs estabilidade)

A binagem converte leituras alinhadas em um vetor de contagem ao longo do genoma. O tamanho do seu bin define:

  • o menor evento que pode ser detetado de forma fiável (resolução prática)
  • a variância que a segmentação deve tolerar (estabilidade)

Bin Size Tradeoff Chart (Resolution vs Stability)Figura 2. Gráfico de Compromisso do Tamanho do Bin (Resolução vs Estabilidade).
Esta figura ilustra três regimes de contentores práticos e os seus objetivos pretendidos: (i) contentores maiores para cromossómico/amplo eventos (estabilidade-primeiro), (ii) caixas de tamanho médio para multi-megabase eventos (equilibrados), e (iii) caixas menores para anotação focal (geralmente viável apenas como anotação de segmentos, não verdadeira resolução ao nível do gene, a baixa profundidade.

Estrutura de decisão: escolha de um tamanho de bin inicial (lista de verificação prática)
Validar o tamanho do bin com mensurável propriedades em vez de intuição:

  • Leituras medianas por bin (após filtragem)evitar regimes onde muitos contentores estão perto de zero
  • Dispensão a nível de binO CV/MAD robusto da pista normalizada deve diminuir à medida que o número de bins aumenta.
  • Carga de segmentodemasiados segmentos geralmente significa que os bins são demasiado pequenos ou normalização subcorreta
  • Fração chamávela mascaramento agressivo pode reduzir a cobertura efetiva e forçar binários maiores

Matriz Rápida de Tamanho de Bin (inicial, ajustar por projeto)

Objetivo Escala de eventos típica O que pode quebrar Sinal QC a observar
Cromossómico amplo ondulação / deslocamentos de lote resíduo GC, carga de segmento
Multi-Mb subcromossómico sobre-segmentação carga de segmento, fração chamável
Anotação focal proximal ao gene bins quase nulos / contagens esparsas dispersão, fração resgatável

Como usar esta matrizescolha um regime de bin inicial, depois execute o ciclo de afinação em 3.2 e ajuste o tamanho do bin e as restrições de segmentação até que os portões de QC se estabilizem.

Requisito de link interno:
Para uma explicação mais profunda de limites de resolução de CNV a nível de gene vs cromossómico, leia este guia de resolução.

2.3 Normalização: correção de GC, filtragem de mapeabilidade, tratamento de outliers

A normalização é onde a maioria dos pipelines de passagem baixa tem sucesso ou falha.

Correção de GC

  • Objetivo: remover a dependência da cobertura em relação ao GC sem sobreajustar.
  • Validação: plotar sinal normalizado vs GC; a tendência residual deve ser mínima e estável entre lotes.

Filtragem de mapeabilidade

  • Impor uma máscara chamável consistente e relatar a fração chamável.
  • Os bins de baixa mapeabilidade são uma fonte repetível de falsos positivos em várias ferramentas.

Tratamento de outliers (focado no operador)
Os outliers vêm de repetições, ambiguidade de mapeamento ou peculiaridades de montagem. Trate-os como objetos de primeira classe:

  • listas negras fixas (regiões problemáticas conhecidas)
  • bins de outliers adaptativos (bins extremos ao longo de um lote)
  • suavização conservadora (apenas se validada; a suavização excessiva oculta pontos de ruptura)

Estratégia de lote
Para métodos de múltiplas amostras, a homogeneidade do lote é um "requisito obrigatório", não uma preferência:

  • evitar misturar métodos de biblioteca, comprimentos de leitura ou construções de referência em um único lote de modelagem
  • se os lotes tiverem de ser combinados, combine-os depois normalização com separação clara de metadados

(Nota não vinculada por Lista de Alterações: A padronização dos parâmetros de sequenciação a montante entre projetos reduz a variância de lote.)

2.4 Chamadas/segmentação: conceito e resultados do cn.mops

cn.mops modela contagens de leitura usando um mistura de componentes de Poisson representando estados de número de cópias discretas, e estima o ruído para reduzir falsos positivos. Tende a comportar-se bem quando:

  • tens múltiplas amostras tecnicamente comparáveis
  • a heterogeneidade do lote é controlada (ou segmentada em grupos de modelagem homogéneos)

Saídas que deve padronizar independentemente do chamador.

  • tabela de segmentos (BED/TSV) com campos de reprodutibilidade (ver Secção 4)
  • sinal normalizado por bin (pelo menos para QC/rastreabilidade)
  • Gráficos de QC (distribuição de cobertura, resíduo de GC, carga de segmentos)

Referência: Klambauer et al., cn.MOPS (NAR 2012). DOI: https://doi.org/10.1093/nar/gks003

3. cn.mops Notas Práticas (O que os Arquitetos se Importam)

3.1 Por que o cn.mops funciona bem para múltiplas amostras (ideia da mistura de Poissons—nível elevado)

Os arquitetos de pipeline geralmente se preocupam com uma questão: o modelo reduz falsos positivos sem ocultar sinais reais?

O cn.mops é útil em configurações de múltiplas amostras porque:

  • contagens por bin de modelos entre amostras, separando padrões técnicos consistentes de desvios específicos de amostra
  • fornece saídas conscientes do ruído que suportam filtragem fundamentada além de "isto parece demasiado segmentado"

A baixas profundidades, isso é importante porque a segmentação pura em rastreios log2 ruidosos pode resultar num conjunto de chamadas de alto encargo.

3.2 Parâmetros chave a ajustar (janela/bin, segmento mínimo, design de lote de amostra)

Trate o ajuste como um ciclo de engenharia, não como uma decisão única.

Um loop de afinação prático (recomendado)

  1. Escolha 2–3 candidatos. regimes binários alinhado com o Matriz Rápida de Tamanho de Bin (Seção 2.2).
  2. Para cada regime, execute a normalização + cn.mops e produza o mesmo relatório de QC.
  3. Portão utilizando métricas objetivas:
    • dispersão a nível de bin
    • Proxy de resíduos GC / ondulação
    • fração chamável
    • distribuição da carga do segmento
  4. Bloquear parâmetros e versioná-los com um manifesto (Secção 4.3).

Botões que mais importam

  • Tamanho da bin/janela (estabilidade vs resolução)
  • Comprimento mínimo do segmento / número mínimo de bins por segmento (agente principal contra a sobre-segmentação)
  • Modelagem de design de lotes (somente misturar amostras tecnicamente comparáveis)

Se a sua arquitetura interna preferir a transferência plug-and-play (BAM/CRAM para dentro → segmentos padronizados/QC para fora) enquanto mantém as saídas reexecutáveis, um único e bem definido Serviços de Bioinformática o limite do fluxo de trabalho pode reduzir a fricção de integração.

3.3 Métricas de QC a reportar (variância, uniformidade de cobertura, confiança do segmento)

Um pipeline de CNV de passagem baixa deve emitir QC que suporte decisões de "aceitar / re-executar / quarentena".

Métricas de QC recomendadas (por amostra + resumos de lote)

  • leituras mapeadas / leituras utilizáveis (pós-filtragem)
  • taxa de duplicados (e se os duplicados foram assinalados/removidos)
  • fração chamável (filtragem de máscara pós/blacklist/outlier)
  • dispersão a nível de bin (CV/MAD robusto em sinal normalizado)
  • residual de GC (correlação/declive do sinal normalizado vs GC)
  • proxy de ondulação (amplitude da tendência de baixa frequência / autocorrelação)
  • carga de segmentos (distribuição de contagem + comprimento)
  • verificações de sanidade de eventos (por exemplo, fração do genoma em estados alterados; frações extremas muitas vezes indicam artefatos)

Tabela de Limiares de Início de QC (específica da plataforma; use marcadores de posição até que a QA do projeto defina os limites)
Nota inicial: os limiares dependem do método da biblioteca, do comprimento da leitura, da construção de referência e da estratégia de mascaramento.

Portão de QC Por que é importante para o CNV de passa-baixa Se falhar Reparação típica
Leituras mapeadas utilizáveis previne que os bins quase nulos dominem contagens esparsas → segmentos instáveis aumentar leituras ou aumentar o tamanho do bin
Taxa de duplicação os duplicados inflacionam a variância falsos pontos de interrupção / pista ruidosa rever preparação da biblioteca; marcar/remover duplicados; ajustar a delimitação
Fração chamável cobertura eficaz após as máscaras perda de sinal; bins grandes forçados refinar máscara/lista negra; rever recursos de referência/mapeabilidade
Dispersão ao nível do bin (CV/MAD robusto) indicador direto da estabilidade do sinal sobre-segmentação aumentar o tamanho do bin; fortalecer a filtragem de outliers; divisão em lotes
residual GC (inclinação/correlação) prevê artefactos de ondulação grandes ganhos/perdas falsas rever a correção GC; estratégia de normalização em lote
Carga de segmento (contagem / fração do genoma) proxy para falsos positivos conjunto de chamadas ruidosas aumentar o comprimento mínimo do segmento; ajustar o chamador; aumentar o tamanho do bin

QC Dashboard Mock (Coverage, GC bias, Segment count, Log2 ratio)Figura 3. Mock do Painel de QC (Cobertura, Viés de GC, Contagem de segmentos, Razão Log2).
Este painel de QC alinha-se diretamente com os portões acima: cobertura (distribuição de profundidade e bins de outliers), viés de GC (tendência residual e ondulação), carga de segmento (contagem/forma da distribuição), e razão log2 em todo o genoma (segmentos destacados para revisão de verificação). Utilize-o como uma instantânea de QA pré-lançamento: se o resíduo de GC ou a carga do segmento estiver instável, ajuste o regime de bin e as restrições de segmentação antes de exportar os entregáveis.

4. Entregáveis e Compatibilidade (Para Reanálise Interna)

4.1 Saídas padrão: segmentos (BED/TSV), tabela a nível de gene, relatório de QC

Segmentos (análise + visualização)

  • TSV/CSV para análise, BED para navegadores
  • Colunas recomendadas:
    • id_amostra
    • chr, início, fim
    • num_bins, comprimento_bp
    • log2_razo (ou medida normalizada equivalente)
    • chamada_discreta (perda/neutro/ganho)
    • métrica_de_confiança_ou_ruído (se disponível)
    • versão_do_pipeline e hash_do_parâmetro

Tabela de resumo a nível de gene (anotação, não "resolução verdadeira de gene")

  • derivado da interseção de segmentos com anotações genéticas
  • deve declarar explicitamente que é anotação de sinal a nível de segmento
  • incluir fração de sobreposição e IDs de segmento para rastreabilidade

Relatório de QC

  • legível por humanos (PDF/HTML) + legível por máquina (JSON)
  • incluir bandeiras de passagem/aviso/falha por métrica e os limiares de bloqueio utilizados

4.2 Entregáveis brutos necessários: BAM/CRAM alinhado + índice, metadados de referência

Mínimo necessário para reanálise interna determinística:

  • BAM/CRAM + índice
  • identificador de construção de referência + somas de verificação fasta sempre que possível
  • nome/version do alinhador + comando/configuração
  • máscara chamável / versão de lista negra
  • parâmetros de agrupamento (tamanho do agrupamento, definição de limites do agrupamento, filtros)
  • versão cn.mops + parâmetros chave
  • tabela de segmentos + relatório de QC

Para uma lista de verificação de embalagem de entradas e metadados para suportar a reanálise determinística de RUO, consulte a Diretrizes para Submissão de Amostras.

4.3 Reproduzibilidade: versionamento (construção de referência, versões do chamador, parâmetros)

O CNV de baixa passagem é sensível à reprodutibilidade porque pequenas alterações na normalização podem alterar a segmentação.

Prática recomendada:

  • emitir um manifest.json / run.yaml por lote contendo:
    • referências + somas de verificação
    • versões de ferramentas
    • parâmetros
    • hashes de parâmetros
  • armazenar artefatos intermédios:
    • matriz de contagem de bins (pré/pós normalização)
    • lista de binários filtrados / máscara chamável
    • pistas de entrada de segmentação

5. Guia de Resolução de Problemas

5.1 Segmentos em excesso (sobre-segmentação)

Sintomas

  • contagens de segmentos extremamente altas
  • muitos segmentos pequenos com pequenas mudanças em log2
  • chamadas inconsistentes em amostras semelhantes

Causas prováveis

  • bins demasiado pequenos para o regime de profundidade
  • filtragem insuficiente de outliers
  • viés residual de GC / ondulação
  • heterogeneidade de lote (biblioteca/plataforma/referência mista)

Cheques

  • distribuição do número de segmentos entre amostras (específico do lote?)
  • fração de bins perto de zero leituras após filtragem
  • Estabilidade do gráfico residual GC
  • dispersão a nível de bin entre amostras

Correções

  • aumentar o tamanho do bin e/ou o comprimento mínimo do segmento
  • apertar a filtragem de bins de outliers e máscaras chamáveis
  • dividir lotes heterogéneos e reexecutar
  • rever referências e recursos de mapeamento

5.2 Ondulação do genoma completo (viés de GC / lote)

Sintomas

  • oscilação de baixa frequência entre cromossomos
  • rastreamento de ganhos/perdas amplos falsos GC em vez de sinal estável
  • assinatura de ondulação partilhada dentro de um lote

Cheques

  • sinal normalizado vs GC (tendência residual deve ser mínima)
  • proxy de ondulação por lote
  • construção de referência e consistência de máscara/lista negra

Correções

  • rever a estratégia de correção do GC (evitar subajustamento/sobreajustamento)
  • impor processamento/modelagem homogénea em lotes
  • evitar misturar comprimentos de leitura e quimicas de biblioteca dentro de um lote de modelagem cn.mops

Para o planeamento de projetos e seleção de ensaios em ambientes RUO (por exemplo, capacidade, custo, resolução esperada), veja isto. comparação de ensaios de CNV escaláveis.definições

5.3 Regiões chamáveis pobres (genomas ricos em repetições)

Sintomas

  • grandes frações de contentores filtrados
  • chamadas de cluster em regiões de baixa mapeabilidade
  • os resultados variam amplamente entre as ferramentas

Cheques

  • fração chamável por cromossoma
  • sobreposição de segmentos chamados com faixas de baixa mapeabilidade
  • comparar chamadas antes/depois da máscara

Correções

  • ajustar máscaras/listas negras chamáveis ao genoma de referência
  • mude os objetivos para tamanhos de eventos maiores se a cobertura efetiva for demasiado baixa
  • valide que os recursos de referência (faixas de mapeabilidade, listas negras) correspondem à construção

contexto do ensaio RUO: quando as restrições de um projeto favorecem leituras baseadas em array em vez de WGS de baixo custo, as equipas podem avaliar Microarray de SNP ou mais amplo Serviços de Microarranjos como entradas alternativas para pipelines de pesquisa focados em CNV.

Perguntas Frequentes

1) Preciso de controlos pareados para CNV de baixa passagem?

Nem sempre. Muitos fluxos de trabalho de leitura em profundidade podem funcionar sem controlos correspondentes, mas é necessário compensar com uma correção de viés mais forte, restrições de segmentação mais conservadoras e portas de controlo de qualidade mais rigorosas.

2) Quais entregáveis devo exigir para que a minha equipa possa executar tudo de forma determinística?

No mínimo: BAM/CRAM+índice, metadados da construção de referência, versão/configuração de alinhamento, máscaras/blacklists chamáveis, parâmetros de binagem, versão/parâmetros do chamador, tabela de segmentos, relatório de QC e um manifesto capturando hashes de parâmetros.

3) Como escolho o tamanho do intervalo sem adivinhar?

Use o Matriz Rápida de Tamanho de Bin (Seção 2.2) para selecionar um regime inicial, depois executar o ciclo de ajuste em 3.2 e porta sobre dispersão, resíduo de GC, fração chamável e carga de segmento.

4) Por que é que a contagem de segmentos explode mesmo após a correção do GC?

A correção GC não resolve artefatos de mapeabilidade/repetição ou heterogeneidade de lotes. A sobre-segmentação é geralmente um problema do sistema: bins demasiado pequenos + viés residual + bins atípicos + lotes heterogéneos.

5) O WGS de baixo passamento pode suportar chamadas de CNV a nível de gene?

Freqüentemente não de forma fiável. Trate tabelas a nível de gene como anotação de chamadas a nível de segmentoVeja o guia de resolução ligado acima.

6) Devo gerar VCF para CNVs?

O VCF pode ser útil para certos ecossistemas, mas muitos fluxos de trabalho de CNV são mais naturalmente representados como segmentos BED/TSV, além de um manifesto e JSON de QC. Escolha formatos que melhor correspondam às ferramentas a jusante e aos requisitos de reprodutibilidade.

7) Qual é a razão mais comum pela qual um pipeline de CNV de baixa passagem falha na revisão por um responsável de bioinformática?

Portas de QC subespecificadas e entregas incompletas. Se o pipeline não puder ser executado de forma determinística — ou se o QC não puder justificar a estabilidade — o risco de integração é elevado, mesmo que as chamadas pareçam plausíveis.

8) Onde posso padronizar os metadados e a embalagem das amostras para evitar fricções na transferência?

Utilize uma lista de verificação de embalagem única e exija os campos do manifesto descritos nas Secções 4.2–4.3. Se precisar de consistência adicional a montante, os pipelines RUO frequentemente combinam saídas de WGS de baixa passagem com uma camada de genotipagem complementar, como Genotipagem para desenhos de estudo específicos.

Referências

  1. Klambauer G, Schwarzbauer K, Mayr A, et al. cn.MOPS: Mistura de Poissons para Descobrir Variações no Número de Cópias em Dados de Sequenciação de Próxima Geração com uma Baixa Taxa de Descoberta Falsa. Pesquisa em Ácidos Nucleicos (2012). DOI: 10.1093/nar/gks003 — Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o aqui e ficarei feliz em ajudar com a tradução.
  2. Scheinin I, Sie D, Bengtsson H, et al. Análise do número de cópias de DNA de espécimes frescos e fixados em formalina através de sequenciação de genoma completo superficial com identificação e exclusão de regiões problemáticas na montagem do genoma. Pesquisa Genómica (2014). DOI: 10.1101/gr.175141.114 — Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça o conteúdo que deseja traduzir.
  3. Boeva V, Popova T, Bleakley K, et al. Control-FREEC: uma ferramenta para avaliar o número de cópias e o conteúdo alélico utilizando dados de sequenciação de próxima geração. Bioinformática (2012). DOI: 10.1093/bioinformatics/btr670 — Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o aqui e terei o prazer de ajudar com a tradução.
  4. Smolander J, Khan S, Singaravelu K, et al. Avaliação de ferramentas para identificar grandes variações no número de cópias a partir de dados de sequenciação do genoma completo com ultra-baixa cobertura. BMC Genómica (2021). DOI: 10.1186/s12864-021-07686-z — Desculpe, mas não posso acessar ou traduzir conteúdo de links externos. Se você puder fornecer o texto que deseja traduzir, ficarei feliz em ajudar!
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo