Do I need matched controls for low-pass CNV?

Not always. Many read-depth workflows can run without matched controls, but you must compensate with stronger bias correction and stricter QC gates.

What deliverables should I require?

At minimum: BAM/CRAM+index, reference metadata, alignment config, callable masks, binning parameters, caller version, segments table, and QC report.

Where can I standardize sample metadata and packaging?

RUO pipelines often pair low-pass WGS outputs with a complementary genotyping layer such as Genotyping for specific study designs.

Bioinformática para WGS de Baixa Cobertura: Implementação de cn.mops e Pipelines

O sequenciamento de genoma completo de baixa profundidade (low-pass WGS) é atraente para a perfuração de número de cópias porque troca profundidade por amplitude. Mas para um arquiteto de pipeline de bioinformática, "CNV de baixa profundidade" não é um único método—é um conjunto de decisões sobre agrupamento, correção de viés, segmentação/chamadae padronização de entregáveis.

Este recurso é escrito para projetos RUO onde os seus objetivos são tipicamente:

Sinal de profundidade de leitura estável com baixa cobertura
Falsos positivos controlados (especialmente "sobre-segmentação")
Compatibilidade de pipeline com ferramentas internas existentes (entradas/saídas, compilações de referência, reprodutibilidade)

Ao longo do texto, o cn.mops é utilizado como um exemplo concreto, mas a maior parte das orientações é independente do chamador e aplica-se amplamente a pipelines de CNV com profundidade de leitura.

Blueprint de Pipeline (RUO) — o que irá construir e o que irá receber
Um pipeline CNV de baixa passagem robusto pode ser implementado como um modelo determinístico: FASTQ → BAM/CRAM alinhado → contagens agrupadas → sinal normalizado → segmentação/chamadas → entregáveis padronizadosA "definição de pronto" não é apenas uma lista de segmentos; é um pacote reproduzível: (1) um tabela de segmentos (BED/TSV) mais uma tabela de anotação de genes opcional, (2) um audível Relatório de QC (leitura humana + leitura de máquina), e (3) um executar manifesto capturar a construção de referência, máscaras/listas negras chamáveis, parâmetros de binagem, versões do chamador e hashes de parâmetros. Este modelo torna a reanálise interna e a integração do pipeline previsíveis—mesmo quando a cobertura é baixa e a variância é alta.

1. Por Que a Chamada de CNV de Baixa Frequência é Difícil (e Como os Pipelines Resolvem Isso)

1.1 Baixa profundidade → alta variância: como o ruído se apresenta no espaço de profundidade de leitura

A CNV de profundidade de leitura baseia-se numa ideia simples: se uma região genómica tiver menos leituras do que o esperado, pode ser uma deleção; se tiver mais, pode ser uma duplicação. O WGS de baixa cobertura quebra a parte "esperada".

Com baixa cobertura, o seu sinal é dominado por contar ruído e variância amostral:

Caixas esparsasmuitos bins têm leituras perto de zero, o que infla a variância e desestabiliza a segmentação.
Frequência de outliers: bins extremos baixos/altos tornam-se comuns o suficiente para criar pontos de ruptura espúrios, a menos que os filtre explicitamente.
Risco de cauda na segmentaçãoOs algoritmos podem "explicar o ruído" criando muitos pequenos segmentos (sobressegmentação), que parecem detalhados, mas muitas vezes representam uma carga de falsos positivos.

Conclusão operacional: em regimes de passa-baixa, a segmentação é não um passo final—é um consumidor de uma faixa estabilizada e corrigida de viés.

1.2 Fontes de viés: GC, mapeabilidade, repetições, efeitos de lote

Mesmo com amostragem perfeita, os efeitos sistemáticos muitas vezes dominam o CNV de baixa passagem:

viés de GCA cobertura depende do conteúdo de GC (química da biblioteca, amplificação, sequenciação). O viés residual de GC frequentemente aparece como "ondulação" em todo o genoma.
MapeabilidadeAlinhamentos ambíguos em regiões de baixa complexidade criam contagens inconsistentes e sinais falsos.
Repetições/duplicações segmentaresOs bins ricos em repetições têm alta variância e podem gerar pontos de interrupção artefatuais.
Efeitos de loteMudanças no método da biblioteca, fluxo de células/lados, comprimento de leitura, versão do alinhador ou construção de referência podem alterar os perfis de cobertura.

Noise Sources Map (Library → Alignment → Binning → Segmentation) Figura 1. Mapa de Fontes de Ruído (Biblioteca → Alinhamento → Agrupamento → Segmentação).
O que procurar: Curvatura impulsionada por GC, riscas de baixa mapeabilidade, picos associados a repetições e deslocamentos entre amostras consistentes com lote.
Onde consertar: aplicar correção de GC, impor uma máscara de mapeabilidade, exclua regiões com problemas conhecidos através de um lista negra/máscara chamávele manter modelagem homogénea em lote para chamadores de múltiplas amostras (por exemplo, cn.mops).
Como usar: inspecionar estes sinais antes da segmentação— a maioria das "CNVs misteriosas" a baixa profundidade são evitáveis a montante.

1.3 Objetivos do pipeline: estabilizar o sinal, controlar falsos positivos, padronizar entregáveis.

Um pipeline CNV de baixa passagem robusto deve ser projetado em torno de três objetivos:

Estabilização de sinal
Tornar a cobertura por bin comparável em todo o genoma (correção de GC, filtragem de mapeabilidade, tratamento de outliers).
Controlo de falsos positivos
Previna a sobre-segmentação escolhendo tamanhos de bin e restrições de segmentação que reflitam uma resolução realista.
Entregas padronizadas
Assegure que as equipas a montante possam reexecutar ou integrar resultados: os formatos de ficheiro, metadados de referência, parâmetros e QC devem ser explícitos.

Nota de contexto do ensaio (RUO): o WGS de baixa cobertura é uma opção numa caixa de ferramentas RUO mais ampla. Dependendo das limitações do projeto, as equipas podem também avaliar alternativas como Sequenciação do Exoma Completo para questões restritas ao exoma ou abordagens direcionadas como Sequenciação de Região Alvo quando o objetivo é a interrogatório focado em vez de um perfil genómico abrangente.

2. Blocos Centrais do Pipeline (Orientado para a Implementação)

2.1 Requisitos de entrada: FASTQ → BAM/CRAM alinhado (quais QC são obrigatórios)

Entradas mínimas

FASTQ de extremidades emparelhadas (recomendado) ou FASTQ de extremidade única
Folha de amostra/metadados (método de biblioteca, comprimento de leitura, plataforma, identificadores de lane/lote)
Construção de referência alvo e os recursos da região chamável que você padroniza.

Saídas de alinhamento (linha de base de compatibilidade)

BAM ou CRAM mais índice (BAI/CSI para BAM; CRAI para CRAM)
Resumo de QC de alinhamento (por amostra + agregações de lote)

Verificações de QC obrigatórias (portões de engenharia, não "opcionais")

Leituras mapeadas / leituras utilizáveisgarantir que os bins não sejam dominados por zeros após a filtragem
Taxa de duplicação: duplicados aumentam a variância sem adicionar informação em baixa frequência
Taxa de mapeamentomapeamento baixo muitas vezes correlaciona-se com artefatos impulsionados por repetições e segmentos espúrios
Inserir distribuição de tamanhosa multimodalidade inesperada pode acompanhar o viés de GC e a cobertura desigual
Adaptador/ajuste de qualidade: melhora a consistência do mapeamento e reduz a dispersão a nível de bin

Se precisar de artefatos de alinhamento upstream padronizados (BAM/CRAM + QC) para fluxos de trabalho RUO, Sequenciação do Genoma Completo CD Genomics e Sequenciação de Próxima Geração os serviços podem ser utilizados como entradas consistentes.

2.2 Estratégia de agrupamento: compromissos de tamanho do agrupamento (resolução vs estabilidade)

A binagem converte leituras alinhadas em um vetor de contagem ao longo do genoma. O tamanho do seu bin define:

o menor evento que pode ser detetado de forma fiável (resolução prática)
a variância que a segmentação deve tolerar (estabilidade)

Bin Size Tradeoff Chart (Resolution vs Stability) Figura 2. Gráfico de Compromisso do Tamanho do Bin (Resolução vs Estabilidade).
Esta figura ilustra três regimes de contentores práticos e os seus objetivos pretendidos: (i) caixas maiores para cromossómico/amplo eventos (estabilidade-primeiro), (ii) caixas de tamanho médio para multi-megabase eventos (equilibrados), e (iii) caixas menores para anotação focal (geralmente viável apenas como anotação de segmentos, não verdadeira resolução a nível de gene, a baixa profundidade.

Estrutura de decisão: escolha de um tamanho de bin inicial (lista de verificação prática)
Validar o tamanho do bin com mensurável propriedades em vez de intuição:

Leituras medianas por bin (após filtragem)evitar regimes onde muitos contentores estão perto de zero
Dispersão a nível de binO CV/MAD robusto da pista normalizada deve diminuir à medida que o número de bins aumenta.
Carga de segmentodemasiados segmentos geralmente significa que os bins são demasiado pequenos ou normalização subcorreta
Fração chamávela máscara agressiva pode reduzir a cobertura efetiva e forçar recipientes maiores

Matriz Rápida de Tamanho de Bin (inicial, ajustar por projeto)

Objetivo	Escala de eventos típica	O que pode quebrar	Sinal QC a observar
Cromossómico	amplo	ondulação / desvios de lote	resíduo de GC, carga de segmento
Multi-Mb	subcromossómico	sobre-segmentação	carga do segmento, fração chamável
Anotação focal	proximal ao gene	bins quase zero / contagens escassas	dispersão, fração resgatável

Como utilizar esta matrizescolha um regime de bin inicial, depois execute o ciclo de afinação em 3.2 e ajustar o tamanho do bin e as restrições de segmentação até que os portões de QC se estabilizem.

Requisito de link interno:
Para uma explicação mais profunda de limites de resolução de CNV a nível de gene vs cromossómico, leia este guia de resolução.

2.3 Normalização: correção de GC, filtragem de mapeabilidade, tratamento de outliers

A normalização é onde a maioria dos pipelines de passagem baixa tem sucesso ou falha.

correção de GC

Objetivo: remover a dependência da cobertura em relação ao GC sem sobreajustar.
Validação: plotar sinal normalizado vs GC; a tendência residual deve ser mínima e estável entre os lotes.

Filtragem de mapeabilidade

Impor uma máscara chamável consistente e relatar a fração chamável.
Os bins de baixa mapeabilidade são uma fonte repetível de falsos positivos em várias ferramentas.

Tratamento de outliers (focado no operador)
Os outliers vêm de repetições, ambiguidade de mapeamento ou peculiaridades de montagem. Trate-os como objetos de primeira classe:

listas negras fixas (regiões problemáticas conhecidas)
caixas de outliers adaptativas (caixas extremas em um lote)
suavização conservadora (apenas se validada; a suavização excessiva oculta pontos de quebra)

Estratégia de lote
Para métodos de múltiplas amostras, a homogeneidade do lote é um "requisito obrigatório", não uma preferência:

evitar misturar métodos de biblioteca, comprimentos de leitura ou construções de referência em um único lote de modelagem
se os lotes tiverem de ser combinados, combine-os depois normalização com separação clara de metadados

(Nota não vinculada por Lista de Alterações: A padronização dos parâmetros de sequenciação upstream entre projetos reduz a variância de lote.)

2.4 Chamadas/segmentação: conceito e resultados do cn.mops

cn.mops modela contagens de leitura usando um mistura de componentes de Poisson representando estados de número de cópias discretas, e estima o ruído para reduzir falsos positivos. Tende a comportar-se bem quando:

tens múltiplas amostras tecnicamente comparáveis
a heterogeneidade do lote é controlada (ou segmentada em grupos de modelagem homogéneos)

Saídas que deve padronizar independentemente do chamador.

tabela de segmentos (BED/TSV) com campos de reprodutibilidade (ver Secção 4)
sinal normalizado por bin (pelo menos para QC/rastreabilidade)
Gráficos de QC (distribuição de cobertura, resíduo de GC, carga de segmento)

Referência: Klambauer et al., cn.MOPS (NAR 2012). DOI: https://doi.org/10.1093/nar/gks003

3. cn.mops Notas Práticas (O que os Arquitetos se Importam)

3.1 Por que o cn.mops funciona bem para múltiplas amostras (ideia da mistura de Poissons—nível elevado)

Os arquitetos de pipeline geralmente se preocupam com uma questão: o modelo reduz falsos positivos sem ocultar sinais reais?

O cn.mops é útil em configurações de múltiplas amostras porque:

contagens por bin de modelos entre amostras, separando padrões técnicos consistentes de desvios específicos de amostra
fornece saídas sensíveis ao ruído que suportam filtragem fundamentada além de "isto parece demasiado segmentado"

A baixas profundidades, isso é importante porque a segmentação pura em pistas log2 ruidosas pode resultar num conjunto de chamadas de alta carga.

3.2 Parâmetros chave a ajustar (janela/bin, segmento mínimo, design do lote de amostras)

Trate a afinação como um ciclo de engenharia, não como uma decisão única.

Um loop de afinação prático (recomendado)

Escolha 2–3 candidatos. regimes binários alinhado com o Matriz Rápida de Tamanho de Bin (Seção 2.2).
Para cada regime, execute a normalização + cn.mops e produza o mesmo relatório de QC.
Portão usando métricas objetivas:
- dispersão a nível de bin
- proxy de resíduo GC / ondulação
- fração chamável
- distribuição da carga do segmento
Bloquear parâmetros e versioná-los com um manifesto (Secção 4.3).

Botões que mais importam

Tamanho do bin/janela (estabilidade vs resolução)
Comprimento mínimo do segmento / número mínimo de bins por segmento (agente principal contra a sobre-segmentação)
Modelagem de design em lote (somente misturar amostras tecnicamente comparáveis)

Se a sua arquitetura interna prefere uma transferência plug-and-play (BAM/CRAM para dentro → segmentos padronizados/QC para fora) enquanto mantém as saídas re-executáveis, um único e bem definido Serviços de Bioinformática A fronteira do fluxo de trabalho pode reduzir a fricção de integração.

3.3 Métricas de QC a relatar (variância, uniformidade de cobertura, confiança do segmento)

Um pipeline de CNV de passagem baixa deve emitir QC que suporte decisões de "aceitar / repetir / colocar em quarentena".

Métricas de QC recomendadas (por amostra + resumos de lote)

leituras mapeadas / leituras utilizáveis (após filtragem)
taxa de duplicados (e se os duplicados foram assinalados/removidos)
fração chamável (filtragem de máscara/posto/lista negra/outliers)
dispersão a nível de bin (CV/MAD robusto sobre sinal normalizado)
residual de GC (correlação/inclinação do sinal normalizado vs GC)
proxy de ondulação (amplitude de tendência de baixa frequência / autocorrelação)
carga de segmento (contagem + distribuição de comprimento)
verificações de sanidade do evento (por exemplo, fração do genoma em estados alterados; frações extremas frequentemente indicam artefacto)

Tabela de Limiares de Início de QC (específica da plataforma; use marcadores de posição até que a QA do projeto defina os limites)
Nota inicial: os limiares dependem do método da biblioteca, do comprimento da leitura, da construção de referência e da estratégia de mascaramento.

porta de QC	Por que é importante para o CNV de passa-baixa	Se falhar	Reparação típica
Leituras mapeadas utilizáveis	previne que os bins quase nulos dominem	contagens esparsas → segmentos instáveis	aumentar leituras ou aumentar o tamanho do bin
Taxa de duplicação	os duplicados inflacionam a variância	falsos pontos de interrupção / pista ruidosa	rever preparação da biblioteca; marcar/remover duplicados; ajustar a delimitação
Fração chamável	cobertura eficaz após máscaras	perda de sinal; bins grandes forçados	refinar máscara/lista negra; rever recursos de referência/mapeabilidade
Dispersão a nível de bin (CV/MAD robusto)	indicador direto da estabilidade do sinal	sobre-segmentação	aumentar o tamanho do bin; fortalecer a filtragem de outliers; dividir em lotes
residual GC (inclinação/correlação)	prevê artefatos de ondulação	grandes ganhos/perdas falsas	rever a correção GC; estratégia de normalização em lote
Carga de segmento (contagem / fração do genoma)	proxy para falsos positivos	conjunto de chamadas ruidosas	aumentar o comprimento mínimo do segmento; ajustar o chamador; aumentar o tamanho do bin

QC Dashboard Mock (Coverage, GC bias, Segment count, Log2 ratio) Figura 3. Mock do Painel QC (Cobertura, Viés de GC, Contagem de segmentos, Rácio Log2).
Este painel de QC alinha-se diretamente com os portões acima: cobertura (distribuição de profundidade e bins de outliers), viés de GC (tendência residual e ondulação), carga de segmento (contagem/forma da distribuição), e razão log2 em todo o genoma (segmentos destacados para revisão de verificação). Use-o como uma instantânea de QA pré-lançamento: se o resíduo de GC ou a carga do segmento estiver instável, ajuste o regime de bin e as restrições de segmentação antes de exportar os entregáveis.

4. Entregáveis e Compatibilidade (Para Reanálise Interna)

4.1 Saídas padrão: segmentos (BED/TSV), tabela a nível de genes, relatório de QC

Segmentos (análise + visualização)

TSV/CSV para análise, BED para navegadores
Colunas recomendadas:
- id_amostra
- chr, início, fim
- num_bins, comprimento_bp
- log2_rácio (ou medida normalizada equivalente)
- chamada_discreta (perda/neutro/ganho)
- métrica_de_confiança_ou_ruído (se disponível)
- versão_do_pipeline e hash_do_parametro

Tabela resumo a nível de gene (anotação, não "resolução verdadeira de gene")

derivado da interseção de segmentos com anotações genéticas
deve declarar explicitamente que é anotação de sinal a nível de segmento
incluir fração de sobreposição e IDs de segmento para rastreabilidade

Relatório de QC

legível por humanos (PDF/HTML) + legível por máquinas (JSON)
incluir bandeiras de passagem/aviso/falha por métrica e os limiares de bloqueio utilizados

4.2 Entregáveis brutos necessários: BAM/CRAM alinhado + índice, metadados de referência

Mínimo necessário para reanálise interna determinística:

BAM/CRAM + índice
identificador de construção de referência + somas de verificação fasta sempre que possível
nome/version do alinhador + comando/configuração
máscara chamável / versão de lista negra
parâmetros de binning (tamanho do bin, definição dos limites do bin, filtros)
versão cn.mops + parâmetros chave
tabela de segmentos + relatório de QC

Para uma lista de verificação de embalagem de entradas e metadados para apoiar a reanálise determinística de RUO, consulte a Diretrizes para Submissão de Amostras.

4.3 Reproduzibilidade: versionamento (construção de referência, versões do chamador, parâmetros)

O CNV de baixa frequência é sensível à reprodutibilidade porque pequenas alterações na normalização podem alterar a segmentação.

Prática recomendada:

emitir um manifest.json / run.yaml por lote contendo:
- referências + somas de verificação
- versões de ferramentas
- parâmetros
- hashes de parâmetros
armazenar artefatos intermédios:
- matriz de contagem de bins (pré/pós normalização)
- lista de bin filtrado / máscara chamável
- pistas de entrada de segmentação

5. Guia de Resolução de Problemas

5.1 Segmentos em excesso (sobre-segmentação)

Sintomas

contagens de segmentos extremamente elevadas
muitos segmentos pequenos com pequenas deslocações log2
chamadas inconsistentes em amostras semelhantes

Causas prováveis

bins demasiado pequenos para o regime de profundidade
filtragem insuficiente de outliers
viés residual de GC / ondulação
heterogeneidade de lote (biblioteca/plataforma/referência mista)

Cheques

distribuição da contagem de segmentos entre amostras (específica do lote?)
fração de bins perto de zero leituras pós-filtragem
Estabilidade do gráfico residual GC
dispersão a nível de bin entre amostras

Correções

aumentar o tamanho do bin e/ou o comprimento mínimo do segmento
apertar a filtragem de binários de outliers e máscaras chamáveis
dividir lotes heterogéneos e reexecutar
reverificar recursos de referência e mapeabilidade

5.2 Ondulação do genoma completo (viés de GC / lote)

Sintomas

oscilação de baixa frequência entre cromossomas
rastreamento amplo de ganhos/perdas falsos GC em vez de sinal estável
assinatura de ondulação partilhada dentro de um lote

Cheques

sinal normalizado vs GC (tendência residual deve ser mínima)
proxy de ondulação por lote
consistência de construção de referência e máscara/lista negra

Correções

rever a estratégia de correção do GC (evitar subajuste/sobreajuste)
implementar processamento/modelagem homogénea em lotes
evitar misturar comprimentos de leitura e quimicas de biblioteca dentro de um lote de modelagem cn.mops

Para o planeamento de projetos e seleção de ensaios em ambientes RUO (por exemplo, capacidade de processamento, custo, resolução esperada), veja isto. comparação de ensaios de CNV escaláveis.definições

5.3 Regiões chamáveis pobres (genomas ricos em repetições)

Sintomas

grandes frações de contentores filtrados
chamadas de cluster em regiões de baixa mapeabilidade
os resultados variam amplamente entre as ferramentas

Cheques

fração chamável por cromossoma
sobreposição de segmentos chamados com faixas de baixa mapeabilidade
comparar chamadas antes/depois da máscara

Correções

ajustar máscaras/listas negras chamáveis ao genoma de referência
mude os objetivos para tamanhos de eventos maiores se a cobertura eficaz for demasiado baixa
valide que os recursos de referência (pistas de mapeamento, listas negras) correspondem à versão construída

contexto do ensaio RUO: quando as restrições de um projeto favorecem leituras baseadas em array em vez de WGS de baixa cobertura, as equipas podem avaliar Microarray de SNP ou mais amplo Serviços de Microarray como entradas alternativas para pipelines de pesquisa focados em CNV.

Perguntas Frequentes

1) Preciso de controlos pareados para CNV de baixa frequência?

Nem sempre. Muitos fluxos de trabalho de leitura em profundidade podem funcionar sem controlos correspondentes, mas é necessário compensar com uma correção de viés mais forte, restrições de segmentação mais conservadoras e critérios de controlo de qualidade mais rigorosos.

2) Quais entregáveis devo exigir para que a minha equipa possa reexecutar tudo de forma determinística?

No mínimo: BAM/CRAM+índice, metadados da construção de referência, versão/configuração de alinhamento, máscaras/blacklists chamáveis, parâmetros de binagem, versão/parâmetros do chamador, tabela de segmentos, relatório de QC e um manifesto que capture os hashes dos parâmetros.

3) Como posso escolher o tamanho do intervalo sem adivinhar?

Use o Matriz Rápida de Tamanho de Bin (Seção 2.2) para selecionar um regime inicial, em seguida, executar o ciclo de ajuste em 3.2 e porta sobre dispersão, resíduo de GC, fração chamável e carga de segmento.

4) Por que é que a contagem de segmentos explode mesmo após a correção do GC?

A correção de GC não resolve os artefatos de mapeabilidade/repetição ou a heterogeneidade de lotes. A sobre-segmentação é geralmente um problema do sistema: bins demasiado pequenos + viés residual + bins atípicos + lotes heterogéneos.

5) O WGS de baixa passagem pode suportar chamadas de CNV a nível de gene?

Muitas vezes não de forma fiável. Trate tabelas a nível de genes como anotação de chamadas a nível de segmentoVeja o guia de resolução ligado acima.

6) Devo gerar VCF para CNVs?

VCF pode ser útil para certos ecossistemas, mas muitos fluxos de trabalho de CNV são mais naturalmente representados como segmentos BED/TSV, além de um manifesto e JSON de QC. Escolha formatos que melhor correspondam às ferramentas a montante e aos requisitos de reprodutibilidade.

7) Qual é a razão mais comum pela qual um pipeline de CNV de baixa passagem falha na revisão por um responsável de bioinformática?

Portas de QC subespecificadas e entregas incompletas. Se o pipeline não puder ser executado novamente de forma determinística — ou se o QC não puder justificar a estabilidade — o risco de integração é elevado, mesmo que as chamadas pareçam plausíveis.

8) Onde posso padronizar os metadados e a embalagem das amostras para evitar fricções na transferência?

Utilize uma lista de verificação de embalagem única e exija os campos do manifesto descritos nas Secções 4.2–4.3. Se precisar de consistência adicional a montante, os pipelines RUO frequentemente combinam saídas de WGS de baixa passagem com uma camada de genotipagem complementar, como Genotipagem para desenhos de estudo específicos.

Referências

Klambauer G, Schwarzbauer K, Mayr A, et al. cn.MOPS: Mistura de Poissons para Descobrir Variações no Número de Cópias em Dados de Sequenciação de Próxima Geração com uma Baixa Taxa de Descoberta Falsa. Pesquisa em Ácidos Nucleicos (2012). DOI: 10.1093/nar/gks003 — Desculpe, não posso acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei prazer em traduzir.
Scheinin I, Sie D, Bengtsson H, et al. Análise do número de cópias de DNA de espécimes frescos e fixados em formalina através de sequenciação genómica total superficial, com identificação e exclusão de regiões problemáticas na montagem do genoma. Pesquisa Genómica (2014). DOI: 10.1101/gr.175141.114 — Desculpe, mas não consigo acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e terei o prazer de ajudar na tradução.
Boeva V, Popova T, Bleakley K, et al. Control-FREEC: uma ferramenta para avaliar o número de cópias e o conteúdo alélico utilizando dados de sequenciação de nova geração. Bioinformática (2012). DOI: 10.1093/bioinformatics/btr670 — Desculpe, não consigo acessar links ou conteúdos externos. Se precisar de ajuda com um texto específico, por favor, forneça-o e ficarei feliz em traduzir.
Smolander J, Khan S, Singaravelu K, et al. Avaliação de ferramentas para identificar grandes variações no número de cópias a partir de dados de sequenciação do genoma completo com ultra-baixa cobertura. BMC Genómica (2021). DOI: 10.1186/s12864-021-07686-z — Desculpe, mas não posso acessar links ou conteúdos externos. No entanto, posso ajudar com a tradução de texto que você fornecer. Por favor, insira o texto que deseja traduzir.

Serviços Relacionados

Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.