Métricas de Qualidade para Sequenciação de eccDNA: Eficiência de Enriquecimento, Fundo e Reprodutibilidade

Definir o sucesso num projeto de eccDNA (Circle-Seq e relacionados) começa com o que se mede e quão consistentemente se mede. Em fluxos de trabalho apenas para pesquisa, o núcleo de "bons dados" é simples: remoção eficaz de DNA linear, retenção demonstrável de DNA circular, baixo ruído de fundo e resultados reproduzíveis entre réplicas e lotes—sem fazer promessas de desempenho externo. Este guia prático resume os pontos de verificação mensuráveis e as normas de relatório para equipas de QA de CRO e líderes de instalações centrais que utilizam estratégias híbridas (leitura curta da Illumina mais leitura longa da ONT/PacBio) para atender às exigências de estudos de mecanismo, descoberta e aplicação.


QC Pré-Sequenciamento: Integridade do DNA HMW e Prontidão de Entrada

A integridade do DNA genómico de alto peso molecular (HMW) é o primeiro filtro. Um input fragmentado eleva os artefatos de digestão e complica o enriquecimento. Sistemas de eletroforese automatizados (Agilent TapeStation ou Bioanalyzer) ajudam a visualizar se você tem uma banda HMW dominante com mínima mancha—um sinal de aceitação para prosseguir.

Electropherogram-style trace showing acceptable high-molecular-weight genomic DNA profile versus a degraded sample overlay.

Figura 1. Eletroforese capilar (TapeStation/Bioanalyzer) mostrando um traço de DNA genómico de alto peso molecular (HMW) (em cima) comparado com uma amostra degradada (em baixo); a posição do pico indica o tamanho do fragmento e a altura do pico indica a quantidade relativa.

O que documentar antes da enriquecimento:

  • Traço de integridade do ADN: um pico HMW dominante e uma linha de base limpa; evitar manchas pronunciadas de baixo peso molecular.
  • Concentração e volume: entrada suficiente para o método de enriquecimento escolhido (apenas exonuclease, exonuclease + amplificação em círculo rolante ou captura).
  • Controlo de contaminação: controlos de extração simulada (processo) e controlos sem modelo para detetar contaminação cruzada.
  • Cadeia de custódia e metadados: fonte da amostra, protocolo de extração, lotes de reagentes, operador e abordagem de enriquecimento planeada.

Lista de verificação de aceitação em estilo SOP (ilustrativa):

  • Receber e registar amostras com IDs de lote/corrida e condições de armazenamento.
  • Inspecione o traço do TapeStation/Bioanalyzer; prossiga se a banda de HMW dominar e o borrão for mínimo.
  • Quantificar DNA; confirmar que a amostra atende ao mínimo para o protocolo selecionado.
  • Prepare controlos de contaminação; inclua extração simulada e sem modelo.
  • Registar metadados no LIMS: fonte, números de lote, ID do operador, método de enriquecimento planeado.

Notas adicionais de QA pré-sequenciamento para estratégias híbridas:

  • Para ONT/PacBio executa, confirma a extração suave e o mínimo de cisalhamento; considera a seleção de tamanho apenas se justificada pelos objetivos do projeto (por exemplo, focando em círculos >1 kb).
  • Para o Circle-Seq da Illumina, planeie ciclos de RCA conservadores e limpeza pós-amplificação para minimizar artefatos de concatâmeros.
  • Se a enriquecimento baseado em captura for utilizado, conjuntos de sondas piloto com círculos sintéticos devem ser usados para confirmar a recuperação e especificidade do alvo antes de escalar.

Medição da Eficiência de Enriquecimento de eccDNA com qPCR e Spike-ins

A enriquecimento eficaz de eccDNA mostra duas assinaturas: depleção de DNA linear nuclear e retenção de DNA circular (incluindo o mitocondrial). A qPCR de um gene nuclear versus DNA mitocondrial é uma verificação rotineira e rápida. A adição de spike-ins plasmídicos circulares e lineares exógenos fornece uma medida calibrada de recuperação.

Elementos chave de configuração:

  • Marcador de depleção nuclear: escolha um gene nuclear de cópia única que seja improvável de formar eccDNA em condições basais (por exemplo, COX5B ou ACTB). Acompanhe o seu sinal de qPCR antes e depois da digestão.
  • Controlo de retenção circular: use um gene mitocondrial (o mtDNA é circular) para verificar que moléculas circulares persistem.
  • Spike-ins exógenos: adicione um plasmídeo circular conhecido e um plasmídeo linearizado antes da enriquecimento para calcular as proporções recuperadas circular:linear após o processo.

qPCR fold-change bar chart comparing depletion of a linear nuclear gene versus retention of mitochondrial circular DNA before and after enrichment.

Figura 2. mudança em qPCR antes e depois do enriquecimento: depleção de um marcador nuclear linear (ΔCt ilustrativo 22 → 30) versus retenção de DNA circular mitocondrial (ΔCt ilustrativo 20 → 21); mudanças em dobro calculadas pelo método 2^−ΔΔCt (barras de erro = réplicas técnicas).

Cálculo ilustrativo, não promissório:

  • Suponha que os valores de Ct de pré-enriquecimento sejam Núcleo = 22 e mtDNA = 20; os valores de Ct pós-digestão são Núcleo = 30 e mtDNA = 21.
  • Quantidade relativa (RQ) via ΔCt (2^-ΔCt): Depleção nuclear ≈ 2^(22−30) ≈ 1/256; retenção de mtDNA ≈ 2^(20−21) ≈ 1/2.
  • Relate uma "razão de recuperação circular:linear" (definida explicitamente no seu SOP) utilizando mtDNA e spike-ins: a razão do sinal circular retido em relação ao sinal linear esgotado após o enriquecimento. Neste exemplo, mtDNA vs nuclear ≈ 128, indicando uma forte retenção em relação ao esgotamento.

Considerações entre plataformas:

  • A técnica Circle-Seq de leitura curta da Illumina com exonuclease+RCA oferece alta sensibilidade, mas pode aumentar o número de duplicados; mantenha os ciclos de RCA conservadores e verifique a complexidade da biblioteca.
  • A sequenciação direta de longas leituras da Oxford Nanopore de círculos enriquecidos captura leituras que abrangem junções e distribuições de tamanho, ajudando na validação estrutural.
  • As estratégias de captura HiFi da PacBio podem fornecer leituras de alta precisão de círculos maiores; planeie os requisitos de entrada e os designs das sondas de captura em conformidade.
  • Estratégia híbrida: combinar Illumina para profundidade com ONT/PacBio para confirmação estrutural. Utilizar controles de spike-in e qPCR consistentes em todos os caminhos para comparar a eficiência de enriquecimento.

Exemplo prático com spike-ins (ilustrativo):

  • Adicione 10 ng de um plasmídeo circular conhecido (por exemplo, 2–3 kb) e 10 ng do mesmo plasmídeo linearizado por digestão com restrição à extração antes do tratamento com exonuclease.
  • Após o enriquecimento e limpeza, quantifique por qPCR com primers que abrangem regiões únicas do plasmídeo. Se as estimativas pós-enriquecimento retornarem 7,5 ng circulares e 0,01 ng lineares, a razão de recuperação circular:linear é de 750, mostrando uma retenção preferencial das formas circulares.
  • Nota: a abundância de mtDNA varia entre os tecidos; compare as razões de spike-in entre lotes para monitorizar a estabilidade do processo.

QC Pós-Sequenciamento: Suporte de Mapeamento, Fundo e Normalização de Abundância

Uma vez que o sequenciamento está completo, as chamadas de eccDNA devem ser suportadas por evidências de alinhamento claras e níveis de fundo razoáveis. É aqui que as práticas de "qc de sequenciamento de eccdna" convergem entre dados de leituras curtas e longas.

Mapeamento e limiares de evidência:

  • Suporte a leituras divididas/soft-clipped: a evidência que atravessa junções é essencial em bibliotecas de leituras curtas (por exemplo, contagens mínimas de leituras divididas ajustadas à complexidade do genoma).
  • Pares discordantes: sinais de apoio de anomalias de extremidade emparelhada reforçam a confiança.
  • Leitura longa junções: leituras diretas que abrangem junções reduzem a ambiguidade; inspecione a cobertura por círculo e as distribuições de comprimento das leituras.

Normalização de abundância e rastreamento de fundo:

  • Normalize os contagens de eccDNAs por milhão de leituras mapeadas (EPM) ou uma métrica semelhante normalizada pela profundidade.
  • Rastrear o conteúdo linear residual: reportar a fração de leituras que mapeiam para regiões lineares canónicas versus junções circulares; incluir marcadores de genes nucleares ou janelas genómicas selecionadas como um proxy de fundo.
  • Defina um "Rácio Enriquecido de Círculo" personalizado para os seus relatórios, com a fórmula claramente indicada (por exemplo, o número de leituras que suportam junções dividido pelo total de leituras mapeadas na biblioteca de enriquecimento). Trate-o como uma métrica específica do projeto em vez de um padrão da comunidade.

Notas de QC específicas da plataforma:

  • Leitura curta da Illumina: monitorizar taxas de duplicação e sequências sobre-representadas no FastQC; inspecionar distribuições de tamanhos de inserção; garantir que as contagens de leituras que atravessam junções ultrapassem os seus limiares de aceitação internos.
  • ONT long-read: rever a precisão por leitura e o desempenho de homopolímeros; confirmar chamadas de junção através de múltiplas leituras; considerar registos de amostragem adaptativa se utilizados.
  • PacBio HiFi: verifique a precisão das leituras e as distribuições de comprimento; confirme que os alvos de captura estão representados com cobertura suficiente; inspecione a precisão do consenso para sequências de junção.

Reprodutibilidade de pipeline híbrido:

  • Padronizar a QC de leitura (FastQC/fastp) e o alinhamento (BWA-MEM para leituras curtas; Minimap2 para leituras longas). Utilizar ambientes conteinerizados e ficheiros de parâmetros fixos.
  • Para a deteção, considere ferramentas complementares (Circle-Map, CReSIL, ecc_finder, eccDNA-pipe) e registe as versões exatas.
  • Gerar PDFs de QC com limiares e contagens de evidências por círculo; incluir um dicionário de dados descrevendo campos e filtros.

Os passos de QC em bioinformática estão mais detalhados na visão geral dos serviços da CD Genomics: Serviços de Bioinformática.

Exemplos de comandos (ilustrativos; versões de pin em seu SOP):

# Short-read alignment
bwa mem -t 16 reference.fa sample_R1.fastq.gz sample_R2.fastq.gz | samtools view -Sb - > sample.bam
samtools sort -@ 8 -o sample.sorted.bam sample.bam
samtools index sample.sorted.bam

# Long-read alignment
minimap2 -t 16 -ax map-ont reference.fa sample_ONT.fastq.gz | samtools sort -o sample_ONT.sorted.bam -
samtools index sample_ONT.sorted.bam

# Circle-Map detection (example; adjust parameters)
Circle-Map Realign -i sample.sorted.bam -o sample.circlemap.bam -r reference.fa
Circle-Map Detect -i sample.circlemap.bam -o sample_circles.bed

# ecc_finder (conceptual)
python ecc_finder.py --in sample.sorted.bam --ref reference.fa --out eccfinder_calls.bed

Documente as versões das ferramentas, parâmetros e limites juntamente com estes comandos no seu relatório de QC.


Reprodutibilidade: Réplicas Biológicas, Correlações e Aceitação

A reprodutibilidade é a âncora da confiança. A sua lógica de aceitação deve distinguir entre réplicas biológicas e repetições técnicas e incluir metadados de lote.

Replicate correlation scatter plot (Replicate 1 vs Replicate 2) with R-squared annotation for eccDNA abundance.

Figura 3. Replicar a concordância para a abundância de eccDNA (EPM): gráfico de dispersão do Replicado 1 versus Replicado 2 com R² anotado para indicar a reprodutibilidade entre os loci genómicos.

Relatório recomendado, enquadrado como prática em vez de promessas:

  • Sobreposição de presença/ausência: calcular a sobreposição de intervalos recíprocos (por exemplo, limiares de sobreposição ≥50%) entre réplicas biológicas.
  • Correlações: relatar correlações de Pearson ou Spearman para contagens de eccDNA normalizadas por profundidade (EPM) em bins genómicos ou genes.
  • Variabilidade: resumir o coeficiente de variação (CV) para o suporte de leitura por círculo e sinalizar outliers.
  • Notas de lote: registar o operador, números de lote dos reagentes, IDs de execução do instrumento e condições de reexecução.

Considerações sobre estratégias híbridas para reprodutibilidade:

  • Use a Illumina para estabilizar a deteção orientada pela profundidade e ONT/PacBio para validar a estrutura, depois reconcilie as chamadas entre plataformas.
  • Quando o acordo é parcial, priorize os círculos com suporte de múltiplas evidências (leituras divididas, pares discordantes e junções de leituras longas). Documente as regras de decisão no relatório de QC.

Orientações de aceitação (ilustrativas):

  • Aceitar um lote quando a sobreposição de replicados e as correlações atendem a limites definidos internamente e os controles de contaminação estão limpos.
  • Sinalize para revisão quando as taxas de duplicação ou o fundo linear residual excederem as expectativas internas.
  • Repetir a digestão ou re-sequenciar quando a evidência de junção estiver consistentemente abaixo dos limites internos, apesar de uma profundidade suficiente.

Resumo de reprodutibilidade entre instituições (ilustrativo, não promissório):

Embora os benchmarks formais de múltiplos laboratórios para eccDNA sejam ainda escassos, estudos independentes fornecem sinais ilustrativos úteis. Por exemplo, a sequenciação paralela de células únicas em González et al., scEC&T‑seq (2023) relatou uma forte concordância entre plataformas (Illumina vs. Nanopore; Pearson R ≈ 0,95 para conjuntos de dados correspondentes). Uma comparação de métodos separada de 2024 relatou uma maior concordância de replicados para leituras curtas/largas ao estilo WGS (>50% e ~54%, respetivamente) em comparação com algumas variantes do Circle-Seq, destacando a dependência do protocolo em vez da reprodutibilidade universal. Reporte estes valores como observações a nível de estudo (inclua tipo de amostra, plataforma e n onde disponível) e trate-os como ilustrativos, não como garantias de serviço.


Resolução de Problemas com Dados de Baixa Qualidade: Sintomas Comuns e Ações Corretivas

Quando aparecem bandeiras de QC, mova-se rapidamente com diagnósticos baseados em sintomas e correções direcionadas. Abaixo está uma matriz de resolução de problemas compacta que você pode adaptar.

Sintoma Causa provável Verificação imediata Ação corretiva
Fundo linear elevado após digestão Atividade exonuclease incompleta; degradação do tampão ou da enzima qPCR nuclear vs mtDNA; verificar lote da enzima e incubação. Repetir a digestão com enzima fresca; otimizar o tampão/incubação; incluir controlos de processo.
Bibliotecas de baixa complexidade (alta duplicação) Sobreamplificação de RCA; formação de concatâmeros Duplicação FastQC; perfil de tamanho da biblioteca; revisão do ciclo RCA Titule a entrada RCA; encurte a amplificação; purifique os círculos; considere o enriquecimento baseado na captura.
Viés de tamanho/sequência Dependência do sítio de restrição ou viés da sonda de captura Cobertura vs flancos; repetir análise de conteúdo Utilize tagmentação ou misturas de enzimas; redesenhe as sondas de captura; note o viés esperado no relatório.
Contaminação nos controlos Contaminação por carry-over ou por reagentes Sinais de controlo de extração sem modelo e de simulação Auditar o espaço de trabalho; substituir os reagentes; reprocessar com controles de contaminação mais rigorosos.
Suporte de junção insuficiente Profundidade demasiado baixa; filtros agressivos Tabelas de suporte de leitura por círculo; revisão de filtros Aumentar a profundidade de sequenciação; relaxar filtros de forma conservadora; agregar réplicas.

Orientação para decisão (ilustrativa):

  • Se a digestão falhar (o sinal nuclear qPCR permanecer alto), pare a preparação a jusante e repita a digestão.
  • Se a duplicação exceder as expectativas e aparecerem artefatos estruturais, ajuste a RCA ou mude para enriquecimento baseado em captura e re-sequenciação.
  • Se for detetada contaminação nos controlos, abortar o lote, descontaminar e reiniciar com reagentes limpos.
  • Se o suporte da junção for marginal, aumente a profundidade ou combine réplicas; note as advertências nos entregáveis.

Validação e Auditoria: Documentação, LIMS e Pipelines Reproduzíveis

Um programa de QC é tão forte quanto a sua documentação. Prepare registos auditáveis que capturem métodos, parâmetros e evidências.

Campos de metadados recomendados (exemplo de tabela):

Campo Descrição
ID da amostra, ID do lote/corrida Identificadores únicos para rastreabilidade
Fonte e armazenamento Linha de tecido/célula, método de preservação
Protocolo de extração Kit ou reagentes; versão; operador
Método de enriquecimento Exonuclease apenas, exonuclease+RCA, captura; justificação
Design de spike-in Controles circulares e lineares; montantes de entrada
alvos de qPCR Gene nuclear, mtDNA, conjuntos de primers
Parâmetros de preparação de biblioteca Massa de entrada, ciclos, versão do kit
Detalhes do sequenciador/executar Plataforma, célula de fluxo/chip, versão da química
Versões de bioinformática Alinhadores e detectores; etiquetas de contêiner; parâmetros
Notas de aceitação Métricas de sobreposição/correlação; indicadores de decisão

Reproduzibilidade de pipeline:

  • Containerize todo o software (Docker/Singularity); fixe a versão de cada ferramenta.
  • Mantenha os ficheiros de parâmetros sob Git; exporte uma secção "métodos" legível por humanos.
  • Produzir entregas padronizadas: FASTQ, BAM alinhado, tabelas de chamadas de eccDNA (semelhantes a BED), um relatório de QC em PDF e um dicionário de dados conciso.

Página de resumo de QC do modelo (ilustrativa):

  • Visão geral: nome do projeto, IDs de lote, plataformas utilizadas (Illumina + ONT/PacBio), lista de amostras.
  • Notas de aceitação do TapeStation/Bioanalyzer pré-QC, quantidades de entrada, controlos de contaminação.
  • QC de Enriquecimento: valores de qPCR do núcleo vs mtDNA, razões de recuperação de spike-in, parâmetros de digestão.
  • QC da biblioteca: concentração, distribuição de fragmentos, métricas de duplicação.
  • QC de sequenciação: profundidade, taxas de mapeamento, contagens de suporte a junções.
  • Resumo da deteção: número de eccDNAs, EPM, definição e valores da razão enriquecida em círculos.
  • Reprodutibilidade: replicar sobreposição, correlação (R, R^2), distribuições de CV.
  • Decisões: aceitar/reprocessar/resequenciar bandeiras e justificações.

Referências de adoção externa: Para a estrutura e os passos do SOP de laboratório húmido, consulte Protocolo de purificação de DNA circular extrachromossómico em larga escala da JOVE de 2016Para formação em fluxos de trabalho de sequenciação baseados em circularização aplicáveis ao Circle-Seq, consulte Protocolo do ensaio off-target CIRCLE-seq da JOVE para 2024; cite estes como materiais de terceiros ilustrativos em vez de garantias de serviço.


Conclusão: Transforme o QC em SOPs em que Pode Confiar

A qualidade é um processo, não uma promessa. Defina passos explícitos e mensuráveis: HMW integridade do DNA, verificações de enriquecimento baseadas em qPCR, métricas pós-sequenciamento baseadas em evidências e reprodutibilidade a nível de replicado — tudo capturado num relatório auditável. Se precisar de uma estrutura prática para desenhar e documentar coortes de estudo de eccDNA, controlos e entregáveis, a orientação em estilo de plano em considerações de design de estudo sobre eccDNA pode ajudar a traduzir estes padrões de QC em planos de projeto.

Autor

Yang H. — Cientista Sénior, CD Genomics; Universidade da Florida.

Yang é um investigador em genómica com mais de 10 anos de experiência em investigação em genética, biologia molecular e celular, fluxos de trabalho de sequenciação e análise bioinformática. Habilidoso tanto em técnicas de laboratório como na interpretação de dados, Yang apoia o design de estudos RUO e projetos baseados em NGS.


Referências:

  1. A avaliação quantitativa revela a dominância de eccDNAs endógenos no genoma humano — Mouakkad-Montoya et al., PNAS (2021). DOI: 10.1073/pnas.2102842118.
  2. eccDNA-pipe: um pipeline integrado para identificação, análise e anotação de DNA circular extracromossómico — Fang et al., Briefings in Bioinformática (2024). DOI: 10.1093/bib/bbae034.
  3. ecc_finder: Uma Ferramenta Robusta e Precisa para Detetar DNA Circular Extracromossómico — Zhang et al., Fronteiras na Ciência das Plantas (2021). DOI: 10.3389/fpls.2021.743742.
  4. DNA circular extracromossómico: Estado atual e perspetivas futuras — Zhao et al., eLife (2022). DOI: 10.7554/eLife.81412.
  5. Sequenciação paralela de DNAs circulares extracromossómicos e transcriptomas completos com resolução de célula única (scEC&T-seq) — González et al., Nature Communications/PMC (2023).
  6. DNA circular extracromossómico como um novo biomarcador para a progressão do câncer colorretal — Qiu et al., Medicina Molecular (2025). DOI: 10.1186/s10020-025-01164-y.
  7. Atlas de eccDNA em machos revela características que protegem os genes contra a formação de eccDNA induzida por transcrição — Liang et al., Nature Communications (2025). DOI: 10.1038/s41467-025-57042-y.
  8. Formação de DNA Circular Mediado por Microhomologia a partir de DNA Genómico — Hu et al., eLife revisado preprint (2023).
  9. Um perfil de DNA circular distinto interage com alterações no proteoma em contextos de doença — Gerovska et al., 2023, PMC10498603.
  10. Análise Quantitativa com os Sistemas Agilent TapeStation — Agilent Technologies, Visão Técnica 5994-8050EN (2025).
  11. Controlo de Qualidade de Amostras nas Soluções NGS da Agilent (TapeStation/Bioanalyzer) — Agilent Technologies, Nota de Aplicação 5994-0127EN (2018).
  12. Repositório Circle-Map — Prada-Luengo et al., GitHub (2020–2025).
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo