Fluxo de Trabalho Experimental para Sequenciação de eccDNA: Enriquecimento, Preparação de Biblioteca e Armadilhas Comuns

O DNA circular extracromossómico (eccDNA) é uma "agulha num palheiro": moléculas circulares raras dispersas num fundo esmagador de DNA genómico linear. Sequenciar estes DNA de forma fiável requer um fluxo de trabalho disciplinado, do início ao fim, e controlos de qualidade explícitos. Neste guia prático para cientistas de laboratório, vamos percorrer um fluxo de trabalho de sequenciação de eccDNA em quatro etapas—extração de DNA de alto peso molecular (HMW), eliminação de DNA linear (enriquecimento de eccDNA), amplificação em círculo rolante (RCA) e preparação de biblioteca—além dos controlos, limiares e validação de leituras longas que transformam resultados em descobertas reprodutíveis.
Se é novo no tópico, comece com a visão geral do conceito em Sequenciação de eccDNA Explicada.
Passo 1: Extração de DNA de Alto Peso Molecular (HMW)
As minipreps padrão muitas vezes não são suficientes para a descoberta de eccDNA, pois fragmentam o DNA e tendem a favorecer a recuperação de fragmentos menores. Círculos grandes podem ser frágeis; lise agressiva, agitação repetida e ligação/eluição agressiva em colunas podem causar cortes ou quebras. O objetivo aqui é obter DNA limpo e de alta massa molecular (HMW) com mínimo fracionamento.
O que almejar
- DNA HMW intacto (mancha de alta massa molecular ampla em um gel de agarose a 0,8% a baixa voltagem) e quantificação precisa de dsDNA pelo Qubit. Evite confiar apenas no NanoDrop—proteínas, fenol ou resíduos de sal podem distorcer a razão A260/280.
- Lise suave e pipetagem mínima: pense devagar, frio e em pontas de grande diâmetro sempre que possível.
- Limpeza em fase sólida ou baseada em esferas que preserva moléculas longas. Vários estudos de eccDNA relatam uma preservação robusta de HMW com abordagens baseadas em esferas e confirmam a integridade através de perfis de gel/TapeStation.
Entradas e manuseamento sugeridos
- Massa de entrada recomendada: 0,5–2 µg de ADN HMW por amostra para digestão e RCA a montante, dependendo do rendimento de tecido/célula.
- Mantenha EDTA nos tampões de lise para inibir nucleases; evite incubação prolongada à temperatura ambiente.
- Armazene o DNA intermédio a 4°C para períodos curtos; congele a −20°C para armazenamento mais prolongado. Descongele em gelo.
Ponto de controlo de QC 1: integridade da extração
- Execute a eletroforese em agarose a 0,8% a baixa voltagem; o DNA de alto peso molecular deve aparecer como uma mancha superior ampla com poucas bandas discretas de baixo peso molecular.
- Concentração de dsDNA em Qubit: documentar rendimento e pureza. O uso opcional do TapeStation/Bioanalyzer pode capturar a distribuição de fragmentos para os seus registos.
Regra de decisão
- Se o gel mostrar forte fragmentação ou se o DNA for escasso (<100 ng), considere re-extrair com lise mais suave e limpeza baseada em beads. Não prossiga para a digestão com exonuclease com DNA claramente degradado; você aumentará os falsos positivos e reduzirá a recuperação de círculos.
Contexto da evidência
- Muitos laboratórios confirmam a integridade do HMW com géis/TapeStation antes do circle-seq. As revisões resumem métodos baseados em beads e verificações de integridade para fluxos de trabalho de eccDNA, por exemplo, no Revisão de métodos em Fronteiras em Genética (2024), que discute as escolhas de extração e o enriquecimento subsequente.
Figura 1. Fluxo de trabalho do eccDNA: extração de HMW → digestão de Exo → RCA → preparação da biblioteca → NGS. Verificações de QC: integridade da extração, eficiência da digestão, perfil de RCA, métricas da biblioteca.
Passo 2: Eliminação de DNA Linear (Enriquecimento de eccDNA)
A pedra angular de um sequenciação de eccDNA o fluxo de trabalho é a remoção rigorosa de DNA linear. Duas famílias de enzimas dominam esta etapa:
- Exonuclease V (RecBCD; comumente da NEB): digere DNA de cadeia dupla linear; a atividade depende de ATP e do tampão. Pode degradar círculos com quebras.
- DNase dependente de ATP Plasmid‑Safe (Epicentre/Lucigen): degrada seletivamente DNA de cadeia dupla linear enquanto preserva DNA de cadeia dupla circular fechado intacto; os protocolos de circle-seq frequentemente favorecem digestões que variam de várias horas a vários dias com re-administração de ATP.
Configurações que funcionam na prática
- Exonuclease V: correr em 1X NEBuffer 4 com ~1 mM ATP a 37°C; o tempo de incubação varia com a massa de entrada e o fundo. A documentação da NEB nota a necessidade de ATP e a remoção seletiva de DNA linear; veja Página do produto Exonuclease V da NEB e orientação sobre a atividade de buffer.
- Plasmid‑Safe: incubar a 37°C com ATP; para amostras complexas, prolongar a digestão e repor a enzima/ATP diariamente para reduzir a carga linear, evitando a sobre-digestão que poderia danificar os círculos. As implementações do Circle‑seq usando Plasmid‑Safe estão resumidas em Yu et al. (2023) Visão geral do Circle-seq.
A verificação é inegociável.
- qPCR de um ou dois loci genómicos de cópia única: comparar Ct antes e depois da digestão. Um aumento substancial de Ct (por exemplo, ≥3–4 ciclos) indica depleção de DNA linear. Vários estudos utilizam ensaios específicos de locus para quantificar a depleção e confirmar o enriquecimento.
- Eletroforese em gel: espera-se o desaparecimento de bandas lineares proeminentes/manchas; os spike-ins circulares devem permanecer detectáveis (veja a secção de controlos).
Contaminação de DNA mitocondrial (mtDNA)
- O mtDNA pode persistir e distorcer resultados. Muitos fluxos de trabalho de sequenciação em círculo pré-linearizam o mtDNA utilizando CRISPR-Cas9 com sgRNAs em dois locais do mtDNA antes da digestão, e depois confirmam a remoção por PCR; veja as notas do protocolo em dos Santos et al. (2023).
Ponto de controlo QC 2: sucesso da digestão
- Documente as alterações nos Ct do qPCR. Capture imagens do gel antes/depois da digestão.
- Se o desvio de Ct for <3 ciclos e o gel mostrar um borrão residual, repita a digestão com enzima e ATP frescos. Fique atento à integridade do círculo; evite exposição prolongada a altas temperaturas ou pipetagens excessivas.
Regra de decisão
- Prossiga para a RCA apenas após confirmar a depleção linear robusta por qPCR/gelo. Se a digestão permanecer incompleta, repita com unidades de enzima aumentadas, ATP renovado ou tempo de incubação prolongado. Se suspeitar de cortes no círculo, mude de enzima ou reduza o tempo de exposição.
Seleção de referência e método mais aprofundado
- Para compromissos e estratégias de controlo na escolha de enzimas, veja Escolhendo Métodos de Enriquecimento de eccDNA.
Figura 2. Comparação de gel: Antes da digestão — mancha linear abundante; Após a digestão — DNA linear reduzido com pico circular retido (verificado por qPCR); Pós-RCA — mancha de concatâmeros de alto peso molecular indicando amplificação bem-sucedida.
Passo 3: Amplificação em Círculo Rolante (RCA) com Phi29
A RCA aumenta os círculos de baixa abundância para que sejam detectáveis em bibliotecas posteriores. A polimerase Phi29 é a principal responsável devido ao forte desvio de cadeias e alta processividade. No entanto, pode produzir concatâmeros e quimeras se as condições não forem cuidadosamente geridas.
Parâmetros chave
- Primers: use primers aleatórios resistentes a exonucleases (por exemplo, protegidos por fosforotioato) para manter a integridade dos primers sob a correção de provas da Phi29; consulte as orientações do kit, como Protocolo do kit RCA Phi29‑XT da NEB.
- Temperatura e duração: WT phi29 normalmente funciona a ~30°C; variantes engenheiradas (por exemplo, phi29‑XT) a 42°C. Limitar a RCA a ~2 horas muitas vezes reduz a formação excessiva de concatâmeros enquanto fornece um rendimento suficiente, conforme observado nas notas de aplicação de vários fornecedores para amplificação por deslocamento múltiplo.
- Desramificação: O tratamento com a endonuclease I T7 ou a fragmentação acústica suave podem reduzir os concatâmeros ramificados antes da preparação da biblioteca. As orientações da NEB sobre RCA sugerem a desramificação para bibliotecas mais limpas.
- Inativação: siga os protocolos do kit para paragens baseadas em calor ou EDTA para interromper a atividade.
Controlo na RCA
- Controlo sem modelo (NTC): não deve mostrar amplificação; qualquer sinal indica contaminação.
- Controlo negativo linear: realizar uma digestão de controlo sem modelos circulares; uma amplificação significativa sugere digestão incompleta ou artefatos de primers.
- Picos circulares: quantificar o rendimento da RCA e o viés entre tamanhos.
Ponto de controlo QC 3: perfil pós-RCA
- Gel/TapeStation: espera-se uma mancha de alto peso molecular. Bandas repetidas distintas podem indicar artefatos de concatâmero; mitigue através da redução do tempo de reação ou desramificação.
- Quantifique o rendimento da RCA; note a distribuição dos fragmentos se planejar a seleção de tamanho.
Regra de decisão
- Se a RCA produzir bandas demasiado discretas ou quimeras excessivas, encurte a incubação, verifique a qualidade dos primers e considere a desramificação antes da fragmentação. Confirme que os negativos de controlo (NTC) e lineares permanecem limpos.
Contexto para entradas de stress de replicação
- Se o seu projeto perturba intencionalmente a replicação (por exemplo, tratamentos com hidroxureia), compreenda como o stress impacta a abundância de círculos e as entradas de RCA. Saiba mais em Estresse de Replicação e eccDNA.
Figura 3. A RCA do Phi29 produz amplicons concataméricos a partir de modelos circulares—mitigar artefatos encurtando o tempo de reação, utilizando primers resistentes a exonucleases e aplicando desramificação ou cisalhamento suave antes da preparação da biblioteca.
Passo 4: Preparação da Biblioteca e Controlo de Qualidade
Com templates circulares enriquecidos e amplificados, está pronto para preparar bibliotecas de leitura curta (comumente Illumina PE150) para descoberta e perfilagem. Trate a preparação da biblioteca como um passo de construção e um diagnóstico.
Fragmentação
- Os alvos inserem-se em cerca de ~300–400 bp. A sobrefragmentação erode a complexidade e pode enviesar a deteção de junções.
- Escolha cisalhamento acústico ou fragmentação enzimática; ajuste a energia/tempo para atingir a janela de inserção.
Ligação e amplificação de adaptadores
- Utilize kits de ligadura compatíveis com a sua estratégia de fragmentação; evite ciclos excessivos de PCR—cada ciclo aumenta a duplicação e o viés. Se as entradas forem baixas, considere opções de ligadura otimizadas para DNA de baixa entrada.
Seleção de tamanho e limpeza
- Relações de esferas SPRI: ajuste fino para reter a janela do seu inserto alvo. Uma seleção excessivamente restritiva pode descartar fragmentos informativos que atravessam a junção.
Orientações sobre a profundidade de sequenciamento
- As descobertas são: muitos estudos de sequenciação de círculos reportam contagens de leituras por amostra que variam de dezenas a centenas de milhões de leituras PE150. A sua profundidade ideal depende da complexidade do tecido e da abundância esperada dos círculos; comece com uma profundidade modesta e, em seguida, aumente uma vez que a QC seja aprovada. Para o contexto da plataforma, veja o Visão geral da Sequenciação de Próxima Geração (Illumina).
- Execuções de validação: se passar para a confirmação de leitura longa (PacBio HiFi ou ONT), a profundidade pode focar em candidatos em vez de descoberta global.
Critérios de aceitação para registar
- Distribuição do tamanho inserido (Bioanalyzer/TapeStation) em torno de 300–400 bp.
- A taxa de mapeamento próxima de ~90% com um alinhador padrão (por exemplo, BWA‑MEM) indica uma boa qualidade da biblioteca.
- Taxas de duplicação: monitorizar e manter o mais baixo possível; reportar juntamente com as métricas Q30 e detalhes sobre a remoção de adaptadores/baixa qualidade.
Onde um serviço chave na mão pode ajudar
- Para laboratórios que preferem uma transferência padronizada—desde a digestão até a preparação da biblioteca e bioinformática—Divulgação: CD Genomics o nosso produto oferece sequenciação e análise de eccDNA.
Critérios de aceitação de referência
- Reveja os critérios de aceitação detalhados, métricas de reprodutibilidade e orientações de relatório em Métricas de Qualidade para Sequenciação de eccDNA.
Controlo e Spike-ins: Design de QC de Ponta a Ponta
O determinante mais significativo da reprodutibilidade num fluxo de trabalho de sequenciação de eccDNA é o plano de controlo. Incorpore três controlos obrigatórios no seu pipeline e trate os seus resultados como guardiões do projeto.
- Picos sintéticos circulares (emparelhados com uma versão linear)
- O que eles fazem: quantificar a eficiência da digestão e o rendimento de RCA, e calibrar os limiares de deteção.
- Como usar: adicione quantidades definidas de um plasmídeo circular ou mini-círculo mais uma versão linearizada da mesma sequência na extração ou pré-digestão. Após a digestão e RCA, calcule a razão log2 de circular:linear por qPCR ou contagens de leitura.
- O que esperar: estudos de circle-seq relatam aumentos significativos nas razões circular:linear após digestão otimizada e RCA, refletindo a depleção linear bem-sucedida e o enriquecimento circular; veja exemplos em Yu et al. (2023) Visão geral do Circle-seq.
- Controlo negativo de DNA genómico linear
- O que faz: estima o fundo de falsos positivos—chamadas de junção espúrias ou leituras divididas que não deveriam aparecer na ausência de círculos.
- Como usar: processe uma amostra através de digestão e RCA que não contenha templates circulares. Qualquer amplificação ou deteção de junções indica digestão incompleta ou artefatos de RCA/primer; use este fundo para definir os limiares de deteção.
- Controlo RCA sem modelo (NTC)
- O que faz: monitora a contaminação e os artefatos de primer nos reagentes RCA.
- Como usar: faça uma RCA com água em vez de DNA. Qualquer produto que sugira contaminação — não prossiga.
Limiares de QC e Planeamento de Profundidade para Sequenciação de eccDNA
Limiares de deteção
- Aceitação de leituras curtas: requer múltiplas leituras divididas que suportem uma junção (por exemplo, ≥5 leituras divididas) e cobertura consistente em torno do círculo putativo. Ajustar com base no fundo observado no controlo negativo linear.
- Aceitação de leituras longas (para candidatos): visa múltiplas leituras independentes de comprimento completo que abrangem a junção (por exemplo, ≥2 leituras ONT/PacBio), além de corroborar com leituras divididas. As abordagens de validação de candidatos com reconstrução de eccDNA de comprimento completo são descritas em métodos como FLED; veja Li et al. (2023) deteção de eccDNA em comprimento total.
Calibração de spike-in
- Utilize a recuperação medida e alterações de razão para ajustar a sensibilidade. Se a recuperação de spike-in for fraca, reavalie a digestão/RCA antes de sequenciar mais a fundo.
Recomendações de profundidade de sequenciação
- Descoberta: comece com ~50–150 milhões de leituras PE150 por amostra como uma faixa pragmática, depois escale de acordo com o desempenho do controlo e a complexidade da amostra. As faixas de profundidade e as transições de descoberta para validação são discutidas em artigos sobre métodos de eccDNA; uma visão geral dos volumes de dados de circle-seq aparece em Jiang et al. (2023).
- Validação: para a confirmação de candidatos alvo, as sequências de leitura longas podem ser modestas se produzirem leituras completas que abranjam toda a extensão; a Visão Geral Completa do Sequenciamento de Longas Leituras fornece compensações de plataforma úteis para o planeamento de profundidade.
Registo dos resultados de QC
- No mínimo, capture: alterações na razão de spike-in e percentagem de recuperação, deslocamentos de Ct de qPCR para loci de cópia única, resultados de NTC/controlo negativo, distribuição do tamanho dos inserts da biblioteca, taxas de mapeamento/duplicação e leituras mínimas de suporte para círculos aceites.
Estratégia de Validação de Longas Leituras (PacBio/ONT)
A descoberta de leituras curtas é poderosa, mas repetições complexas e ambiguidade de junção beneficiam da validação ortogonal de leituras longas. Planeie esta etapa cedo para que possa reservar material e evitar reextração.
Seleção de candidatos
- Escolha 5–10 eccDNAs putativos que abranjam tamanhos diversos e conteúdo de repetições. Favorizar candidatos com forte suporte de leituras curtas e bons métricas de recuperação de spike-in.
Estratégias de biblioteca
- Opção A: sequenciar concatemers RCA nativamente na ONT para capturar moléculas que atravessam as junções dentro de longas repetições em tandem.
- Opção B: realizar bibliotecas PacBio HiFi em DNA selecionado por tamanho para alcançar alta precisão por leitura; adequado para confirmar pontos de ruptura precisos.
- Opção C: plano híbrido—usar corte acústico após a RCA para ajustar distribuições de comprimento adequadas à plataforma escolhida.
Entradas e QC
- Verifique o comprimento e a qualidade da biblioteca através do Bioanalyzer/TapeStation. Assegure-se de que há mínimos dímeros de adaptadores e uma distribuição de tamanhos apropriada.
- Confirme que os NTCs e os negativos lineares permanecem limpos; o sinal de leitura longa nos negativos indica contaminação ou falha de digestão.
Interpretar evidências de leitura longa
- Procure leituras de comprimento completo que atravessem a junção com alta qualidade de mapeamento e mínimo soft-clipping. Combine com evidências de leituras divididas de bibliotecas de leituras curtas.
- Utilize reconstrução baseada em grafos ou montagem por consenso para resolver repetições; requer múltiplas moléculas independentes antes de declarar a estrutura.
Compromissos da plataforma
- ONT destaca-se na captura de concatémeros muito longos e repetições complexas; PacBio HiFi oferece uma excelente precisão por leitura para chamadas de pontos de ruptura de alta confiança.
Onde o contexto de serviço ajuda
- Se precisar de um caminho de validação chave na mão, Visão Geral Completa do Sequenciamento de Longas Leituras explica as compensações da plataforma. Fornecedores incluindo Sequenciação de leitura longa da CD Genomics e Sequenciação SMRT da PacBio páginas esboço capacidades que pode mapear para o seu plano de validação.
Erros Comuns e Resolução de Problemas
Fundo linear elevado após digestão
- Causas prováveis: unidades enzimáticas insuficientes, ATP degradado ou incubação demasiado curta.
- Correções: repetir a digestão com enzima fresca e ATP; prolongar a incubação ou re-administrar diariamente (para Plasmid-Safe); verificar com desvio Ct de qPCR e gel.
Contaminação mitocondrial
- Causas prováveis: persistência de mtDNA durante a digestão.
- Correções: pré-linearizar mtDNA usando CRISPR-Cas9 em dois locais antes da digestão; confirmar por PCR.
Concatémeros e quimeras de RCA
- Causas prováveis: RCA prolongada, degradação do primer ou ramificação.
- Correções: limitar a RCA a ~2 h; usar primers exo-resistentes; desramificar com T7 Endonuclease I; garantir que os NTC/negativos lineares estão limpos. Protocolos de fornecedores como Protocolo RCA Phi29‑XT da NEB fornecer notas de mitigação.
Sobre-fragmentação durante a preparação da biblioteca
- Causas prováveis: tempo excessivo de cisalhamento ou exposição a enzimas.
- Correções: titrar a energia/tempo de fragmentação para atingir inserções de 300–400 bp; monitorizar via Bioanalyzer; reduzir ciclos de PCR para preservar a diversidade.
Baixa complexidade da biblioteca ou alta duplicação
- Causas prováveis: baixo DNA de entrada ou sobre-amplificação.
- Correções: otimizar a eficiência de ligação; minimizar os ciclos de PCR; considerar ajustes na seleção de tamanho; reavaliar o rendimento da RCA e o controlo de qualidade da digestão.
Lista de Verificação para Transferência de Bioinformática
Fornecer um conjunto de dados robusto à equipa de análise acelera a interpretação e reduz a troca de informações. Forneça os seguintes mínimos:
- Profundidade de leitura bruta (pares de extremidades e comprimento da leitura) por amostra.
- Taxa de mapeamento, taxa de duplicação e distribuição de Q30 após o corte de adaptadores/qualidade.
- Inserir distribuição de tamanho do Bioanalyzer/TapeStation.
- Métricas de recuperação de spike-in: alterações na razão logarítmica linear circular:linear log2 e percentagem de recuperação em diferentes tamanhos.
- Deslocamentos de Ct de qPCR para loci de cópia única antes e depois da digestão.
- Resultados de controlo negativo NTC e linear (incluindo quaisquer leituras detetadas e chamadas de junção, idealmente zero).
- Limiares de deteção utilizados: leituras mínimas divididas por junção (leituras curtas) e leituras mínimas de comprimento total (leituras longas) para aceitação de candidatos.
- Uma lista restrita de candidatos selecionados para validação de leituras longas, com justificação.
Conclusão: Padronizar para Resultados "circle-seq eccDNA" Reproduzíveis
Um fluxo de trabalho de sequenciação de eccDNA vive ou morre pelos seus controlos. A extração suave de HMW preserva os círculos; a digestão rigorosa com exonuclease verificada por qPCR/gelo remove o fundo linear; a RCA cuidadosamente ajustada amplifica os círculos sem inundar a sua biblioteca com concatenados; e o controlo de qualidade disciplinado da biblioteca, juntamente com uma profundidade de sequenciação sensata, transporta sinais fiáveis para a análise. Trate os spike-ins circulares sintéticos, os controlos negativos lineares e os NTCs como obrigatórios. Planeie a validação de leituras longas para candidatos representativos para fixar as junções e estruturas repetitivas.
Se procura um caminho padronizado, RUO, desde a enriquecimento até à preparação da biblioteca e relatórios, Sequenciação de eccDNA da CD Genomics pode apoiar o design do projeto e os entregáveis. Para um contexto mais profundo da plataforma, revisite o Visão geral da Sequenciação de Próxima Geração (Illumina) e o Visão Geral Completa do Sequenciamento de Longas Leituras.
Referências:
- Yu X, et al., "Visão geral do Circle-seq e quantificação de spike-in" (2023) — métodos e métricas de spike-in: Yu et al., 2023 — Circle‑seq (PMC10788182).
- Li Y, et al., "Deteção de eccDNA em comprimento total (FLED)" (2023) — validação de leituras longas e limiares de leituras de suporte: Li et al., 2023 — FLED (PMC10632013).
- Jiang Z, et al., "Circle‑seq profundidade e considerações de descoberta" (2023) — exemplos de profundidade de sequenciação e contexto do conjunto de dados: Jiang et al., 2023 (PMC10300174).
- Hong J, et al., "Extração HMW e atlas de eccDNA" (2024) — Recomendações de extração HMW e taxas de mapeamento: Hong et al., 2024 (PMC10973517).
- Hansen K, et al., "Comparações de purificação para fluxos de trabalho de eccDNA" (2023) — purificações baseadas em beads vs. purificações alternativas: Hansen et al., 2023 (PMC10523981).
- dos Santos R, et al., notas do protocolo de linearização do mtDNA (2023) — Recomendações de pré-linearização do CRISPR‑Cas9: dos Santos et al., 2023 (PMC10495552).
- Zhuang L, et al., "Métricas de pontuação de círculo e continuidade de cobertura" (2024) — limiares de pontuação/filtro e métricas de continuidade: Zhuang et al., 2024 (PMC10948907).
- Chen Q, et al., exemplo de eccDNA urinário (2025) — notas sobre aplicação e deteção: Chen et al., 2025 (PMC12627897).
- Frontiers in Genetics revisão de métodos (2024) — visão geral das escolhas de extração e enriquecimento de eccDNA: Frontiers in Genetics revisão de métodos (2024).
- Qiu et al., "DNA circular extracromossómica como um novo biomarcador" (PMC) — contexto mais amplo e revisão: Qiu et al. (revisão) (PMC).
- Ye et al., utilização de PSD e notas metodológicas (2023) — exemplos de aplicações de PSD em Circle‑seq: Ye et al., 2023 (PMC10670553).
- Lin et al., descrições de PSD e enriquecimento (2024) — exemplos adicionais de utilização de PSD: Lin et al., 2024 (PMC11606223).
Autor
Yang H. — Cientista Sénior, CD Genomics; Universidade da Florida.
Yang é um investigador em genómica com mais de 10 anos de experiência em investigação em genética, biologia molecular e celular, fluxos de trabalho de sequenciação e análise bioinformática. Habilidoso tanto em técnicas laboratoriais como na interpretação de dados, Yang apoia o design de estudos RUO e projetos baseados em NGS.