Princípios e Fluxo de Trabalho da Sequenciação de Bisulfito de Todo o Genoma

Introdução ao WGBS

Em cenários de investigação típicos, a metilação do DNA refere-se predominantemente a um processo de metilação que ocorre no quinto átomo de carbono da citosina em dinucleótidos CpG, resultando na formação de 5-metilcitosina (5-mC). Esta constitui a principal forma de metilação do DNA em eucariotos, incluindo plantas e animais, e serve como a única forma em mamíferos. Tendo em vista a relativa estabilidade da metilação do DNA como um estado de modificação, esta pode ser herdada pelo DNA da prole através do processo de replicação do DNA, representando assim um mecanismo significativo de herança epigenética.

Assim, a distribuição de 5-metilcitosina (ou metiloma) por todo o genoma tem atraído considerável atenção. Sequenciação de Bisulfito de Genoma Inteiro (WGBS) é um método que utiliza o tratamento com bisulfito para converter citosinas (C) não metiladas no genoma, distinguindo citosinas metiladas de não metiladas, associado à tecnologia de sequenciação de alto rendimento para determinar o estado de metilação em locais CpG/CHG/CHH. Foi aplicado com sucesso na análise de metilomas em várias ramificações da filogenia eucariótica, em múltiplas espécies e na análise de metilomas em células-tronco embrionárias humanas, células-tronco pluripotentes induzidas, células mononucleares do sangue periférico, células cancerígenas do cólon, entre outras. Estes WGBS os conjuntos de dados têm proporcionado numerosas descobertas inacessíveis por outros métodos. Com a diminuição do custo de sequenciação, o WGBS está a tornar-se cada vez mais o método preferido na investigação. No entanto, o tradicional WGBS os métodos apresentam desafios significativos para amostras de baixo input. À medida que as aplicações da análise de metilação continuam a expandir-se, desde estudos no desenvolvimento embrionário até aplicações clínicas como a triagem precoce de tumores, há uma crescente demanda pela construção de bibliotecas de metilação a partir de amostras de baixo input.

Princípios do WGBS

Estudos epigenéticos confirmaram que a modificação da metilação do DNA em regiões específicas de genes desempenha um papel importante na conformação dos cromossomas e na regulação da expressão gênica. A metilação dos resíduos de citosina do DNA no C5 (5euC) é uma marca epigenética comum em muitos eucariotos e é amplamente encontrada em CpG ou CpHpG (H=A, T, C). Existem principalmente três abordagens, incluindo digestão por endonuclease, enriquecimento por afinidade e conversão por bisulfito (Tabela 1). Quase todas as abordagens de análise de metilação de DNA específicas de sequência requerem um tratamento dependente de metilação antes da amplificação ou hibridização para manter a fidelidade. Várias técnicas de biologia molecular, como sequenciação de nova geração (NGS), são subsequentemente realizadas para detectar 5euResíduos de C.

Tabela 1. Principais princípios da análise de metilação baseada em NGS.

Digestão enzimática Enriquecimento de afinidade Bissulfito de sódio
Princípios Algumas enzimas de restrição, como HpaII e SmaEu, sou inibido por 5.euC no CpG. O enriquecimento por afinidade utiliza anticorpos específicos para 5.euProteínas de ligação a metilo C com afinidade para o perfilamento da metilação do DNA. O bisulfito de sódio transforma quimicamente a citosina não metilada em uracilo, permitindo assim a detecção de metilação.
Exemplo de método Methyl-seq
*MCA-seq
*HELP-seq
*MSCC
*MeDIP-seq
*MIRA-seq
*RRBS
*WGBS
*BSPP

*MCA: amplificação de ilhas CpG metiladas; *HELP: enriquecimento de fragmentos pequenos HpaII por PCR mediada por ligadura; *MSCC: contagem de cortes sensíveis à metilação; *MeDIP-seqimunoprecipitação de DNA metilado; *MIRA: ensaio de recuperação de ilhas CpG metiladas; *RRBSsequenciação de bisulfito com representação reduzida; *WGBS: sequenciação de bisulfito do genoma completo; *BSPP: sondas de bloqueio de bisulfito.

Várias metodologias foram desenvolvidas para avaliar os níveis de metilação do DNA em amostras. A conversão por bisulfito provocou uma revolução na análise da metilação do genoma na década de 1990. Considerada o "padrão ouro" para a determinação dos níveis de metilação, WGBS funções com base na análise de metilação baseada em bisulfito. Esta técnica inicia-se com o tratamento do DNA da amostra com bisulfito, que converte com sucesso as bases de citosina não metiladas em uracilo, deixando as citosinas metiladas inalteradas. A amplificação subsequente por PCR faz com que o uracilo se transponha em timina, distinguindo-o das citosinas metiladas originais. Quando combinado com tecnologia de sequenciação de alto rendimento, este método permite o mapeamento de um perfil de metilação de DNA de genoma completo com resolução de uma única base.

Figure 1. Bisulfite Treatment and PCR Amplification Preceding DNA Sequencing.Figura 1. Conversão de bisulfito e amplificação por PCR antes da sequenciação de DNA.

WGBS é uma tecnologia de sequenciação de alta resolução utilizada para detectar o estado de metilação das bases de citosina em moléculas de DNA. No âmbito do WGBS, a amostra de DNA é submetida primeiro a um tratamento com bisulfito, transformando as citosinas não metiladas em uracilo, enquanto as citosinas metiladas permanecem inalteradas. Através da análise de sequenciação, podemos determinar o estado de metilação de cada base de citosina. WGBS, como um método de pesquisa de grande importância neste campo, aplica uma combinação de tratamento com bisulfito e tecnologias de sequenciação de próxima/terceira geração (principalmente, sequenciação shotgun) para estudar a metilação do DNA a nível genómico.

Fluxo de trabalho de WGBS

Em resumo, os passos básicos de WGBS inclui extração de DNA, conversão com bisulfito, preparação de biblioteca, sequenciação e análise bioinformática. Aqui usamos o Illumina HiSeq como nosso exemplo para ilustrar o fluxo de trabalho da WGBS.

Figure 2. Overview of the Whole Genome Bisulfite Sequencing Workflow.Figura 2. O fluxo de trabalho do sequenciamento de bisulfito de genoma completo.

Figure 3. The Whole Genome Bisulfite Sequencing Procedure. (Khanna et al. Epignome[trade] methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis. 2013)Figura 3. O fluxo de trabalho do sequenciamento de bisulfito de todo o genoma (Khanna et al. 2013).

  • Extração de DNA

Em primeiro lugar, aproximadamente 1-5 mg de amostras de tecido coletadas de humanos, animais, plantas ou microrganismos são preparadas para DNA. Em geral, as amostras para sequenciação de bisulfito de genoma completo precisam atender às seguintes quatro características.

i. Eucariontes;

ii. Hipometilação (como mostrado na Figura 4, estudos demonstraram que, uma vez que o número de locais CpG numa região aumenta, os dados de sequenciação de WGBS começam a diminuir);

iii. O seu genoma de referência foi montado pelo menos ao nível do andaime;

iv. Anotações genómicas relativamente completas. E, em seguida, aplicar um kit adequado para extrair DNA de alta pureza e de alto peso molecular. O DNA extraído deve ter uma massa não inferior a 5 μg, uma concentração não inferior a 50 ng/μl, e um OD260/280 entre 1,8 e 2,0.

Figure 4. Traditional WGBS Technology Exhibits Limited Methylation Site Coverage. (Raine et al., Splinted ligation adapter tagging (splat), a novel library preparation method for whole genome bisulphite sequencing. 2016)Figura 4. A tecnologia WGBS convencional tem baixa cobertura de locais de metilação (Raine et al., 2016)

  • Conversão de Bisulfito

A conversão por bisulfito é considerada o "padrão ouro" para a análise de metilação do DNA, cujos princípios estão ilustrados na Figura 5. Para este método, a degradação do DNA induzida por BS pode levar à depleção de regiões genómicas enriquecidas em citosinas não metiladas. Portanto, é importante avaliar a quantidade de degradação do DNA nas condições de reação, e como isso afeta o amplicão desejado também deve ser considerado. Olova et al. (2018) descobriram que a degradação do DNA é forte em protocolos de conversão por bisulfito que utilizam alta desnaturação ou alta molaridade de bisulfito. Existem vários kits disponíveis no mercado (Tabela 2).

Figure 5. Bisulfite-Induced Deamination of Cytosine. (Hayatsu et al. DNA methylation analysis: speedup of bisulfite-mediated deamination of cytosine in the genomic sequencing procedure. 2004)Figura 5. Deaminação de citosina mediada por bisulfito (Hayatsu et al. 2004).

Tabela 2. Protocolos e parâmetros de conversão de bisulfito.

Kits Desnaturação Temperatura de conversão Tempo de incubação
Zymo EZ Kit de Metilação de DNA Lightning Baseado em calor; 99 °C
Base alcalina; 37 °C
65 °C 90 minutos
Kit de Bisulfito EpiTect (Qiagen) Baseado em calor; 99 °C 55 °C 10 horas
Kit de Metilação de DNA EZ (Zymo Research) Base alcalina; 37 °C 50 °C 12-16 horas
  • Preparação da Biblioteca

Tome o Kit EpiGnome™ Methyl-Seq (Epicentre) como exemplo (conforme mostrado na Figura 6), o DNA de cadeia simples tratado com bisulfito é primado de forma aleatória utilizando uma polimerase capaz de ler nucleotídeos de uracilo, para sintetizar DNA contendo uma etiqueta de sequência específica. A extremidade 3' da nova cadeia de DNA sintetizada é então rotulada seletivamente com uma segunda sequência específica, permitindo assim a obtenção de uma molécula de DNA com dois marcadores e uma etiqueta de sequência conhecida nas extremidades 5' e 3'. Os adaptadores Illumina P7 e P5 são posteriormente adicionados por PCR nas extremidades 5 e 3 antes da sequenciação do DNA.

Figure 6. EpiGnomeTM Methyl-Seq Kit Workflow.Figura 6. Fluxo de trabalho para o Kit EpiGnome™ Methyl-Seq.

  • Sequenciação

A tecnologia de sequenciação Hiseq, um método de sequenciação inovador baseado na sequenciação por síntese (SBS), é amplamente aplicada para WGBSA amplificação em ponte numa célula de fluxo é alcançada através do uso de uma matriz de moléculas únicas. Uma vez que a nova técnica de bloqueio reversível pode sintetizar apenas uma base de cada vez e rotular o fluoróforo, o laser correspondente é utilizado para excitar o fluoróforo, e a luz de excitação pode ser capturada para ler a informação da base. A estratégia de pares de extremidades de 150 bp é tipicamente empregue em WGBS para sequenciar bibliotecas de DNA tratadas com bisulfito de inserção de 250-300 bp. Além do Illumina HiSeq, PacBio SMRT, NanoporosidadeA Roche 454 e outras plataformas da Illumina também são frequentemente utilizadas para este fim.

  • Análise de Dados

Uma série de análises pode ser realizada para os resultados de sequenciação. Cinco tipos principais de análise de informação estão listados na Tabela 3. Além disso, podem ser realizadas análises de densidade de metilação, análise de regiões diferencialmente metiladas (DMR), anotação de DMR e análise de enriquecimento (GO/KEGG) e análise de agrupamento. Os recursos bioinformáticos comuns de WGBS inclua BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA e o Portal de Dados TCGA.

Tabela 3. Principais tipos de análise de dados WGBS.

Tipo Detalhes
Alinhamento contra o genoma de referência Ferramentas, como o software SOAP, são utilizadas para comparar as leituras com a sequência do genoma de referência, e apenas as leituras alinhadas serão usadas para a análise da informação de metilação. Alinhe as leituras permitindo correspondências C-C e discrepâncias C-T.
mC a chamar Determine a posição de mC em todo o genoma. As razões de mC são calculadas considerando a qualidade da leitura e as probabilidades de mapeamento multi-locus. Descarte alinhamentos de baixa probabilidade que tenham uma baixa fiabilidade de alinhamento.
Análise de profundidade e cobertura de sequência Uma imagem que reflete a relação entre a cobertura genética e a profundidade de sequenciação determina se a descoberta de metilação pode ser feita com um determinado grau de confiança em posições de base específicas.
Análise do nível de metilação O nível de metilação de cada base C metilada é calculado da seguinte forma: 100*leituras/leitura total. O nível médio de metilação em todo o genoma reflete as características gerais do perfil de metilação genómica.
Tendências globais do metiloma A razão de distribuição de CG, CHGG e CHH nas bases C metiladas reflete, até certo ponto, as características dos mapas de metilação do genoma completo de espécies específicas.

Vantagens e Limitações do WGBS

Vantagens:

  • Resolução de Base Única: O método fornece uma análise precisa até à resolução de base única, permitindo a determinação exata do estado de metilação de cada base de citosina. É considerado o "padrão ouro" na investigação dos níveis de metilação.
  • Alta Taxa de Conversão na Construção de Bibliotecas de Metilação: A taxa média de conversão através da sequenciação com bisulfito é superior a 99%, com rigorosas medidas de controlo de qualidade implementadas durante a construção da biblioteca.
  • Ampla Gama de Aplicações: O método é aplicável à investigação de metilação em todas as espécies com genomas de referência conhecidos.
  • Cobertura Genómica Completa: Maximiza a aquisição de informações abrangentes de metilação do genoma completo, permitindo um mapeamento preciso da paisagem de metilação.
  • Epigenómico Pesquisa: Tem um potencial significativo para estudar a especificidade espaciotemporal no campo da epigenética.

Limitações:

  • Volume de dados grande necessário (recomendado pelo menos 30x de cobertura).
  • Dependência de um genoma de referência.
  • Conteúdo base de AT elevado após tratamento, o que pode impactar a sequenciação e análise.
  • Susceptibilidade a danos no DNA durante o tratamento com bisulfito.

Aplicações do WGBS

(1) Estudos Epigenéticos: WGBS serve como uma ferramenta instrumental para investigar variações de metilação do DNA entre diferentes tipos de células, tecidos ou estágios de desenvolvimento, desvendando assim o papel das alterações epigenéticas nos processos biológicos. Isso melhora a nossa compreensão dos mecanismos envolvidos na regulação da expressão génica, na diferenciação celular, no desenvolvimento e na ocorrência de doenças.

(2) Pesquisa de Doenças: Na exploração de doenças, WGBS desempenha um papel fundamental. Os investigadores podem contrastar padrões de metilação do DNA em estados saudáveis e afetados por doenças, com o objetivo de identificar alterações de metilação relacionadas à iniciação e progressão da doença. Tais investigações têm uma importância vital para estudos relacionados ao câncer, distúrbios neurológicos, doenças cardiovasculares, entre outros.

(3) Diferenças Individuais e Genética PopulacionalA WGBS também facilita a investigação sobre as variações de metilação do DNA entre indivíduos, ajudando a compreender a variação genética da metilação dentro das populações. Isso avança a análise da base genética da metilação, além do seu papel na determinação da suscetibilidade à saúde de um indivíduo.

(4) Estudos de Impacto Ambiental: Fatores ambientais externos, como nutrição, toxinas, medicamentos, etc., podem potencialmente impactar a metilação do DNA. O WGBS ajuda os investigadores a avaliar como essas forças ambientais podem modificar a expressão génica através da metilação, influenciando assim a funcionalidade fisiológica de um indivíduo e o risco de doenças.

(5) Evolutivo Pesquisa: Além disso, o WGBS pode ser utilizado para comparar padrões de metilação do DNA entre diferentes espécies, lançando luz sobre o papel da metilação na evolução. Isso pode contribuir para a nossa compreensão de como a metilação contribui para a adaptação das espécies e a geração de diversidade.

Diferença entre WGBS e RRBS

WGBS é uma tecnologia de sequenciação de alto rendimento utilizada para a análise de metilação do DNA. Pode realizar a análise de metilação em todo o genoma, cobrindo cada base de citosina e identificando o seu estado de metilação, tornando o WGBS o padrão ouro para a pesquisa de metilação do DNA, capaz de fornecer informações de metilação de alta resolução e em profundidade. Sequenciação de Bisulfito com Representação Reduzida (RRBS) é um método de sequenciação de metilação de 'representação reduzida' que sequencia seletivamente áreas específicas no genoma ricas em ilhas CpG e outras regiões de alta metilação, em oposição a WGBSApesar de o RRBS ter uma cobertura mais reduzida, é mais rentável e adequado para estudos de amostras em grande escala, pois requer uma menor profundidade de sequenciação.

Uma análise comparativa aprofundada entre Sequenciação de Bisulfito de Genoma Inteiro (WGBS) e a Sequência de Bisulfito com Representação Reduzida (RRBS) pode elucidar as suas respetivas forças e limitações, ajudando os investigadores a selecionar a abordagem ótima que se alinha com os seus objetivos de investigação. Por exemplo, se for necessária uma compreensão abrangente do estado de metilação de cada base de citosina dentro do genoma no estudo, WGBS pode ser uma escolha superior. Por outro lado, se a pesquisa enfatiza regiões de metilação específicas ou necessita do processamento de um grande número de amostras, o RRBS pode potencialmente oferecer uma solução mais económica. Além disso, a justaposição destas duas técnicas pode contribuir para uma melhor avaliação do seu desempenho e aplicabilidade. Ao contrastar WGBS e RRBS em termos de volume de dados, custo, cobertura, resolução, etc., os investigadores podem obter uma compreensão mais rica das vantagens e desvantagens inerentes a cada método. Por sua vez, este conhecimento pode orientar o desenho experimental e a análise de dados de uma forma mais perspicaz.

Tabela 4. Diferença entre WGBS e RRBS

Recurso WGBS RRBS
Cobertura Alvo Analisa todo o genoma, cobrindo cada base C para determinar o seu estado de metilação. Adota uma abordagem de "representação reduzida", sequenciando seletivamente regiões específicas ricas em ilhas CpG e outras áreas altamente metiladas, oferecendo uma cobertura mais restrita, mas sendo mais económica e adequada para análises de amostras em grande escala.
Volume de Dados e Custo Gera volumes de dados maiores, portanto custos mais elevados. Produz volumes de dados relativamente menores, levando a custos mais baixos.
Resolução e Profundidade de Cobertura Fornece maior resolução e cobertura mais profunda, capaz de detectar o estado de metilação de cada base C no genoma. Oferece uma resolução e profundidade de cobertura comparáveis, suficientes para detectar o estado de metilação de regiões selecionadas.
Manipulação de Amostras e Desenho Experimental Requer mais material de DNA inicial, não é adequado para amostras de baixo input ou amostras clínicas preciosas. Requer menos material de DNA inicial, adequado para análises de amostras de baixo input e estudos de amostras em grande escala.

Referências:

  1. Fraga, M. F., Esteller, M. (2002). Metilação do DNA: um perfil de métodos e aplicações. Biotécnicas, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). Uma Sequência Preliminar do Genoma Neandertal. Ciência, 328(5979), 710–722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Análise de metilação de DNA: aceleração da desaminação mediada por bisulfito da citosina no procedimento de sequenciação genómica. Atas da Academia do Japão,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). PCR específico para metilação: um novo ensaio de PCR para o estado de metilação das ilhas CpG. Atas da Academia Nacional de Ciências dos Estados Unidos da América, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). O DNA metilado está sobre-representado em dados de sequenciação de bisulfito de genoma completo. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Kit de sequenciação de metilo Epignome[trade]: um novo método de preparação de biblioteca pós-conversão de bisulfito para análise de metilação. Métodos da Natureza, 10(10).
  7. Laird, P. W. (2003). O poder e a promessa dos marcadores de metilação do DNA. Nature Reviews Cancer, 3(4), 253–266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). Um levantamento genómico da metilação de DNA no trigo hexaploide. Biologia do Genoma, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Um breve relatório de utilização do sequenciador Illumina HiSeq 2000. Micologia, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Sequenciação de bisulfito de representação reduzida para análise comparativa de metilação de DNA em alta resolução. Pesquisa em Ácidos Nucleicos, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Uma sequência genómica de alta cobertura de um indivíduo denisovano arcaico. Ciência, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Comparação de estratégias de preparação de bibliotecas de sequenciação de bisulfito de genoma completo identifica fontes de viés que afetam os dados de metilação do DNA. Biologia do Genoma, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Marcação de adaptadores de ligadura splintada (splat), um novo método de preparação de bibliotecas para sequenciação de bisulfito de genoma completo. Pesquisa em Ácidos Nucleicos, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Distribuição genómica e variação inter-amostral da metilação não-CpG em diferentes tipos celulares humanos. Plos Genética, 7(12), e1002389.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Fale com os Nossos Cientistas
Sobre o que gostaria de discutir?
Com quem estaremos a falar?

* é um item obrigatório.

Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo