
Em cenários de investigação típicos, a metilação do DNA refere-se predominantemente a um processo de metilação que ocorre no quinto átomo de carbono da citosina em dinucleótidos CpG, resultando na formação de 5-metilcitosina (5-mC). Esta constitui a principal forma de metilação do DNA em eucariotos, incluindo plantas e animais, e serve como a única forma em mamíferos. Tendo em vista a relativa estabilidade da metilação do DNA como um estado de modificação, esta pode ser herdada pelo DNA da prole através do processo de replicação do DNA, representando assim um mecanismo significativo de herança epigenética.
Assim, a distribuição de 5-metilcitosina (ou metiloma) por todo o genoma tem atraído considerável atenção. Sequenciação de Bisulfito de Genoma Inteiro (WGBS) é um método que utiliza o tratamento com bisulfito para converter citosinas (C) não metiladas no genoma, distinguindo citosinas metiladas de não metiladas, associado à tecnologia de sequenciação de alto rendimento para determinar o estado de metilação em locais CpG/CHG/CHH. Foi aplicado com sucesso na análise de metilomas em várias ramificações da filogenia eucariótica, em múltiplas espécies e na análise de metilomas em células-tronco embrionárias humanas, células-tronco pluripotentes induzidas, células mononucleares do sangue periférico, células cancerígenas do cólon, entre outras. Estes WGBS os conjuntos de dados têm proporcionado numerosas descobertas inacessíveis por outros métodos. Com a diminuição do custo de sequenciação, o WGBS está a tornar-se cada vez mais o método preferido na investigação. No entanto, o tradicional WGBS os métodos apresentam desafios significativos para amostras de baixo input. À medida que as aplicações da análise de metilação continuam a expandir-se, desde estudos no desenvolvimento embrionário até aplicações clínicas como a triagem precoce de tumores, há uma crescente demanda pela construção de bibliotecas de metilação a partir de amostras de baixo input.
Serviços que pode estar interessado em
Estudos epigenéticos confirmaram que a modificação da metilação do DNA em regiões específicas de genes desempenha um papel importante na conformação dos cromossomas e na regulação da expressão gênica. A metilação dos resíduos de citosina do DNA no C5 (5euC) é uma marca epigenética comum em muitos eucariotos e é amplamente encontrada em CpG ou CpHpG (H=A, T, C). Existem principalmente três abordagens, incluindo digestão por endonuclease, enriquecimento por afinidade e conversão por bisulfito (Tabela 1). Quase todas as abordagens de análise de metilação de DNA específicas de sequência requerem um tratamento dependente de metilação antes da amplificação ou hibridização para manter a fidelidade. Várias técnicas de biologia molecular, como sequenciação de nova geração (NGS), são subsequentemente realizadas para detectar 5euResíduos de C.
Tabela 1. Principais princípios da análise de metilação baseada em NGS.
| Digestão enzimática | Enriquecimento de afinidade | Bissulfito de sódio | |
| Princípios | Algumas enzimas de restrição, como HpaII e SmaEu, sou inibido por 5.euC no CpG. | O enriquecimento por afinidade utiliza anticorpos específicos para 5.euProteínas de ligação a metilo C com afinidade para o perfilamento da metilação do DNA. | O bisulfito de sódio transforma quimicamente a citosina não metilada em uracilo, permitindo assim a detecção de metilação. |
| Exemplo de método | Methyl-seq *MCA-seq *HELP-seq *MSCC |
*MeDIP-seq *MIRA-seq |
*RRBS *WGBS *BSPP |
*MCA: amplificação de ilhas CpG metiladas; *HELP: enriquecimento de fragmentos pequenos HpaII por PCR mediada por ligadura; *MSCC: contagem de cortes sensíveis à metilação; *MeDIP-seqimunoprecipitação de DNA metilado; *MIRA: ensaio de recuperação de ilhas CpG metiladas; *RRBSsequenciação de bisulfito com representação reduzida; *WGBS: sequenciação de bisulfito do genoma completo; *BSPP: sondas de bloqueio de bisulfito.
Várias metodologias foram desenvolvidas para avaliar os níveis de metilação do DNA em amostras. A conversão por bisulfito provocou uma revolução na análise da metilação do genoma na década de 1990. Considerada o "padrão ouro" para a determinação dos níveis de metilação, WGBS funções com base na análise de metilação baseada em bisulfito. Esta técnica inicia-se com o tratamento do DNA da amostra com bisulfito, que converte com sucesso as bases de citosina não metiladas em uracilo, deixando as citosinas metiladas inalteradas. A amplificação subsequente por PCR faz com que o uracilo se transponha em timina, distinguindo-o das citosinas metiladas originais. Quando combinado com tecnologia de sequenciação de alto rendimento, este método permite o mapeamento de um perfil de metilação de DNA de genoma completo com resolução de uma única base.
Figura 1. Conversão de bisulfito e amplificação por PCR antes da sequenciação de DNA.
WGBS é uma tecnologia de sequenciação de alta resolução utilizada para detectar o estado de metilação das bases de citosina em moléculas de DNA. No âmbito do WGBS, a amostra de DNA é submetida primeiro a um tratamento com bisulfito, transformando as citosinas não metiladas em uracilo, enquanto as citosinas metiladas permanecem inalteradas. Através da análise de sequenciação, podemos determinar o estado de metilação de cada base de citosina. WGBS, como um método de pesquisa de grande importância neste campo, aplica uma combinação de tratamento com bisulfito e tecnologias de sequenciação de próxima/terceira geração (principalmente, sequenciação shotgun) para estudar a metilação do DNA a nível genómico.
Em resumo, os passos básicos de WGBS inclui extração de DNA, conversão com bisulfito, preparação de biblioteca, sequenciação e análise bioinformática. Aqui usamos o Illumina HiSeq como nosso exemplo para ilustrar o fluxo de trabalho da WGBS.
Figura 2. O fluxo de trabalho do sequenciamento de bisulfito de genoma completo.
Figura 3. O fluxo de trabalho do sequenciamento de bisulfito de todo o genoma (Khanna et al. 2013).
Em primeiro lugar, aproximadamente 1-5 mg de amostras de tecido coletadas de humanos, animais, plantas ou microrganismos são preparadas para DNA. Em geral, as amostras para sequenciação de bisulfito de genoma completo precisam atender às seguintes quatro características.
i. Eucariontes;
ii. Hipometilação (como mostrado na Figura 4, estudos demonstraram que, uma vez que o número de locais CpG numa região aumenta, os dados de sequenciação de WGBS começam a diminuir);
iii. O seu genoma de referência foi montado pelo menos ao nível do andaime;
iv. Anotações genómicas relativamente completas. E, em seguida, aplicar um kit adequado para extrair DNA de alta pureza e de alto peso molecular. O DNA extraído deve ter uma massa não inferior a 5 μg, uma concentração não inferior a 50 ng/μl, e um OD260/280 entre 1,8 e 2,0.
Figura 4. A tecnologia WGBS convencional tem baixa cobertura de locais de metilação (Raine et al., 2016)
A conversão por bisulfito é considerada o "padrão ouro" para a análise de metilação do DNA, cujos princípios estão ilustrados na Figura 5. Para este método, a degradação do DNA induzida por BS pode levar à depleção de regiões genómicas enriquecidas em citosinas não metiladas. Portanto, é importante avaliar a quantidade de degradação do DNA nas condições de reação, e como isso afeta o amplicão desejado também deve ser considerado. Olova et al. (2018) descobriram que a degradação do DNA é forte em protocolos de conversão por bisulfito que utilizam alta desnaturação ou alta molaridade de bisulfito. Existem vários kits disponíveis no mercado (Tabela 2).
Figura 5. Deaminação de citosina mediada por bisulfito (Hayatsu et al. 2004).
Tabela 2. Protocolos e parâmetros de conversão de bisulfito.
| Kits | Desnaturação | Temperatura de conversão | Tempo de incubação |
| Zymo EZ Kit de Metilação de DNA Lightning | Baseado em calor; 99 °C Base alcalina; 37 °C |
65 °C | 90 minutos |
| Kit de Bisulfito EpiTect (Qiagen) | Baseado em calor; 99 °C | 55 °C | 10 horas |
| Kit de Metilação de DNA EZ (Zymo Research) | Base alcalina; 37 °C | 50 °C | 12-16 horas |
Tome o Kit EpiGnome™ Methyl-Seq (Epicentre) como exemplo (conforme mostrado na Figura 6), o DNA de cadeia simples tratado com bisulfito é primado de forma aleatória utilizando uma polimerase capaz de ler nucleotídeos de uracilo, para sintetizar DNA contendo uma etiqueta de sequência específica. A extremidade 3' da nova cadeia de DNA sintetizada é então rotulada seletivamente com uma segunda sequência específica, permitindo assim a obtenção de uma molécula de DNA com dois marcadores e uma etiqueta de sequência conhecida nas extremidades 5' e 3'. Os adaptadores Illumina P7 e P5 são posteriormente adicionados por PCR nas extremidades 5 e 3 antes da sequenciação do DNA.
Figura 6. Fluxo de trabalho para o Kit EpiGnome™ Methyl-Seq.
A tecnologia de sequenciação Hiseq, um método de sequenciação inovador baseado na sequenciação por síntese (SBS), é amplamente aplicada para WGBSA amplificação em ponte numa célula de fluxo é alcançada através do uso de uma matriz de moléculas únicas. Uma vez que a nova técnica de bloqueio reversível pode sintetizar apenas uma base de cada vez e rotular o fluoróforo, o laser correspondente é utilizado para excitar o fluoróforo, e a luz de excitação pode ser capturada para ler a informação da base. A estratégia de pares de extremidades de 150 bp é tipicamente empregue em WGBS para sequenciar bibliotecas de DNA tratadas com bisulfito de inserção de 250-300 bp. Além do Illumina HiSeq, PacBio SMRT, NanoporosidadeA Roche 454 e outras plataformas da Illumina também são frequentemente utilizadas para este fim.
Uma série de análises pode ser realizada para os resultados de sequenciação. Cinco tipos principais de análise de informação estão listados na Tabela 3. Além disso, podem ser realizadas análises de densidade de metilação, análise de regiões diferencialmente metiladas (DMR), anotação de DMR e análise de enriquecimento (GO/KEGG) e análise de agrupamento. Os recursos bioinformáticos comuns de WGBS inclua BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA e o Portal de Dados TCGA.
Tabela 3. Principais tipos de análise de dados WGBS.
| Tipo | Detalhes |
| Alinhamento contra o genoma de referência | Ferramentas, como o software SOAP, são utilizadas para comparar as leituras com a sequência do genoma de referência, e apenas as leituras alinhadas serão usadas para a análise da informação de metilação. Alinhe as leituras permitindo correspondências C-C e discrepâncias C-T. |
| mC a chamar | Determine a posição de mC em todo o genoma. As razões de mC são calculadas considerando a qualidade da leitura e as probabilidades de mapeamento multi-locus. Descarte alinhamentos de baixa probabilidade que tenham uma baixa fiabilidade de alinhamento. |
| Análise de profundidade e cobertura de sequência | Uma imagem que reflete a relação entre a cobertura genética e a profundidade de sequenciação determina se a descoberta de metilação pode ser feita com um determinado grau de confiança em posições de base específicas. |
| Análise do nível de metilação | O nível de metilação de cada base C metilada é calculado da seguinte forma: 100*leituras/leitura total. O nível médio de metilação em todo o genoma reflete as características gerais do perfil de metilação genómica. |
| Tendências globais do metiloma | A razão de distribuição de CG, CHGG e CHH nas bases C metiladas reflete, até certo ponto, as características dos mapas de metilação do genoma completo de espécies específicas. |
Vantagens:
Limitações:
(1) Estudos Epigenéticos: WGBS serve como uma ferramenta instrumental para investigar variações de metilação do DNA entre diferentes tipos de células, tecidos ou estágios de desenvolvimento, desvendando assim o papel das alterações epigenéticas nos processos biológicos. Isso melhora a nossa compreensão dos mecanismos envolvidos na regulação da expressão génica, na diferenciação celular, no desenvolvimento e na ocorrência de doenças.
(2) Pesquisa de Doenças: Na exploração de doenças, WGBS desempenha um papel fundamental. Os investigadores podem contrastar padrões de metilação do DNA em estados saudáveis e afetados por doenças, com o objetivo de identificar alterações de metilação relacionadas à iniciação e progressão da doença. Tais investigações têm uma importância vital para estudos relacionados ao câncer, distúrbios neurológicos, doenças cardiovasculares, entre outros.
(3) Diferenças Individuais e Genética PopulacionalA WGBS também facilita a investigação sobre as variações de metilação do DNA entre indivíduos, ajudando a compreender a variação genética da metilação dentro das populações. Isso avança a análise da base genética da metilação, além do seu papel na determinação da suscetibilidade à saúde de um indivíduo.
(4) Estudos de Impacto Ambiental: Fatores ambientais externos, como nutrição, toxinas, medicamentos, etc., podem potencialmente impactar a metilação do DNA. O WGBS ajuda os investigadores a avaliar como essas forças ambientais podem modificar a expressão génica através da metilação, influenciando assim a funcionalidade fisiológica de um indivíduo e o risco de doenças.
(5) Evolutivo Pesquisa: Além disso, o WGBS pode ser utilizado para comparar padrões de metilação do DNA entre diferentes espécies, lançando luz sobre o papel da metilação na evolução. Isso pode contribuir para a nossa compreensão de como a metilação contribui para a adaptação das espécies e a geração de diversidade.
WGBS é uma tecnologia de sequenciação de alto rendimento utilizada para a análise de metilação do DNA. Pode realizar a análise de metilação em todo o genoma, cobrindo cada base de citosina e identificando o seu estado de metilação, tornando o WGBS o padrão ouro para a pesquisa de metilação do DNA, capaz de fornecer informações de metilação de alta resolução e em profundidade. Sequenciação de Bisulfito com Representação Reduzida (RRBS) é um método de sequenciação de metilação de 'representação reduzida' que sequencia seletivamente áreas específicas no genoma ricas em ilhas CpG e outras regiões de alta metilação, em oposição a WGBSApesar de o RRBS ter uma cobertura mais reduzida, é mais rentável e adequado para estudos de amostras em grande escala, pois requer uma menor profundidade de sequenciação.
Uma análise comparativa aprofundada entre Sequenciação de Bisulfito de Genoma Inteiro (WGBS) e a Sequência de Bisulfito com Representação Reduzida (RRBS) pode elucidar as suas respetivas forças e limitações, ajudando os investigadores a selecionar a abordagem ótima que se alinha com os seus objetivos de investigação. Por exemplo, se for necessária uma compreensão abrangente do estado de metilação de cada base de citosina dentro do genoma no estudo, WGBS pode ser uma escolha superior. Por outro lado, se a pesquisa enfatiza regiões de metilação específicas ou necessita do processamento de um grande número de amostras, o RRBS pode potencialmente oferecer uma solução mais económica. Além disso, a justaposição destas duas técnicas pode contribuir para uma melhor avaliação do seu desempenho e aplicabilidade. Ao contrastar WGBS e RRBS em termos de volume de dados, custo, cobertura, resolução, etc., os investigadores podem obter uma compreensão mais rica das vantagens e desvantagens inerentes a cada método. Por sua vez, este conhecimento pode orientar o desenho experimental e a análise de dados de uma forma mais perspicaz.
Tabela 4. Diferença entre WGBS e RRBS
| Recurso | WGBS | RRBS |
| Cobertura Alvo | Analisa todo o genoma, cobrindo cada base C para determinar o seu estado de metilação. | Adota uma abordagem de "representação reduzida", sequenciando seletivamente regiões específicas ricas em ilhas CpG e outras áreas altamente metiladas, oferecendo uma cobertura mais restrita, mas sendo mais económica e adequada para análises de amostras em grande escala. |
| Volume de Dados e Custo | Gera volumes de dados maiores, portanto custos mais elevados. | Produz volumes de dados relativamente menores, levando a custos mais baixos. |
| Resolução e Profundidade de Cobertura | Fornece maior resolução e cobertura mais profunda, capaz de detectar o estado de metilação de cada base C no genoma. | Oferece uma resolução e profundidade de cobertura comparáveis, suficientes para detectar o estado de metilação de regiões selecionadas. |
| Manipulação de Amostras e Desenho Experimental | Requer mais material de DNA inicial, não é adequado para amostras de baixo input ou amostras clínicas preciosas. | Requer menos material de DNA inicial, adequado para análises de amostras de baixo input e estudos de amostras em grande escala. |
Referências: