A investigação no campo da epigenética revelou que as modificações de metilação estão frequentemente presentes nos genomas de mamíferos, principalmente na forma de 5mC. Esta modificação ocorre quando o átomo de carbono na posição 5 da citosina C se combina com um grupo metilo (CH3) sob a influência de uma enzima metiltransferase. Tais modificações de metilação demonstraram influenciar a expressão gênica, exercendo assim um controle regulatório sobre o destino celular e, subsequentemente, impactando o início da doença.
Durante as fases iniciais do desenvolvimento da doença, o DNA livre circulante (cfDNA) pode ser libertado através de lise celular autónoma ou pela lise passiva de células doentes reconhecidas pelo sistema imunitário. O cfDNA libertado, até certo ponto, encapsula a informação epigenética relativa à origem da doença. Reconhecer os sinais epigenéticos transportados pelo cfDNA de forma atempada é de importância primordial para a triagem precoce de doenças.
Neste contexto, a mineração de informação epigenética metilada é um componente crucial da investigação relacionada com o cfDNA. A capacidade de discernir e compreender a informação epigenética embutida no cfDNA pode revelar-se instrumental na promoção de métodos de deteção precoce de doenças.
A importância biológica da metilação do DNA foi amplamente explorada através da análise de sequenciação de metilação em todo o genoma ou de genoma simplificado. No entanto, esses métodos enfrentam limitações quando se trata de estudar eficazmente os numerosos elementos regulatórios não codificantes dentro do genoma de mamíferos. Embora a Sequenciação de Bisulfito do Genoma Completo (WGBS) forneça uma cobertura abrangente, é tanto cara quanto relativamente ineficiente. Por outro lado, a Sequenciação de Bisulfito de Representação Reduzida (RRBS) foca em regiões ricas em CpG, mas carece de cobertura de sub-regiões de potenciadores e locais de ligação de CTCF além das ilhas CpG.
Para abordar essas limitações, os investigadores introduziram uma nova abordagem de sequenciação de metilação conhecida como sequenciação de bisulfito de representação reduzida de cfDNA (cfDNA-RRBS). Este método melhora a cobertura de locais de promotores, potenciadores e locais de ligação de CTCF, oferecendo melhores percepções sobre a paisagem regulatória. Notavelmente, o cfDNA-RRBS demonstra compatibilidade com tamanhos de amostra baixos e é aplicável para análise de célula única.
A extração de DNA de tecidos ou células foi seguida de rigoroso controlo de qualidade, envolvendo eletroforese em gel de agarose para avaliar a integridade do DNA da amostra e detectar degradação. A quantidade total de DNA foi quantificada utilizando um fluorómetro Qubit.
(1) Construção da Biblioteca
Após verificações de qualidade bem-sucedidas, 5-10 ng de DNA genómico foram digeridos com a enzima Msp I a 37°C durante 3 horas. O DNA purificado resultante foi ligado com ligase de DNA T4 para formar junções sintéticas de 5'-metilcitosina. O tratamento subsequente com bisulfito converteu Cs não metilados em Us. A biblioteca final foi obtida após amplificação através de primers hexâmeros aleatórios e PCR.
(2) Controlo de Qualidade da Biblioteca
Após a construção da biblioteca, foi realizada uma quantificação preliminar, com diluição da biblioteca para 1 ng/μl. O sistema Agilent 2100 avaliou o tamanho do inserto, garantindo que atendesse às expectativas. Bibliotecas com tamanhos de inserto satisfatórios foram quantificadas com precisão (concentração efetiva >2 nM) utilizando qPCR para garantir a qualidade.
Após a aprovação da inspeção da biblioteca, várias bibliotecas foram agrupadas com base na concentração efetiva e na quantidade de dados necessária para a máquina de destino a jusante. Subsequentemente, foi realizada a sequenciação Illumina.
Os dados brutos a jusante abrangem sequências de junção introduzidas durante a construção da biblioteca e bases de baixa qualidade, necessitando de filtragem para eliminá-las. Este passo é crucial, pois aumenta o número de leituras alinhadas ao genoma, maximizando assim a recuperação de informação. Primers aleatórios são excisados das bibliotecas cfDNA-RRBS devido à sua estrutura específica.
Após a filtragem dos dados brutos, é realizada uma avaliação das taxas de erro de sequenciação e um exame da distribuição do conteúdo de GC.