Methyl-seq enzimático (EM-seq), como uma tecnologia inovadora e eficiente, está gradualmente a emergir na vanguarda da investigação em genómica, proporcionando uma ferramenta poderosa para a análise aprofundada do mistério de Metilação do DNAO processo de EM-seq é preciso e rigoroso, integrando uma série de operações experimentais avançadas e princípios científicos. Desde o processamento inicial das amostras até a aquisição precisa dos dados finais, cada etapa desempenha um papel fundamental na revelação precisa dos padrões de metilação do DNA.
Neste artigo, o fluxo de trabalho do EM-seq é apresentado em detalhe, incluindo preparação de amostras, modificação química, construção de bibliotecas, etapas de sequenciação e análise de dados, mostrando o seu papel importante e potencial de aplicação na investigação científica em biologia.
Um esquema do fluxo de trabalho EM-seq (Olova et al., 2023)
No experimento EM-seq, a preparação da amostra é um passo inicial muito crítico, e a sua qualidade está diretamente relacionada à precisão e fiabilidade dos resultados experimentais subsequentes. Desde a obtenção de amostras biológicas até ao seu processamento em amostras adequadas para EM-seq, cada passo deve seguir rigorosamente o processo padrão e controlar muitos detalhes para garantir que a informação de metilação do DNA nas amostras possa ser completamente e precisamente retida e analisada.
Tipos e fontes de amostrasExistem vários tipos de amostras que podem ser utilizadas no processo de EM-Seq. A linha celular é uma das amostras mais comuns. Devido às suas características relativamente homogéneas, é muito conveniente estudar as características epigenéticas de tipos celulares específicos. Ao estudar o mecanismo de regulação epigenética das células imunes para compreender o processo de resposta imune, podem ser selecionadas as linhas celulares imunes correspondentes. As amostras de tecido abrangem uma ampla gama, e as amostras de tecido tumoral são muito importantes no estudo epigenético do câncer. Ao analisar modificações epigenéticas, como a metilação do DNA em tecidos tumorais, podemos revelar o mecanismo molecular da ocorrência e desenvolvimento do tumor, e fornecer pistas-chave para o diagnóstico precoce, avaliação do prognóstico e descoberta de alvos terapêuticos do câncer.
Precauções para a recolha e preservação de amostrasTodos os tipos de coleta de amostras devem seguir o método e a oportunidade específicos mais adequados. Para amostras de tecido tumoral, estas devem ser coletadas o mais rapidamente possível após a resseção cirúrgica para evitar a modificação epigenética das células tumorais devido à isquemia e outros fatores. Recomenda-se geralmente que a coleta seja concluída dentro de 30 minutos após a remoção in vitro. Ao coletar, deve-se garantir que o local de coleta seja representativo e tentar evitar a mistura com tecidos normais. As amostras de tecido podem ser rapidamente congeladas em nitrogênio líquido após a coleta para manter a sua modificação epigenética in vivo. As amostras de sangue são geralmente coletadas por meio de coleta intravenosa, utilizando tubos de coleta de sangue que contêm anticoagulantes. Após a coleta de sangue, devem ser gentilmente invertidos e misturados uniformemente a tempo para evitar a coagulação do sangue.
Extração de ácidos nucleicosDe acordo com os diferentes tipos de amostras, devem ser selecionados métodos apropriados de extração de ácidos nucleicos. Para amostras de linhas celulares, o método de adsorção em coluna de sílica gel é comumente utilizado, sendo simples e rápido de operar, podendo completar a extração de ácidos nucleicos em pouco tempo, e é adequado para experimentos de quantidade da Qualcomm. No entanto, este método pode ter uma certa quantidade de perda de ácidos nucleicos durante a eluição. O método de fenol-clorofórmio é frequentemente utilizado para extrair ácidos nucleicos de amostras de tecido. O ácido nucleico extraído por este método tem alta pureza e pode remover efetivamente impurezas como proteínas. No entanto, os passos de operação são complicados, sendo necessários reagentes tóxicos como fenol e clorofórmio, e são exigidas habilidades operacionais dos experimentadores.
Controlo de qualidadeOs principais indicadores incluem concentração, pureza e integridade. A concentração é detectada por um espectrofotómetro. Após a amostra de ácido nucleico ser diluída a um múltiplo adequado, é colocada num espectrofotómetro para detectar a absorbância na comprimento de onda de 260nm, e a concentração de ácido nucleico é calculada de acordo com a lei de Lambert-Beer. A pureza é medida pela razão de A260/A280 e A260/A230. A razão de A260/A280 de amostras de DNA puro deve estar entre 1.8 e 2.0. Se a razão for inferior a 1.8, pode haver contaminação por proteínas. Se a razão for superior a 2.0, pode haver contaminação por RNA. A razão de A260/A230 deve estar entre 2.0 e 2.2. Se a razão for demasiado baixa, pode haver impurezas como polissacarídeos e polifenóis. A integridade do ácido nucleico foi avaliada observando a integridade das bandas através da eletroforese em gel de agarose. Após a amostra de ácido nucleico ser misturada com o tampão de carregamento, é adicionada ao orifício de carregamento do gel de agarose, e a eletroforese é realizada a uma voltagem adequada. Se as bandas forem vagas e difusas, isso indica que a integridade do ácido nucleico é pobre e pode ter sido degradada, o que afetará os resultados experimentais subsequentes do EM-Seq.
O controlo de qualidade do EM-seq e do BS-seq (Wang et al., 2022)
Serviços que pode estar interessado em
Saiba Mais
O processo de modificação química do EM-seq não é uma alteração química direta das bases do DNA no sentido tradicional, mas sim uma série de reações enzimáticas bem concebidas para alcançar uma rotulagem eficiente e uma deteção precisa de locais específicos de metilação. Este método de modificação química abriu um caminho completamente novo e potencial para revelar de forma abrangente e precisa o mistério do grupo de metilação do DNA, o que promoveu significativamente o desenvolvimento da pesquisa relacionada.
No processo EM-Seq, os principais reagentes de modificação química são a β-glucosiltransferase (βGT) e o bisulfito. A βGT é uma enzima que pode adicionar grupos de glicose à 5-metilcitosina (5mC). A sua essência química é proteína, que é formada pela dobra de uma sequência específica de aminoácidos. Na reação, formou-se 5-metilcitosina -β-D-glucosídeo (5mC-β-D-glucopiranosídeo) ao adicionar um grupo β-glucosil ao 5º átomo de carbono da 5mC através de uma reação enzimática, o que alterou a estrutura química da 5mC. A sua função é rotular a 5mC e distingui-la da citosina não modificada, o que estabelece uma base para o tratamento subsequente com bisulfito.
O bisulfito desempenha um papel extremamente importante na EM-Seq. A estrutura química do bisulfito é HSO, que possui uma forte capacidade redutora. Em condições ácidas, o bisulfito pode desaminação com a citosina não modificada. O mecanismo de reação específico é que o íon bisulfito (HSO) reage primeiro com o grupo amino numa posição específica da citosina para formar um produto intermédio. Subsequentemente, sob certas condições, o produto intermédio sofre uma reação de desaminação, e o grupo amino é substituído por um grupo hidroxilo, que é finalmente convertido em uracilo. No entanto, a citosina modificada por metilação não é afetada pela citosina modificada por metilação devido à existência do grupo metilo, que impede a reação de adição entre o bisulfito e o grupo amino na posição específica.
Durante a reação de modificação, os parâmetros de temperatura e tempo têm efeitos significativos na eficiência e especificidade da reação. Os resultados mostram que a taxa de reação do bisulfito com a citosina não modificada é lenta a temperaturas mais baixas. Uma temperatura demasiado alta também pode causar problemas. Quando a temperatura excede 60℃, embora a velocidade da reação seja extremamente rápida, ocorrerá uma sobre-reação. A sobre-reação caracteriza-se pela desaminação não apenas da citosina não modificada, mas também da citosina parcialmente metilada, e a probabilidade de quebra da cadeia de DNA aumenta, o que afetará seriamente a precisão dos resultados de sequenciação subsequentes. A concentração do agente modificador também é muito importante para o efeito da reação. Quando a concentração de bisulfito é demasiado baixa, a reação da citosina não modificada é incompleta, e não é possível rotular todas as bases não modificadas de forma eficaz.
A amplificação MDA no genoma convertido por EM-seq (Wang et al., 2022)
Na fase de construção da biblioteca EM-seq, a fragmentação e a ligação de ligadores são etapas cruciais, que afetam diretamente a qualidade da biblioteca e a precisão e fiabilidade dos resultados de sequenciação subsequentes.
Método de fragmentação físicaA fragmentação ultrassónica consiste em realizar a fragmentação de moléculas de ácidos nucleicos utilizando o efeito mecânico das ondas ultrassónicas. Quando a onda ultrassónica atua sobre a solução de ácidos nucleicos, produz uma vibração de alta frequência, que forma pequenas bolhas na solução. Estas bolhas expandem-se e contraem-se rapidamente sob a ação das ondas ultrassónicas e, finalmente, estouram, resultando em uma forte força de cisalhamento. As moléculas de ácidos nucleicos são quebradas em fragmentos de tamanho apropriado sob a ação dessa força de cisalhamento.
Digestão enzimáticaA digestão enzimática baseia-se no reconhecimento e clivagem de sequências específicas de DNA por enzimas de restrição. As endonucleases de restrição podem reconhecer sequências nucleotídicas específicas em moléculas de DNA de cadeia dupla, que geralmente têm uma estrutura palindromática. Uma vez que a sequência-alvo é reconhecida, a endonuclease de restrição cliva o DNA de cadeia dupla num local específico. Diferentes enzimas de restrição reconhecem diferentes sequências, pelo que podem ser selecionadas enzimas de restrição apropriadas conforme necessário para obter fragmentos de DNA com o intervalo de comprimento esperado.
Localização de ligação do primer universalEsta parte da sequência fornece locais de ligação para primers universais na amplificação PCR subsequente, de modo que todos os fragmentos na biblioteca possam ser efetivamente amplificados na reação de PCR. No processo de sequenciação, o primer de sequenciação é combinado com esta parte da sequência do ligador, orientando assim a reação de sequenciação e garantindo que a informação sequencial do fragmento de ácido nucleico possa ser lida com precisão.
Seleção de ligaseDiferentes tipos de ligase têm diferentes eficiências de ligação e preferências de substrato. A ligase de DNA T4 é uma ligase comum, que pode conectar eficientemente extremidades adesivas e extremidades cegas. Na reação de ligação, selecionar a ligase de DNA T4 com alta atividade e boa estabilidade pode melhorar a eficiência de ligação.
Temperatura e tempo de reaçãoA temperatura e o tempo de reação têm uma influência significativa no efeito de ligação. De um modo geral, uma temperatura mais baixa (por exemplo, 16℃) é benéfica para estabilizar o sistema de reação e melhorar a precisão da ligação, mas o tempo de reação precisa ser relativamente longo (por exemplo, ligação durante a noite); temperaturas mais altas (por exemplo, 25℃) levam a uma velocidade de reação mais rápida, mas podem resultar em uma menor especificidade de ligação. Através de comparações experimentais, constatou-se que a qualidade e o rendimento dos produtos ligados são bons quando a temperatura é de 16℃ durante 12 horas.
Relação molar entre o ligador e o fragmento de ácido nucleicoA proporção molar adequada é a chave para garantir a eficiência da ligação. Quando a proporção molar do ligador para o fragmento de ácido nucleico é demasiado alta, é fácil produzir subprodutos como o dímero do ligador; se a proporção molar for demasiado baixa, a eficiência de ligação é baixa, e alguns fragmentos de ácido nucleico na biblioteca podem não estar ligados ao ligador. O experimento de otimização mostrou que, quando a proporção molar do ligador para o fragmento de ácido nucleico era de 5:1, o efeito de ligação era o melhor.
Bibliotecas EM-seq NA12878 (Vaisvila et al., 2021)
Após uma cuidadosa preparação, como a modificação enzimática de amostras e a construção de bibliotecas, a fase de sequenciação é como um ávido captador de informações. Com a plataforma de sequenciação avançada, fragmentos de DNA com marcadores de metilação são lidos com precisão. Através de uma série de reações bioquímicas complexas e ordenadas e conversão de sinais, a sequência de bases e o estado de metilação correspondente são apresentados em forma digital, o que estabelece uma base sólida para a análise abrangente e aprofundada dos padrões de metilação do DNA e, assim, desvenda o mistério da sua regulação nos processos biológicos.
Carregamento da bibliotecaAo sequenciar a biblioteca EM-Seq na plataforma de sequenciação selecionada, a biblioteca preparada é primeiro carregada no chip de sequenciação ou célula de reação. Tomando a plataforma Illumina como exemplo, a biblioteca é carregada através de um tanque de fluxo especial, e sequências de oligonucleotídeos complementares aos conectores da biblioteca estão fixadas na superfície do tanque de fluxo, e os fragmentos da biblioteca podem ser especificamente ligados à superfície do tanque de fluxo para se preparar para a reação de sequenciação subsequente.
Ciclo de reação de sequenciaçãoPara a tecnologia de sequenciação enquanto se sintetiza na plataforma Illumina, no ciclo da reação de sequenciação, quatro dNTP (desoxirribonucleotídeos) com diferentes etiquetas fluorescentes são adicionados ao sistema de reação em sequência. A DNA polimerase adiciona dNTP à cadeia de extensão do primer, e cada vez que uma base é adicionada, ela identifica o tipo de base de acordo com o seu sinal de fluorescência e o regista. Após muitos ciclos, o fragmento da biblioteca inteira foi sequenciado.
Aquisição de dadosCom a reação de sequenciação, o instrumento coleta sinais de fluorescência em tempo real e os converte em informações correspondentes à sequência de bases. Os dados de sequenciação são finalmente produzidos em formato de ficheiro FASTQ.
Indicadores e métodos de avaliaçãoOs dados de sequenciação originais foram avaliados preliminarmente pelo software FastQC. Em termos de distribuição de massa das bases, o FastQC traça um mapa de distribuição de massa calculando a fração média de massa das bases em cada posição.
Padrão de filtragem de qualidadeDefina o padrão de filtragem de qualidade de acordo com o resultado da avaliação. Geralmente, as bases com uma fração de massa base inferior a 20 (a taxa de erro correspondente é de cerca de 1%) são consideradas bases de baixa qualidade. Quando a proporção de bases de baixa qualidade numa sequência excede um determinado limiar (como 20%), a sequência é considerada de baixa qualidade e removida. Para sequências contaminadas por ligadores, as sequências que contêm ligadores são identificadas e removidas através da comparação com sequências de ligadores conhecidas.
Metilação da citosina em características genómicas chave (Vaisvila et al., 2021)
Através da escavação profunda e análise de dados complexos, podemos não apenas entender as mudanças dinâmicas da metilação do DNA no processo de diferenciação e desenvolvimento celular, mas também encontrar características de metilação intimamente relacionadas à ocorrência e desenvolvimento de doenças no campo da investigação de doenças, como o câncer e as doenças neurodegenerativas, fornecendo assim um sólido suporte de dados e uma base teórica para o diagnóstico precoce de doenças e a formulação de estratégias de tratamento precisas.
Identificação de local de modificaçãoO princípio do algoritmo para identificar locais de modificação epigenética em dados de EM-Seq baseia-se na comparação das características das sequências de ácidos nucleicos antes e depois da modificação nos dados de sequenciação. No EM-Seq, a modificação por metilação levará a características de sinal das sequências de ácidos nucleicos diferentes das sequências não modificadas após um tratamento específico. Através da análise dos dados de sequenciação, o estado de metilação de cada locus foi avaliado por métodos estatísticos e modelos de aprendizagem automática.
Análise da distribuição e padrão dos locais de modificaçãoDiferentes regiões genómicas serão consideradas quando a distribuição dos locais de modificação epigenética identificados no genoma for analisada estatisticamente. Na região do gene, inclui-se o promotor, exon e intrão. O estado de metilação da região do promotor está geralmente intimamente relacionado com a regulação da expressão génica, e a hipermetilação frequentemente inibe a transcrição do gene. Ao contar a distribuição dos locais de metilação na região do promotor, podemos descobrir quais promotores de genes podem ser regulados pela metilação. Nas regiões de exon e intrão, a distribuição de metilação também tem as suas próprias características, que podem afetar o processo de splicing do mRNA.
Análise de integração com outros dados ómicosAo integrar dados de EM-Seq com outros dados ómicos, podemos compreender plenamente o mecanismo da modificação epigenética no processo biológico. Tomando a integração com dados do transcriptoma como exemplo, através da análise de correlação das alterações dos locais de metilação e dos níveis de expressão génica, podemos encontrar os genes-chave que podem ser regulados pela epigenética. Geralmente, o nível de expressão dos genes com alta metilação na região do promotor é frequentemente baixo; No entanto, o nível de expressão dos genes hipometilados pode ser mais elevado.
Análise biológica de EM-seq
Para resumir, o processo de EM-seq começa com a extração de DNA da amostra e passa por uma série de etapas precisas, como tratamento com a enzima TET, reparação terminal e ligação de ligadores, amplificação por PCR, etc., e finalmente obtém uma biblioteca de sequenciamento que pode ser utilizada para análise aprofundada. Com a sua alta eficiência e precisão, este processo pode detectar com precisão os locais de modificação da metilação do DNA, proporcionando uma ferramenta poderosa para os investigadores explorarem profundamente questões biológicas, como a regulação da expressão génica e os mecanismos de ocorrência e desenvolvimento de doenças, mostrando um grande potencial de aplicação no campo da investigação em ciências da vida e impulsionando constantemente a investigação relacionada para uma nova altura.
Referências: