A sequenciação PacBio tem 4 etiquetas fluorescentes, que estão marcadas com 4 tipos de dNTP, e a sua polimerase está ancorada na parte inferior do chip de sequenciação; quando a cadeia de DNA se liga à enzima, a sequenciação é realizada, e durante a sequenciação, o dNTP fluorescente forma um complexo com a enzima e o molde de DNA, que se ligará brevemente. Durante este processo, quando a polimerase encontra A, C e outras bases metiladas no molde, a taxa de polimerização será significativamente mais lenta. e as características espectrais correspondentes mudarão, o que torna possível medir diretamente a metilação de A, metilação de C, hidroximetilação de C, etc.
Para obter informações de metilação 5mC a partir dos dados HiFi, existem dois casos, um é os dados HiFi medidos anteriormente, e o outro são os dados HiFi prontos para serem medidos.
A sequenciação HiFi, o arquivo bam após a análise primrose, representa a informação de metilação da sequência do genoma completo. Com base nisso, precisamos primeiro compará-lo com o genoma de referência (usando software minimap), e depois usar o software pb-CpG-tools para obter a informação de probabilidade de metilação numa determinada posição no genoma após obter o arquivo bam alinhado após a comparação.
De acordo com os resultados dos testes oficiais, quando os dados HiFi estão acima de 10×, os resultados de metilação baseados na deteção de dados HiFi estão em boa concordância com os resultados do WGBS, e o coeficiente de correlação tende a estabilizar-se gradualmente com o aumento da profundidade de sequenciação. Portanto, a deteção de 5mC com HiFi e uma profundidade de sequenciação de 10-15× é suficiente.
Usando amostras humanas como dados de teste, comparamos a consistência de WGBS, ONT, HiFi, etc. para detectar 5mC, e os resultados mostraram que o coeficiente de correlação entre os resultados dos testes HiFi e outros resultados de testes foi superior a 90%, o que confirmou a sensibilidade e precisão do HiFi para detectar 5mC.
As tecnologias de deteção de metilação existentes são ou demasiado curtas em comprimento de leitura ou não são suficientemente precisas em sequenciação, e é difícil distinguir a informação de metilação haplotípica. O HiFi 5mC, por outro lado, herda as vantagens das tecnologias de deteção mencionadas acima, mas também pode distinguir a informação de metilação haplotípica, tornando possível analisar diferenças de metilação ao nível haplotípico.
Como mencionado acima, a deteção HiFi de metilação 5mC tem uma baixa exigência de profundidade, ampla cobertura, e pode ser faseada em metilação, o que nos permite medir os dados HiFi uma vez para completar tanto a montagem do genoma quanto a deteção de variantes e análise de metilação, o que pode fornecer uma ajuda abrangente para a resolução profunda de espécies. Além disso, com base nos resultados da fase de metilação, podemos explorar a metilação diferencial de alelos, rastrear a impressão parental e procurar genes impressos, o que ajudará os investigadores a analisar o mecanismo genético do desenvolvimento de espécies, causas de doenças e fenótipos importantes numa dimensão superior.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.