A análise integrativa de múltiplos conjuntos de dados genómicos é crucial para compreender a complexidade da regulação genética na saúde e na doença. Avanços recentes em tecnologias de sequenciação de alto rendimento levaram à geração de grandes quantidades de dados genómicos, como Hi-C, ATAC-seq, ChIP-seq e dados de expressão génica. Hi-C é uma técnica que captura interacções da cromatina em todo o genoma, enquanto ATAC-seq e ChIP-seq fornecem informações sobre a acessibilidade da cromatina e interacções proteína-DNA, respectivamente. Ao integrar estes conjuntos de dados, os investigadores podem investigar a relação entre a estrutura da cromatina, a ligação de factores de transcrição e a expressão génica.
Runx1/AML1 é um membro da família RUNX de factores de transcrição envolvidos na manutenção da homeostase hematopoiética normal. A interrupção de RUNX1 em humanos leva a vários distúrbios hematopoiéticos, incluindo leucemia mieloide aguda e distúrbios familiares das plaquetas com malignidades mieloides. Runx1 é um gene grande e complexo que é regulado transcricionalmente por dois promotores (P1 e P2) sob o controlo espaço-temporal de múltiplos potenciadores hematopoiéticos. A elucidação do mecanismo regulatório transcricional de Runx1 é esperada para contribuir para uma melhor compreensão das alterações conformacionais da cromatina adoptadas por genes complexos de múltiplos promotores durante o desenvolvimento. A análise combinada de Dnasel-seq, ChIP-seq, ATAC-seq e RNA-seq revelou locais acessíveis de cromatina em potenciadores conhecidos, locais de CTCF e elementos cis-regulatórios candidatos dentro de TAD durante a diferenciação. Foi encontrado que durante a diferenciação, os limites da cromatina sub-TAD são formados dinamicamente dentro do grande e complexo domínio regulatório de Runx1 e estão envolvidos na coordenação da expressão génica e da diferenciação hematopoiética.
Modelo esquemático das alterações dinâmicas da cromatina em Runx1 durante o desenvolvimento hematopoiético e após a deleção de locais CTCF próximos ao promotor.
Além da pesquisa sobre doenças, a análise integrativa também tem sido utilizada para estudar o desenvolvimento normal e a diferenciação celular. Gossypium hirsutum, uma cultura de fibra e oleaginosa importada amplamente cultivada em todo o mundo, é também um modelo para analisar todos os genomas poliploides. Esta pesquisa foca em determinar a composição funcional do genoma, incluindo genes codificadores de proteínas e elementos regulatórios não codificadores, para orientar a melhoria das características agrícolas. O estudo preparou primeiro uma biblioteca Hi-C de ultra-alta resolução (3 Kb) (233 Gb) e uma biblioteca Pore-C com resolução apropriada (20 Kb) com base em folhas de G. hirsutum para construir um mapa genómico 3D fino do algodão para explorar completamente as múltiplas interacções dos domínios estruturais da cromatina, ajudando a compreender o estado e a localização intranuclear dos componentes genómicos funcionais. Em seguida, Hi-C, ChIA-PET (H3K4me3) e ChIP-Seq (H3K4me3, H3K27ac e H3K27me3) foram utilizados para investigar laços de cromatina e o seu potencial papel na transcrição génica. Com uma resolução de 3 Kb, o estudo observou 31047 laços gene-gene, 40035 laços gene-região não codificadora e 121415 outros laços. Genes localizados em pontos de ancoragem de laços gene-gene apresentaram níveis de expressão mais elevados, que estavam associados a níveis mais altos de modificações activas de histonas. Possíveis elementos cis-regulatórios transcricionais de longo alcance (CREs) foram subsequentemente identificados ao combinar ATAC-Seq, ChIP-Seq e laços de cromatina. Este estudo investigou de forma abrangente a estrutura fina do genoma 3D do algodão allotetraploide e analisou as características de interacções múltiplas de alto nível grandes e complexas e o impacto potencial na expressão génica.
Mapeamento multi-ômico da estrutura fina do genoma 3D e implicações na regulação transcricional no algodão allotetraploide.
A análise integrativa de múltiplos conjuntos de dados genómicos, como Hi-C, ATAC-seq, ChIP-seq e dados de expressão génica, tem o potencial de fornecer uma compreensão mais profunda da organização espacial da cromatina, da regulação transcricional e dos mecanismos de doença.
Referências: