Mapeamento de Elementos Cis-Regulatórios no Genoma do Porco

Embora os avanços genómicos substanciais tenham transformado o panorama da exploração científica, o nosso conhecimento sobre os elementos cis-regulatórios no genoma do porco continua notavelmente limitado. Esta lacuna de conhecimento dificulta significativamente o melhoramento genético e a produtividade dos porcos, tanto como fonte de carne como modelos de investigação biomédica. Nesta investigação, os autores realizaram um exame abrangente dos genomas de quatro raças distintas de suínos, empregando uma variedade diversificada de técnicas histológicas de ponta, incluindo RNA-seq, ATAC-seq, ChIP-seq, e Hi-C. A estratégia do estudo é reminiscentemente de iniciativas epigenéticas em larga escala, como o ENCODE (Enciclopédia de Elementos de DNA) e os projetos Roadmap Epigenomics.

Os elementos cis-regulatórios e as suas funções foram sistematicamente delineados em uma dúzia de tecidos diferentes entre estas quatro raças de porcos. Esta pesquisa gerou um conjunto de dados substancial com 199 perfis regulatórios epigenéticos, culminando na identificação de mais de 220.000 elementos cis-regulatórios dentro do genoma do porco. Curiosamente, esta exploração revelou um nível inesperado de conservação nos elementos cis-regulatórios entre os genomas humano e de porco, superando a conservação observada entre os genomas humano e de rato.

Além disso, a pesquisa expôs variações nos domínios estruturais associados a características topológicas dentro dos genomas suínos e humanos, lançando luz sobre as mudanças evolutivas que afetam a morfologia craniofacial. Para além da sua importância para a genómica funcional suína e regulação de características, este estudo fornece dados epigenéticos comparativos essenciais, aumentando a utilidade dos porcos como modelos na investigação biomédica humana.

Elementos cis-regulatórios e Estrutura Genómica 3D do Genoma do Porco

Encontraram um total de 220.723 sequências cis-regulatórias não redundantes, incluindo 37.838 promotores putativos, 146.399 potenciais potenciadores e 137.838 regiões de cromatina aberta alinhadas ao genoma susScr11. Eles examinaram a distribuição de ChIP-seq e sinais de ATAC-seq em torno dos seus TSSs e avaliaram os seus níveis de expressão transcricional. Como exemplos, apresentam os genes AGL e FRRS1 no cromossoma 4 do porco e o gene MYOG no cromossoma 9.

O comprimento total dessas sequências cis-regulatórias não redundantes é de cerca de 434,92 milhões de pares de bases, o que representa cerca de 17,38% do genoma susScr11. Para avaliar a precisão de localização das sequências cis-regulatórias identificadas acima, compararam os potenciadores e promotores com o TSS anotado pelo Projeto Suíno da Universidade da Califórnia, Santa Cruz (UCSC) e com publicações anteriores. ChIP-seq dados de células-tronco pluripotentes porcinas e tecidos hepáticos. Os resultados indicam que aproximadamente 50% dos potenciais promotores são consistentes com sobreposições de promotores ou TSSs identificados nos dados publicados, enquanto os outros aproximadamente 50% não estão reportados no genoma porcino. Mais de 86% dos potenciadores também não foram reportados no genoma do porco.

A estrutura 3D do genoma porcino foi avaliada utilizando dados de Hi-C in situ, com músculo esquelético de uma amostra de tecido representativa de um porco LW. No total, foram sequenciadas 1.189.583.975 leituras de extremidade pareada, alcançando mais de 21x de cobertura do genoma, e obtiveram 408.546.465 contactos válidos únicos, dos quais 290.325.259 eram contactos cis, após filtragem de dados válidos utilizando o Hi-C-Pro. A partir destes contactos, mapearam conformações de cromatina como frequências de interação de cromatina, e a modelagem da estrutura do genoma 3D mostrou claramente as relações espaciais entre as regiões genómicas do porco.

Cis-regulatory element landscape of the pig genome.Paisagem dos elementos cis-regulatórios do genoma do porco. (Zhao et al., 2021)

Transcritos do Genoma do Porco

No seu estudo, eles realizaram RNA-seq análise de 52 amostras derivadas de 11 tecidos diferentes de porcos de quatro raças distintas. Revelaram padrões diversos de expressão de RNA em cada tecido, que posteriormente classificaram em 20 clusters distintos utilizando a função K-means na linguagem de programação R.

O cluster p20 destacou-se como um cluster com genes altamente expressos em todas as amostras. Análises adicionais, utilizando a enriquecimento da Ontologia Genética (GO) do DAVID, indicaram que os genes neste cluster desempenham principalmente papéis essenciais em processos biológicos fundamentais, sugerindo que podem ser considerados genes de manutenção. Notavelmente, mais de metade dos clusters exibiu uma tendência clara de expressão específica de tecido.

Identificaram 4.510 genes específicos de tecido, definidos como aqueles que apresentam uma expressão pelo menos três vezes superior em um determinado tecido em comparação com outros em todas as raças de porcos. Análises subsequentes de enriquecimento GO do DAVID ilustraram que estavam significativamente enriquecidos para funções específicas em uma variedade de tecidos. Validaram as suas descobertas examinando exemplos típicos, e os resultados revelaram um alto nível de concordância entre RNA-seq dados e resultados de RT-PCR, reforçando a precisão da sua análise.

Além disso, identificaram 3.316 transcritos novos, que incluíam 1.713 RNAs longos não codificantes (lncRNAs) não documentados anteriormente no transcriptoma porcino. Notavelmente, números semelhantes de transcritos novos foram detetados em todos os tecidos examinados, sugerindo que estudos anteriores podem ter negligenciado estes transcritos específicos. É importante destacar que encontraram abundante sinalização H3K4me3 perto do local de início da transcrição (TSS) destes transcritos recém-identificados, fornecendo fortes evidências da sua transcrição ativa. Este robusto processo de identificação sublinha as vantagens de construir bibliotecas específicas de cadeia após a remoção do RNA ribossómico (rRNA), uma técnica raramente utilizada em estudos porcinos anteriores. Além disso, os seus resultados indicam que estes transcritos recém-identificados exibem um índice de especificidade tecidual mais elevado quando comparados a genes já anotados no genoma.

Transcriptional profiling and cis-regulatory elements analysis.Perfilamento transcricional e análise de elementos cis-regulatórios. (Zhao et al., 2021)

Enhancers Específicos de Tecidos: Perspetivas sobre Padrões de Expressão Génica Porcina

As sequências de potenciadores servem como elementos regulatórios cruciais que governam a expressão genética específica de tecidos, exercendo impactos funcionais profundos na criação de padrões de expressão genética distintos. Neste estudo, os autores categorizaram meticulosamente padrões específicos de tecidos associados a potenciais potenciadores em vários tecidos suínos, conseguindo identificar 15.753 potenciadores específicos de tecidos com um elevado nível de confiança. Além disso, ao empregar o algoritmo ROSE, também descobriram entre 414 a 1.306 super-potenciadores em cada tecido para cada raça. Como era de esperar, os genes associados a estes super-potenciadores apresentaram níveis de expressão marcadamente elevados em comparação com os genes ligados a potenciadores típicos.

Picos amplamente distribuídos de H3K4me3, em conjunto com promotores ativos ricos em H3K27ac, foram previamente documentados como fatores que impulsionam significativamente a ativação transcricional aumentada de genes. Os resultados desta investigação revelaram a presença de picos de H3K4me3 com largura entre 418-1899 em cada tecido de várias raças. Semelhante aos dados sobre super-enhancers, os genes proximais a esses picos amplos de H3K4me3 exibiram níveis de expressão notavelmente elevados em comparação com genes selecionados aleatoriamente.

Para validar a robustez e a precisão da sua metodologia, os investigadores realizaram um ensaio de gene reportador de luciferase dupla em células 3D4/21 de porco, direcionando-se a 15 potenciadores não específicos de tecido previstos e 18 sequências de promotores escolhidas aleatoriamente. Os resultados sublinharam um aumento substancial na atividade transcricional para os potenciadores e promotores testados em comparação com regiões genómicas aleatórias. Também vale a pena notar que, entre os potenciadores identificados, 1216 sequências exibiram conservação com os potenciadores VISTA humanos conhecidos.

3D structure and regulation of cis-regulatory elements.Estrutura 3D e regulação de elementos cis-regulatórios. (Zhao et al., 2021)

Estrutura Genómica 3D do Genoma do Porco

A identificação de laços de cromatina foi facilitada através da análise da matriz Hi-C. Utilizando o algoritmo aprimorado HiCCUPS, descobrimos 15.485 laços a uma resolução de 25 kb e 11.838 laços a uma resolução de 40 kb. Uma amalgamação abrangente de dados de Hi-C e elementos regulatórios cis destacou que, à resolução de 25 kb, 79,74% (12.347) desses laços estavam associados a elementos regulatórios cis, com 44,47% exibindo associações significativas. Análises subsequentes, integrando dados de laços com regiões de cromatina aberta identificadas por ATAC-seq, demonstraram um enriquecimento substancial de motivos de ligação do CTCF dentro dos âncoras dos laços. Estas descobertas sublinham o papel conservado dos domínios de ligação do CTCF na modelagem da estrutura 3D dos genomas de mamíferos.

Para explorar o impacto global dos potenciadores na regulação de características complexas em porcos, os autores reuniram SNPs que exibiram associações significativas com publicações. estudos de associação genoma inteiro (GWAS) e examinou a sua proximidade com os potenciadores. Um total de 7.238 SNPs associados a GWAS, dos quais 3.445 eram não redundantes, foi recolhido. A análise revelou um notável enriquecimento de potenciadores em torno dos SNPs significativamente associados a GWAS em comparação com regiões genómicas aleatórias a várias distâncias. Notavelmente, pesquisas anteriores tinham implicado o gene PLCB4 como um gene candidato para crescimento e ganho diário médio em porcos, e o nosso estudo confirmou que o SNP significativamente ligado ao ganho diário de porcos está localizado perto de um potenciador significativamente associado ao gene PLCB4.

Referência:

  1. Zhao, Yunxia, et al. "Um compêndio e análise epigenómica comparativa de elementos cis-regulatórios no genoma do porco." Comunicações da Natureza 12.1 (2021): 2217.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo