Análise de Genomas Mitocondriais Humanos Através de Dados de Sequenciação de Alto Débito
Genoma Mitocondrial Humano
As mitocôndrias, organelas essenciais encontradas em todas as células eucarióticas, são centrais na produção de energia através da respiração aeróbica e desempenham papéis fundamentais em processos celulares. Possuem o seu próprio material genético único, o genoma mitocondrial (mtDNA).
mtDNA humano. é uma molécula circular, abrangendo 16.569 pares de bases, composta por cadeias pesadas e leves. É predominantemente uma região codificadora, englobando 37 genes, incluindo 22 tRNAs, 2 rRNAs e 13 proteínas cruciais para os componentes da cadeia de transporte de eletrões mitocondrial. Ao contrário do DNA nuclear, o ADNmt segue um padrão estrito de herança matrilinear.
Dentro das células, as mitocôndrias são numerosas, cada uma contendo múltiplas cópias de ADNmt. Esta natureza multicópia leva à diversidade genética, com percentagens de mutação variando de 0% a 100%. Alterações na carga de mutação durante a divisão celular podem impactar a produção de energia, causando um "efeito limiar" e disfunção celular.
A seleção da linha germinativa molda a diversidade do ADN mitocondrial humano. (Wei et al., 2019)
Sequenciação de Alto Rendimento de Genomas Mitocondriais
Em estudos clínicos e científicos, há uma preferência crescente por empregar técnicas avançadas como o Sequenciamento de Nova Geração (NGS), abrangendo sequenciamento de painéis direcionados, sequenciamento do genoma mitocondrial completo, Sequenciamento do Exoma Completo (WES) e Sequenciação do Genoma Completo (WGS), para a análise abrangente de genomas mitocondriais. Ao adotar estas metodologias, não só a eficiência analítica é significativamente aumentada, mas a sensibilidade na deteção de variantes patogénicas também é notavelmente melhorada, principalmente devido ao aumento do tamanho das amostras.
Deteção precisa de mutações no DNA mitocondrial tumoral por sequenciação de próxima geração. (Guo et al., 2020)
- Sequenciação de Painéis Alvo
Nas fases iniciais do Sequenciamento de Nova Geração (NGS) para doenças mitocondriais, apenas segmentos específicos do genoma mitocondrial são sequenciados. Estes segmentos abrangem péptidos que codificam a cadeia respiratória e genes bem conhecidos associados a doenças. Alternativamente, podemos selecionar todos os genes relacionados com as mitocôndrias, incluindo tanto o DNA mitocondrial (mtDNA) como o DNA nuclear (nDNA), conforme listado no MitoCarta. Este painel abrangente é comumente referido como o "MitoExoma."
- Sequenciação do Genoma Mitocondrial Completo
A utilização de NGS para sequenciação do genoma mitocondrial completo permite-nos detectar quaisquer variantes de DNA mitocondrial (mtDNA) e fornece uma avaliação precisa da heterogeneidade das variantes. Antes de iniciar a Sequenciação do Exoma Completo (WES) ou Sequenciação do Genoma Completo (WGS)Muitos centros de diagnóstico mitocondrial realizam frequentemente o sequenciamento do mtDNA. Isso serve ao duplo propósito de identificar variantes potencialmente patogénicas do mtDNA e excluir a sua presença. Vale a pena notar que muitas variantes patogénicas do mtDNA são encontradas exclusivamente em tecidos clinicamente afetados, como o músculo esquelético.
- Sequenciação do Exoma Completo
Essencialmente, Sequenciamento do Exoma Completo (WES) envolve o sequenciamento direcionado de regiões exónicas dentro do genoma. No entanto, uma parte substancial dos dados de WES é gerada a partir de regiões não direcionadas, incluindo o genoma mitocondrial. Dado que o genoma mitocondrial consiste em milhares de cópias, em contraste com o genoma nuclear diploide, existem significativamente mais sequências de mtDNA fora do alvo do que sequências de nDNA fora do alvo (por um fator de 30 a 120 vezes). Notavelmente, a proporção de sequências de mtDNA capturadas está correlacionada com a abundância de mtDNA na amostra total de DNA original. Por exemplo, células individuais no coração e no músculo esquelético contêm um maior conteúdo de mtDNA do que o sangue periférico. A natureza de alto número de cópias do mtDNA resulta numa mistura de mtDNA selvagem e mutante em proporções, conhecida como heterogeneidade, que pode teoricamente variar continuamente de 0% a 100%. Além disso, mutações patogénicas de mtDNA são tipicamente altamente heterozigóticas ou homozigóticas em portadores, mas exibem baixa heterozigosidade em casos de mutações patogénicas de mtDNA assintomáticas. Por outro lado, o número de cópias de mtDNA é conhecido por ser altamente variável e está associado a várias doenças, incluindo o câncer. Assim, o número de cópias de mtDNA é uma métrica crucial para a análise do genoma mitocondrial. Como a cobertura dos dados de sequenciamento é diretamente proporcional ao número de cromossomas, é possível estimar o número de cópias de mtDNA a partir dos dados de WES.
- Sequenciação do Genoma Completo
O WGS oferece a capacidade de detectar todas as variantes genéticas em todo o genoma humano, melhorando significativamente o potencial de diagnóstico para doenças mitocondriais. Alguns estudos demonstraram um elevado grau de concordância entre os métodos tradicionais baseados em PCR e WGS dados para analisar variantes de mtDNA. Além disso, quando se trata de avaliar o número de cópias, as estimativas do número de cópias de mtDNA derivadas de dados de WGS tendem a ser mais fiáveis.
Análise Bioinformática de Genomas Mitocondriais
- Deteção de Variantes Mitocondriais
Atualmente, a consistência no software e nos processos utilizados para identificar variantes mitocondriais em vários artigos de pesquisa é insuficiente. Vários ferramentas de software foram desenvolvidas para a análise e deteção de variantes mitocondriais a partir de dados de sequenciação de alto rendimento, como mtDNA-Server, MitoSeek, MToolBox, entre outros. Para uma orientação abrangente sobre a análise de genomas mitocondriais, é aconselhável consultar os procedimentos recomendados fornecidos pelo GATK, conforme detalhado aqui.
Além disso, ao analisar genes mitocondriais usando Sequenciamento do Exoma Completo (WES) ou Sequenciação do Genoma Completo (WGS) Os dados, o processo de controlo de qualidade das variantes assemelha-se de perto ao do genoma nuclear. É essencial prestar atenção à versão do genoma ao calcular a profundidade de sequenciação. Note que no genoma de referência humano hg19, o genoma mitocondrial é representado como CRS (NC_001807), mas o atual genoma de referência mitocondrial humano mais utilizado é o rCRS (NC_012920).
- Atribuição de Haplogrupos Mitocondriais
Atualmente, o software mais utilizado para atribuir haplogrupos mitocondriais a amostras é o HaploGrep2. O HaploGrep2 atribui os haplogrupos mitocondriais a cada amostra com base no PhyloTree17, tendo o rCRS como genoma de referência. Este software também permite a entrada direta de um arquivo de chamada de variantes (arquivo vcf) para determinar o haplogrupo mitocondrial mais adequado para cada amostra, com base nas variantes mitocondriais detectadas em cada amostra. Outra opção viável para a atribuição de haplogrupos é o MitoTool.
- Estimativa do Número de Cópias Mitocondriais
Durante a Sequenciação de Nova Geração (NGS), tanto os cromossomos autossómicos como os mitocondriais têm uma probabilidade igual de serem detectados. Consequentemente, a cobertura média dos cromossomos autossómicos e mitocondriais é teoricamente proporcional ao seu número de cópias.
Bases de Dados de Variantes Mitocondriais
Em contraste com o DNA nuclear (nDNA), a disponibilidade de bases de dados populacionais para variantes de DNA mitocondrial (mtDNA) é consideravelmente limitada. Felizmente, a prática de reanalisar sequências de mtDNA a partir de Sequenciamento de Exoma Completo (WES) e Sequenciação do Genoma Completo (WGS) Os conjuntos de dados são amplamente aceites e utilizados. Vários bancos de dados mitocondriais a nível populacional substanciais surgiram, incluindo Mitomap, HmtDB, 1000 Genomas, gnomAD e MitImpact.
Mitomap é a escolha preeminente para a análise de mtDNA. Para além de servir como um repositório de variantes de mtDNA entre populações, evoluiu para um recurso fundamental para a comunidade de pesquisa mitocondrial. Com décadas de reconhecimento, o Mitomap atualiza o seu conjunto de dados extraindo sequências de mtDNA do GenBank semestralmente e submetendo-as a uma rigorosa análise bioinformática. A partir de 1 de julho de 2022, o Mitomap abrange 56.910 sequências completas de mtDNA e 78.504 sequências da região de controlo de mtDNA, incluindo 19.449 polimorfismos de nucleotídeo único (SNPs) de mtDNA.
O gnomAD (Banco de Dados de Agregação do Genoma), a maior base de dados de variação humana de código aberto, tornou variantes de mtDNA publicamente acessíveis pela primeira vez em novembro de 2020 com o gnomAD v3.1, que compreende um total de 56.434 sequências de mtDNA a partir de dados de WGS, abrigando 10.850 variantes de mtDNA.
Por outro lado, a base de dados HelixMTdb é baseada em dados de WES de 196.554 indivíduos não relacionados, detetando um total de 15.035 variantes mitocondriais. Notavelmente, uma parte predominante destas amostras origina-se de populações europeias.
HmtDB é outra base de dados notável, abrangendo amostras com fenótipos saudáveis e relacionados com doenças. Está meticulosamente projetada para apoiar a genética populacional e ajudar os clínicos a avaliar a patogenicidade de variantes específicas do mtDNA. Vale a pena destacar que tanto o HmtDB quanto o Mitomap obtêm as suas sequências de mtDNA do GenBank, levando a uma sobreposição significativa nas fontes de amostras entre estas duas bases de dados.
Além disso, algumas das bases de dados de doenças amplamente utilizadas para variantes de ADN nuclear, incluindo ClinVar, Clinvar Miner e OMIM, sem mencionar Mitomap e HmtDB, também fornecem informações sobre as implicações clínicas das variantes de mtDNA. A partir de 1 de julho de 2022, o Mitomap compilou dados sobre 455 mutações de rRNA/tRNA e 545 variantes codificantes/não codificantes associadas a doenças, das quais apenas 97 variantes foram definitivamente categorizadas como patogénicas.
Ferramentas para Prever o Impacto de Variantes Mitocondriais
Numerosas ferramentas concebidas para avaliar a prejudicialidade de variantes nas regiões codificadoras do DNA nuclear (nDNA) também podem ser aplicadas a variantes nas regiões codificadoras do DNA mitocondrial (mtDNA). Entre estas ferramentas destacam-se CADD, PolyPhen-2, SIFT, Mutpred e PROVEAN, várias das quais são amplamente utilizadas para priorizar variantes de nDNA. No entanto, é importante notar que algumas destas ferramentas, originalmente adaptadas para regiões codificadoras de nDNA, podem apresentar uma precisão reduzida quando aplicadas a regiões codificadoras de mtDNA.
| Ferramenta | Aplicabilidade | Características Principais |
| Ferramentas Comuns para Avaliar Variantes de mtDNA e nDNA | Variantes da região codificante do mtDNA e do nDNA | - CADD, PolyPhen-2, SIFT, Mutpred e PROVEAN. |
| - Originalemente concebido para nDNA, pode ter precisão reduzida para mtDNA. | ||
| Ferramentas mtDNA especializadas com melhor desempenho | Especificamente concebido para mtDNA | - MToolBox |
| - APOGÉU | ||
| - Mitoclasse | ||
| Ferramentas para Variantes de tRNA Mitocondrial | Variantes de tRNA mitocondrial | - MitoTIP |
| - PON-mt-RNA | ||
| MToolBox | Análise de variantes mitocondriais | - Analisa sequências mitocondriais humanas a partir de NGS. |
| - Fornece anotação de heterogeneidade de variantes mitocondriais. | ||
| - Auxilia na identificação de variantes patogénicas. |
Referências:
- Wei, Wei, et al. "A seleção da linha germinativa molda a diversidade do ADN mitocondrial humano." Ciência 364.6442 (2019): eaau6520.
- Guo, Shanshan, et al. "Uma estratégia inovadora de análise de dados para a deteção precisa de mutações no DNA mitocondrial tumoral por sequenciação de próxima geração." Terapia Molecular-Acidos Nucleicos 23 (2021): 232-243.