Análise de Variação no Número de Cópias (CNV)

O que é Variação no Número de Cópias (CNV)?

A Variação no Número de Cópias (VNC) é um tipo de variação estrutural genómica que abrange alterações no número de cópias de um determinado segmento de ADN. Estas variações são amplamente categorizadas em dois níveis com base no seu tamanho: microscópico e submicroscópico.

As variações estruturais genómicas microscópicas são observáveis ao microscópio e incluem aberrações cromossómicas como aneuploidia, deleções, inserções, inversões, translocações e interrupções de locais frágeis. A CNV manifesta-se de várias formas dentro do genoma, incluindo a deleção simultânea de cópias em ambos os cromossomas homólogos, a deleção em um cromossoma homólogo enquanto o outro permanece normal, e a duplicação de cópias em um cromossoma homólogo enquanto o outro permanece normal.

Types of copy number variants (CNVs). (Mollon et al., 2023)Tipos de variantes do número de cópias (CNVs). (Mollon et al., 2023)

Por outro lado, variações estruturais genómicas submicroscópicas ocorrem ao nível de fragmentos de ADN dentro da faixa de 1Kb-3Mb. Estas variações incluem deleções, inserções, duplicações, rearranjos, inversões e alterações no número de cópias de ADN, coletivamente referidas como CNV.

Inicialmente descobertos nos genomas de pacientes, os CNVs foram encontrados como prevalentes em populações humanas normais, sugerindo um espectro de significância clínica que varia de benigno a patogénico ou desconhecido. O mecanismo preciso por trás da formação de CNVs permanece incerto, mas os mecanismos potenciais incluem recombinação homóloga não-alélica (NAHR) e junção de extremidades não-homólogas (NHEJ).

As tecnologias de ponta, como o sequenciamento de alto rendimento e o sequenciamento de leituras longas, empregues pela CD Genomics, facilitam a deteção de CNV e a genotipagem. Esta abordagem avançada de sequenciamento permite uma análise abrangente e eficiente do material genético, proporcionando informações valiosas sobre a paisagem molecular e potenciais biomarcadores associados a várias condições.

Análise de CNV por Sequenciação

A determinação do número de cópias de fragmentos-alvo através de sequenciação por profundidade de leitura é um método poderoso capaz de detectar simultaneamente CNVs de múltiplos genes e outros biomarcadores. No entanto, a eficácia desta abordagem é influenciada por uma miríade de fatores, incluindo o design do painel, o conteúdo de GC das sondas, o conteúdo tumoral e os níveis de contaminação, todos os quais impactam a precisão do modelo algorítmico.

A sequenciação de leituras curtas e longas oferece uma visão abrangente das alterações genómicas, permitindo que os investigadores discernam variações no número de cópias com precisão. Ao analisar a profundidade das leituras em fragmentos-alvo, os investigadores podem revelar alterações no número de cópias, iluminando o panorama genómico de interesse.

Apesar do seu potencial, a eficácia do sequenciamento depende de uma consideração cuidadosa de vários fatores. O design do painel desempenha um papel crucial na determinação das regiões de interesse e na garantia de uma cobertura abrangente em todo o genoma. Da mesma forma, o conteúdo de GC das sondas influencia a eficiência da captura de alvos e do sequenciamento, afetando a precisão da determinação do número de cópias.

Deteção de CNV na Pesquisa do Cancro

Os tumores são manifestações intrincadas de anomalias genómicas, resultantes de uma cascata de mutações nas células somáticas. Entre estas mutações, as Variações no Número de Cópias (VNCs) em amostras tumorais destacam-se como protagonistas fundamentais. Nas células somáticas normais, o genoma é diploide; no entanto, nas células tumorais, certas regiões genómicas sofrem amplificações ou deleções do número de cópias, alterando a paisagem genómica original dentro de um intervalo de tamanho de aproximadamente 50bp a 1Mb.

Mutações de deleção em alguns tumores desencadeiam a ativação de proto-oncogenes, levando à inativação de oncogenes, como exemplificado pelo RB1, P16, PTEN, entre outros. Por outro lado, mutações de amplificação induzem a ativação de proto-oncogenes e oncogenes, como MYC, HER2, EGFR, respetivamente. Estes genes participam de forma intrincada em vários caminhos de sinalização, fundamentais no desenvolvimento e regulação de processos celulares. Eles exercem uma influência significativa sobre o crescimento celular, proliferação, metastase e recidiva.

A deteção de CNVs específicos de tumores não só oferece insights sobre os fundamentos moleculares da tumorigenese, mas também acelera a descoberta de novos proto-oncogenes e oncogenes tumorais. Este conhecimento torna-se inestimável na busca por intervenções terapêuticas eficazes contra tumores. Estes estudos abrem caminho para terapias direcionadas em pacientes com tumores, permitindo que os clínicos personalizem tratamentos com base em variações individuais no número de cópias. Por exemplo, medicamentos como o trastuzumabe e o patuzumabe demonstram uma eficácia aumentada em casos de câncer de mama metastático caracterizados pela superexpressão do gene HER2.

Identification of copy number variation-driven enhancers in breast cancer. (Zhao et al., 2022)Identificação de potenciadores impulsionados por variação no número de cópias no câncer de mama. (Zhao et al., 2022)

Análise de CNV: Um Guia Passo a Passo

A realização da análise de Variação no Número de Cópias (CNV) é um processo em várias etapas, que vai desde a preparação dos dados até à identificação e anotação das CNVs. Abaixo está um guia abrangente que descreve o procedimento padrão para a análise de CNV, utilizando o arquivo fq.gz fornecido pela empresa de sequenciação:

  • Preparação de Dados e Controlo de Qualidade

Comece por descomprimir o ficheiro fq.gz para obter dados de sequenciação brutos no formato FASTQ.

Avalie a qualidade dos dados de sequenciação utilizando ferramentas de controlo de qualidade como o FastQC. Avalie parâmetros incluindo pontuações de qualidade das bases, distribuição da qualidade das sequências e conteúdo de GC para garantir a integridade dos dados.

  • Alinhamento a um Genoma de Referência

Alinhe as leituras de sequenciamento a um genoma de referência utilizando ferramentas de alinhamento como BWA ou Bowtie.

Resultados de alinhamento de processos utilizando ferramentas como SAMtools para conversão de formato (SAM para BAM), ordenação e desduplicação para otimizar a análise subsequente.

  • Análise de Cobertura de Leitura

Calcule a cobertura de segmentos lidos para cada região genómica com base nos resultados de alinhamento.

Utilize ferramentas como o BEDTools para gerar ficheiros de cobertura para uma caracterização precisa de regiões genómicas.

  • Deteção de CNV

Utilize ferramentas de deteção de CNV como CNVnator, DELLY ou LUMPY para analisar dados de cobertura.

Identificar variações no número de cópias aproveitando a cobertura dos segmentos de leitura, informações de emparelhamento e/ou leituras divididas.

  • Filtragem e Anotação de Resultados

Filtrar os resultados de CNV com base em critérios pré-definidos, como qualidade do CNV, tamanho e frequência, para garantir a precisão.

Utilize ferramentas de anotação funcional como ANNOVAR ou VEP para anotar CNVs detectadas, fornecendo informações sobre a sua significância biológica.

Bases de Dados para Análise de Variação do Número de Cópias

  • Navegador do Genoma UCSC

O UCSC Genome Browser é um pilar na análise de variantes de número de cópias, oferecendo ferramentas indispensáveis como o Genome Browser e a função LiftOver.

O UCSC Genome Browser serve como um microscópio virtual versátil, facilitando a navegação fluida através de dados genómicos com exibições gráficas interativas. A sua interface amigável simplifica a exploração de paisagens genómicas, tornando a recuperação de dados mais rápida, acessível e fiável. Ao amalgamar uma vasta gama de dados de anotação do genoma, este navegador capacita os investigadores a aprofundar-se nas complexidades do genoma do cromossoma humano, até aos pormenores dos nucleótidos individuais. Como ilustrado abaixo, os utilizadores podem inserir as suas informações de consulta na janela designada, com a janela de exibição de anotações apresentando os resultados num formato gráfico intuitivo.

  • Base de Dados DECIPHER

A base de dados DECIPHER é um pilar no domínio da bioinformática, particularmente na genética molecular. Serve como um recurso inestimável para investigadores que procuram informações abrangentes sobre doenças genéticas, abrangendo locais de mutação, fenótipos clínicos e muito mais. Atualmente, com dados de 44.153 pacientes, o DECIPHER oferece um rico repositório de conhecimentos genéticos.

Os utilizadores podem navegar facilmente na base de dados para explorar uma miríade de informações sobre doenças genéticas, incluindo 65 síndromes de microdeleção e microduplicação ligadas a distúrbios do desenvolvimento, juntamente com 786 distúrbios genéticos meticulosamente documentados em GeneReviews. Cada entrada fornece uma descrição detalhada do distúrbio, tamanho do fragmento, referências bibliográficas e informações abrangentes sobre os genes associados, variantes e fenótipos.

Consulta de Informação Básica sobre Doenças dentro de Segmentos de Variantes de Número de Cópia

Os investigadores podem utilizar a base de dados DECIPHER para consultar rapidamente informações básicas sobre doenças dentro de segmentos de variantes de número de cópias, como Síndromes CNV e GeneReviews. A base de dados facilita a recuperação eficiente de dados pertinentes, ajudando na elucidação de desordens genéticas e dos seus mecanismos moleculares subjacentes.

Número de Variantes de Cópia e Número de Genes Codificadores de Proteínas dentro de uma Consulta de Fragmento

A terceira secção da Ferramenta de Pontuação CNV nas novas Diretrizes ACMG baseia-se no número de genes codificadores de proteínas dentro de um segmento de variante de número de cópias para atribuir diferentes pontuações. A base de dados DECIPHER oferece uma plataforma integrada para consultar esta informação crucial, capacitando os investigadores a tomar decisões informadas. Por padrão, o DECIPHER opera na versão do genoma GRGh38, com disposições para conversão caso os fragmentos avaliados utilizem uma versão de genoma diferente. Recomenda-se cautela ao avaliar segmentos que contenham grupos ou famílias de genes. Em casos onde a significância clínica de uma família de genes não é clara, cada família pode ser considerada como um único gene. No entanto, genes com relevância clínica conhecida ou associações claras a doenças devem ser contados separadamente, garantindo precisão na análise e interpretação genética.

  • Base de Dados ClinGen

O ClinGen é um recurso fundamental, generosamente financiado pelos Institutos Nacionais de Saúde (NIH), dedicado a compilar informações abrangentes sobre a relevância clínica de genes, variantes e doenças, com um foco especial na promoção da investigação em medicina de precisão. Na nossa busca por compreender as variações no número de cópias (CNVs), surgem duas ferramentas indispensáveis do ClinGen: a Sensibilidade à Dosagem do ClinGen e o Calculador de Patogenicidade de CNV do ClinGen.

A utilização da Sensibilidade à Dosagem ClinGen é fundamental na análise de CNVs, particularmente na avaliação de se os CNVs se sobrepõem a genes ou regiões de forma inequívoca ou prevista para apresentar efeitos de subdosagem única (efeitos de sensibilidade a tripla dosagem), ou, inversamente, aqueles considerados inequivocamente benignos. Este passo crítico forma a segunda parte da ferramenta de pontuação de CNVs descrita nas novas diretrizes da ACMG, orientando os investigadores na distinção da significância clínica dos CNVs identificados.

A robust infraestrutura do ClinGen capacita os investigadores com as ferramentas necessárias para navegar na complexa paisagem da análise de CNV com precisão e confiança. Ao aproveitar a Sensibilidade à Dosagem do ClinGen, os investigadores têm acesso a dados curados essenciais para tomar decisões informadas sobre as implicações clínicas dos CNVs.

Referências:

  1. Mollon, Josephine, et al. "A contribuição das variantes de número de cópias para sintomas psiquiátricos e capacidade cognitiva." Psiquiatria molecular 28.4 (2023): 1480-1493.
  2. Zhao, Hongying, et al. "Identificação de marcadores prognósticos específicos de subtipo impulsionados por enhancers no câncer da mama com base em dados multi-ômicos." Fronteiras em Imunologia 13 (2022): 990143.
Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Serviços Relacionados
Download PDF
* Endereço de Email:

A CD Genomics precisa das informações de contacto que nos fornece para poder contactá-lo sobre os nossos produtos e serviços e outros conteúdos que possam ser do seu interesse. Ao clicar abaixo, consente o armazenamento e processamento das informações pessoais submetidas acima pela CD Genomics para fornecer o conteúdo que solicitou.

×
Pedido de Cotação
! Apenas para fins de investigação, não se destina a diagnóstico clínico, tratamento ou avaliações de saúde individuais.
Contacte a CD Genomics
Termos e Condições | Política de Privacidade | Feedback   Direitos de Autor © CD Genomics. Todos os direitos reservados.
Topo