O que é Chamada de Variante
A variação genética é um tipo de variação que pode ser herdada pela descendência, causada por alterações no material genético de um organismo. É esta variação que faz com que os organismos apresentem diversidade genética em diferentes níveis. A diversidade genética é a base material para a sobrevivência e desenvolvimento da sociedade humana e das plantas. Existem muitos tipos de variação genética, desde inversões cromossómicas visíveis ao microscópio até mutações de nucleotídeo único. Com o desenvolvimento da genómica, a informação sobre variação genética tornou-se mais abrangente e incluiu SNPmutações InDel, SV, CNV e transposon, et al.
A chamada de variantes refere-se ao uso de sequenciação de alto rendimento tecnologia para sequenciar e analisar as diferenças no genoma completo de um indivíduo ou população de uma espécie, para obter uma grande quantidade de informações sobre variação genética, como Polimorfismo de Nucleotídeo Único (SNP)Locais de inserção e deleção (InDel) e locais de variação estrutural (SV), variação no número de cópias (CNV) e outras informações. A chamada de variantes pode fornecer a base de dados mais básica e abrangente para o mapeamento funcional fino de genes subsequente e analisar rapidamente, com precisão e eficiência, as diferenças entre genomas, analisar cada base do genoma completo e obter os marcadores moleculares mais extensos.
Métodos para Detetar Variantes Estruturais
A deteção de variantes estruturais (SVs) é um aspecto essencial da investigação genómica. Várias metodologias foram desenvolvidas para realizar esta tarefa, cada uma com as suas forças e aplicações específicas:
- Método Read-Pair (RP)
O método Read-Pair envolve a análise de leituras de sequenciamento de extremidades emparelhadas para examinar as suas relações espaciais. As variantes estruturais são inferidas a partir de anomalias nos tamanhos de inserção esperados ou a partir de inconsistências na orientação das leituras emparelhadas. Desvios das distâncias ou orientações antecipadas sugerem a presença de variantes estruturais.
- Método de Leitura Dividida (SR)
O método Split-Read foca em instâncias onde um segmento de uma leitura se mapeia ao genoma de referência enquanto o seu contraparte não. Esta técnica é particularmente hábil em identificar inserções, deleções e outras alterações estruturais complexas dentro do genoma. O método destaca-se em localizar pontos de ruptura precisos de SVs.
- Método de Leitura em Profundidade (RD)
O método Read-Depth avalia a profundidade das leituras de sequenciamento mapeadas a regiões genómicas específicas para descobrir CNVs. Flutuações na profundidade das leituras podem significar aumentos ou diminuições no número de cópias genómicas, revelando assim CNVs. Este método é vantajoso para detectar duplicações ou deleções em larga escala.
- Método de Montagem (AS)
O método de montagem aproveita tecnologias de sequenciação de terceira geração, como PacBio SMRT ou Oxford Nanopore, em conjunto com abordagens de montagem de novo para identificar variantes estruturais extensas e intrincadas. Esta metodologia facilita a caracterização de alterações genómicas de longo alcance e complexas diretamente a partir de dados de sequenciação brutos, oferecendo uma visão abrangente das variantes estruturais.
Vantagens e Características da Chamada de Variantes
- Abundância: Análise aprofundada de todos os aspectos da variação genética, incluindo SNP, InDel, SV, SNV, gene novo, entre outros.
- Flexibilidade: com ou sem referência é adequado.
- Precisão: diferentes métodos de sequenciação podem ser aplicados com base em diferentes materiais.
Aplicações da Chamada de Variantes
- Pesquisa de Doenças: Descobrir variantes genéticas associadas a doenças lança luz sobre as suas bases genéticas e ajuda a identificar potenciais biomarcadores e alvos de tratamento.
- Medicina Personalizada: Os insights genéticos permitem planos de tratamento personalizados e uma melhor utilização de medicamentos ao identificar variantes que influenciam o metabolismo dos fármacos.
- Investigação Agrícola: Identificar variantes genéticas ligadas a características desejáveis ajuda no desenvolvimento de novas variedades e no aumento da produtividade na criação de plantas e animais.
Fluxo de Trabalho de Chamadas de Variantes

Especificações do Serviço
Requisitos de Amostra
|
|
Clique |
Estratégia de Sequenciamento
|
| Análise Bioinformática Fornecemos múltiplas análises de bioinformática personalizadas:
|
Pipeline de tecnologia de sequenciação
- Baseado em montagem do genoma completo
- Baseado em reessequenciamento do genoma completo
- Baseado em sequenciação de genoma de representação reduzida

Entregáveis
- Os dados de sequenciação originais
- Resultados experimentais
- Relatório de análise de dados
Referências
- Jansen S, Aigner B, Pausch H, et al. Avaliação da variação genómica numa população de gado através da re-sequenciação de animais-chave com cobertura baixa a média. BMC Genómica, 2013, 14(1): 1.
- Zheng L Y, Guo X S, He B, et al. Padrões genómicos de variação genética em sorgo doce e de grão (Sorghum bicolor). Biologia do Genoma, 2011, 12(11):287-302.
- Alkan C, Coe BP, Eichler EE. Descoberta e genotipagem de variação estrutural do genoma. Nature Reviews GeneticsMaio de 2011;12(5):363-76.
Os resultados parciais estão mostrados abaixo:

1. Que tipos de variantes genéticas podem ser detectadas?
As variantes genéticas podem ser amplamente classificadas em variantes de sequência, como SNPs e pequenas InDels, e variantes estruturais, incluindo grandes deleções, duplicações, inversões e translocações. As variações no número de cópias (CNVs) são um subtipo de variantes estruturais e também podem ser detectadas.
2. Como é que as tecnologias de sequenciação de leituras longas beneficiam a Chamada de Variantes?
Sequenciação de leitura longa tecnologias, como Sequenciação SMRT da PacBio e Oxford Sequenciação por nanoporo, oferecem vantagens como a deteção de variantes em regiões genómicas complexas que são desafiadoras para métodos de leitura curta. Proporcionam alta precisão, evitam viés de PCR e permitem a resolução do faseamento de variantes.
3. Qual é o fluxo de trabalho típico para a Chamada de Variantes na CD Genomics?
O fluxo de trabalho inclui processamento de dados e controlo de qualidade, mapeamento de leituras ao genoma de referência, realização de chamada de variantes, anotação de variantes e visualização dos resultados. Isto garante uma deteção abrangente e precisa de variantes genéticas.
Montagem do genoma do pak choi não cabeçudo e comparação com os genomas do repolho chinês cabeçudo e da mostarda amarela oleaginosa.
Jornal: Jornal de Biotecnologia Vegetal
Fator de impacto: 10,1
Publicado: 07 de dezembro de 2020
Fundo
As culturas de Brassica incluem espécies diploides e espécies amfidiploides. O genoma do pak choi, intimamente relacionado com a sarson amarela e o repolho chinês de cabeçote, foi montado usando Sequenciação de moléculas únicas PacBio e tecnologias Hi-C. Esta montagem identificou numerosas variantes genéticas, incluindo SNPs, indels e genes específicos de espécies, melhorando a nossa compreensão da diversidade das culturas de Brassica e da genética dos traços.
Materiais e Métodos
Preparação de Amostras
- Materiais vegetais
- Amostras de folhas
- Extração de DNA
Sequenciação
- Sequenciação do genoma
- Sequenciação SMRT da PacBio
- RNA-seq
- De novo assembleia
- Montagem e avaliação de cromossomas
- Análises do transcriptoma
- Repetir anotação
- Predição de genes
- anotação funcional
- Análise de variação estrutural
- Análise comparativa do genoma
Resultados
Numa publicação online de 2020 sobre "Couve"[1]Uma análise comparativa das variações entre três tipos de couve, incluindo Variações de Presença/Ausência (PAVs) entre genes, Variantes Estruturais (SV) dentro do genoma e Polimorfismos de Nucleotídeo Único (SNPs), revelou insights significativos. Especificamente, foram observadas diferenças em SV dentro de genes relacionados à forma das folhas (por exemplo, KAN da família de fatores de transcrição GARP) e os papéis inibitórios de genes relacionados à floração (por exemplo, MAF4, SVP) entre os três tipos morfológicos (conforme ilustrado na Figura 1, à esquerda). Estas descobertas têm uma importância crucial na compreensão dos mecanismos moleculares que governam a morfogénese dos órgãos e a floração, bem como nas melhorias genéticas, na couve e em culturas de vegetais relacionadas.
Figura 1: PAV e SVs Específicos no Genoma do Repolho[1]
Outros casos:
A Influência dos Variantes Estruturais (SVs) na Estrutura Gênica e na Expressão Gênica
Para validar a aplicabilidade da análise de SV e explorar a sua utilidade em estudos evolutivos populacionais, uma publicação online de 2020 sobre "Tomate".[2] realizaram uma investigação. Os investigadores obtiveram uma árvore evolutiva sistemática baseada em mais de 800 materiais com SNPs a partir de dados de sequenciação de leitura curta (Figura 2A). Subsequentemente, selecionaram um conjunto representativo de 100 materiais de 7 linhagens e coletaram dados de sequenciação de leitura longa para construir um diagrama de árvore baseado em dados de SV (Figura 2B).
Os resultados indicaram que os materiais selecionados estavam distribuídos dentro dos seus grupos taxonómicos conhecidos, alinhando-se com a classificação baseada em SNP. Isto demonstra a adequação dos SVs para a análise genética de populações.
Figura 2: Árvore Evolutiva Sistemática do Tomate[2]
Numa publicação online de 2020 sobre "Arroz"[3]Os investigadores construíram diagramas de estrutura populacional com base tanto em dados de SNP (Figura 3A) como em dados de SV (Figura 3B). A análise de SNP revelou a ampla divisão da população em aproximadamente seis grupos, com uma clara distinção entre as variedades de arroz japonica e indica. Curiosamente, a análise de SV produziu resultados altamente consistentes, apoiando ainda mais a diferenciação observada na análise de SNP.
Figura 3: Estrutura Genética do Arroz[3]
Espectro de Frequência de Mutação da População SV
Para investigar os impactos significativos de variantes deletérias, a publicação de 2020 sobre arroz[3] espectros de frequência calculados para locais não codificantes em diferentes grupos (Figura 4-A, B, C). Cada SFS inclui cinco tipos de SV (DUP, DEL, TRA, MEI e INV) e dois tipos de SNP (Syn, Nsyn) e revela três características notáveis:
Existem diferenças significativas entre vários grupos populacionais, consistentes com o aumento da deriva genética durante os gargalos de domesticação e as mudanças nos sistemas de acasalamento.
A proporção de SVs fixos é inferior à de SNPs sinónimos fixos e SNPs não sinónimos. Os SVs têm uma frequência mais baixa no genoma e são mais propensos a serem eliminados após mutação, indicando uma maior probabilidade de dano associado aos SVs.
Os eventos INV exibem o SFS mais extremo, com mais de 90% dos eventos INV identificados em três ou menos indivíduos em cada grupo, o que implica que os eventos INV podem estar sob forte seleção durante o processo evolutivo.
Os investigadores realizaram uma análise estatística das localizações de SVs e SNPs nos cromossomas, e os resultados dos testes indicam uma correlação significativa entre a diversidade de SVs e SNPs em janelas cromossómicas (Figura 4-D). Isto sugere que os SVs fornecem informação genética populacional que é fundamentalmente consistente com os SNPs.
Figura 4: Espectros de Frequência SV[3]
Análise de Desequilíbrio de Ligação com SVs
No estudo [do arroz][3]O LD (Desequilíbrio de Ligação) foi calculado para três grupos populacionais distintos utilizando dados de SNP, SV e SNP+SV. Devido aos seus efeitos potencialmente prejudiciais, os SVs frequentemente apresentam frequências populacionais mais baixas em comparação com os SNPs e podem experimentar uma degradação mais rápida do LD ao longo de distâncias físicas (Figura 5). Os dados de SNP mostraram que, dentro de aproximadamente 100 kb, o r2 para SNPs japonica permaneceu em torno de 0,2, enquanto para indica foi aproximadamente 0,1. Na mesma distância física, o r2 para rufipogon foi inferior a 0,05. No entanto, os valores de r2 para SVs foram inferiores aos dos SNPs em todos os grupos populacionais, com valores superiores a 0,1 apenas dentro de distâncias muito curtas (<15 kb).
Figura 5: Análise de Desequilíbrio de Ligação[3]
Estudo de Domesticação da População
Na pesquisa realizada sobre arroz[3]Uma avaliação das disparidades genómicas entre polimorfismos de nucleótido único (SNPs) e variantes estruturais (SVs) revelou uma distinção notável. O estudo observou que a estimativa média de FST para SNPs era significativamente mais alta em comparação com SVs. Esta descoberta indica que as SVs normalmente apresentam frequências populacionais mais baixas quando contrastadas com SNPs.
Ao integrar estes dados com genes de domesticação e melhoramento bem estabelecidos, a investigação reafirmou o substancial enriquecimento destes genes dentro dos intervalos FST de 1% e 10%. Consequentemente, isto forneceu informações valiosas sobre genes funcionais associados a processos fisiológicos, características morfológicas e qualidade alimentar (Figura 3).
Figura 6: Características SV Associadas à Domesticidade[3]
Análise de Associação de Genoma Inteiro
Na publicação de 2020 sobre [canola][4]Um GWAS (Estudo de Associação em Larga Escala do Genoma) foi realizado utilizando os PAVs identificados de oito variedades de colza. Esta análise revelou relações causais entre os PAVs e características como o comprimento da síliqua, o peso das sementes e o tempo de floração. Curiosamente, estas descobertas significativas foram ignoradas nos resultados do SNP-GWAS (Figura 7).
Da mesma forma, na publicação de 2021 sobre [pêssego][5]Foram observados SVs candidatos associados a características como amadurecimento precoce dos frutos, cor do pericarpo em torno do caroço, forma dos frutos e formação de forma achatada (Figura 8).
Figura 7: Resultados da Análise PAV_GWAS de Canola[4]
Figura 8: Resultados da Análise SV_GWAS do Pêssego[5]
Referências
- Li P, Su T, Zhao X, et al. Montagem do genoma do pak choi não cabeçudo e comparação com os genomas do repolho chinês cabeçudo e da mostarda amarela oleaginosa. Revista de Biotecnologia Vegetal, 2020.
- Alonge M, Wang X, Benoit M, et al. Impactos Maiores da Variação Estrutural Generalizada na Expressão Génica e na Melhoria de Culturas no Tomate. Célula, 2020.
- Yixuan K, Yi L, Tuomas T, et al. Genómica Evolutiva da Variação Estrutural na Domesticação do Arroz Asiático (Oryza sativa). Biologia Molecular e Evolução, 2020.
- Song J, Guan Z, Hu J, et al. Oito Genomas de Alta Qualidade Revelam a Arquitetura do Pan-genoma e a Diferenciação de Ecótipos de Brassica napus. Plantas da Natureza, 2020.
- Jiantao G, Yaoguang X, Yang Y, et al. Análises de variação da estrutura do genoma do pêssego revelam dinâmicas populacionais e uma inversão causal de 1,67 Mb para a forma do fruto. Biologia Genómica, 2021.
Aqui estão algumas publicações que foram publicadas com sucesso utilizando os nossos serviços ou outros serviços relacionados:
Coleção de dados genéticos em estudos baseados em etnias entre Aymaras, Quechuas e Mestizos: os desafios do estudo Genética do Alzheimer na População Peruana (GAPP)
Revista: Alzheimer e Demência
Ano: 2022
Avaliação de Biomarcadores Plasmáticos para a Classificação A/T/N da Doença de Alzheimer entre Adultos de Etnia Hispânica Caribenha
Revista: JAMA Network Open
Ano: 2023
Aumento da Produção de Esporos Fúngicos Patogénicos e Aerossóis Após a Exposição de uma Micobiota do Solo a Poluentes Hidrocarbonetos Aromáticos Clorados
Revista: Microbiology Spectrum
Ano: 2023
Uma Variante de Splicing no Gene SLC16A8 Leva a um Défice de Transporte de Lactato em Células Epiteliais Pigmentares da Retina Derivadas de Células iPS Humanas
Revista: Células
Ano: 2021
Ver mais artigos publicados pelos nossos clientes.